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月 与 

本 书面 向 操作 系统 基础 知识 薄弱 , 但 又 想 把 操作 系统 搞 清楚 、 喜 欢 刨 根 问 底 的 技术 人 , 在 此 向 你 们 致敬 ， 
本 书 用 议 谐 幽默 的 语言 ， 把 深奥 的 操作 系统 尽量 讲解 清楚 ， 读 者 在 轻松 阅读 中 就 学 通 了 深奥 的 知识 ， 是 一 本 
难得 的 好 书 。 

多 数学 习 操 作 系 统 的 读者 都 会 有 这 样 的 感受 : 

(1)“ 太 难 了 ， 对 于 操作 系统 这 个 庞然大物 我 简直 无 从 下 手 ”; 

(2)“ 很 后 悔 选 了 这 门 课 ( 大 学 一 些 专 业 中 操作 系统 是 选修 课 )， 甚 至 不 想 学 习 计 算 机 了 ”; 

(3)“ 上 课 完 全 听 不 懂 ， 我 都 不 想 继续 听 下 去 了 ” 

(4)“ 即 使 实验 做 出 来 了 ， 由 于 只 是 完成 了 局 部 功能 ， 我 依然 不 明白 操作 系统 是 怎样 运行 起 来 的 ， 
至 不 知道 自己 在 做 什么 ” 

以 上 的 感受 我 都 有 过 ， 坦白 说 ， 这 门 课 并 不 是 很 难 ， 但 想 把 这 门 课 完 全 搞 明 白 真 不 容易 。 我 是 个 喜欢 
刨 根 问 底 的 人 ， 为 了 天 清 楚 这 背后 的 真相 ， 我 花 了 大 量 时 间 学 习 课程 之 外 的 内 容 ， 甚 至 付出 了 惨痛 的 代价 
一 一 大 学 中 第 一 次 考试 不 及 格 ， 操 作 系 统 这 门 课 我 是 第 二 次 才 考 过 的 。 这 确实 很 “讽刺 ”一 一 操作 系统 不 
及 格 的 人 在 写 操作 系统 书籍 ! 但 转念 一 想 ， 考 试 过 了 的 同学 并 不 代表 能 够 写 出 操作 系统 ， 因 为 试卷 上 并 不 
是 在 考 如 何 写 一 个 操作 系统 。 和 技术 能 力 相 比 ， 卷 面 成 绩 并 不 重要 。 















































想象 一 下 ， 如 果 是 爱 因 
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斯 坦 眼中 比较 容易 的 内 容 也 许 对 3 


























EE 知识 ， 我 们 会 觉得 





我 们 来 说 非常 深奥 ， 他 


























站， 这 就 是 基础 的 问题 了 。 








编 语言 的 基 











础 就 行 了 ， 涉 及 的 了 

















其 他 方面 的 知识 我 都 会 详细 























不 必 担心 看 不 懂 本 书 。 
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操作 系统 受 


轰 
才 变 得 游 才 有 余 。 
以 上 情况 对 我 们 学 习 操 作 系 统 来 说 也 同样 

叶 问 不 是 如 何 保存 CPU 
是 什么 ， 
诸如 此 类 的 疑问 需要 了 人 解 硬 件 原生 支持 的 运行 机 种 
竺 权 级 时 ， 会 
佳 护 。 我 们 想 知道 的 是 ， 硬 件 
制 于 硬件 的 支持 ， 很 大 程度 上 它 的 能 











车 感到 心 有 余 而 力 不 足 ， 本 




















的 上 下 文 数据 ， 而 是 
并且 这 是 如 何 做 到 的 。 
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自动 在 任务 状态 段 TSS 中 获得 0 特权 级 























员 根 本 不 知道 什么 是 离合 器 ， 或 者 不 知道 离 
见 ， 只 有 了 解 了 背后 的 原 到 


存在 ， 比 如 当 老 明 


此， 因为 很 多 
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在 背后 自动 完成 了 哪些 工作 ， 
































统 ， 不 仅 需 要 了 解 上 层 软 件 
在 微机 接口 电路 中 讲解 的 ， 而 绝 大 多 数 读者 在 学 习 
课程 时 才 用 到 它 ， 因 此 ， 本 书 内 容 

除 硬件 外 ， 本 书 还 把 操作 系统 中 
技术 ， 比 如 在 代码 中 实现 了 著名 的 生产 者 消费 者 问题 
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页 ， 还 有 进程 、 线 性 、 阻 











个 章节 的 代码 都 可 独立 运行 ， 方 便 调 
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学 习 操作 系统 





正 学 到 包含 在 操作 系统 中 的 实 实在 在 的 


























、 信号 量 、 
更 让 读者 有 成 就 感 的 是 
有 几 千 行 左 右 ， 极 大 地 减少 了 操作 系统 源码 阅读 的 工作 量 。 

















锁 、 文 件 系统 、 
， 我 们 最 终 





出 | 


作 系 统 还 是 比较 庞大 的 , 因此 , 大 部 分 介绍 操作 系统 原理 的 书 中 , 对 各 个 部 分 都 是 分 拆 出 来 介绍 的 ， 
我 们 学 习 操 作 系 统 时 犹如 盲人 摸 象 、 管 中 颖 豹 。 本 书 的 封面 是 一 个 完整 的 大 象 的 拼图 ， 就 像 封 面 展 
示 的 那样 ， 本 书 内 容 我 们 不 再 局 部 学 习 ， 而 是 把 所 有 局 部 还 原 成 一 个 整体 ， 做 出 一 个 真正 的 操作 系统 。 

为 了 让 读者 不 再 惧怕 操作 系统 ， 同 时 也 为 了 完成 我 自己 的 心愿 ， 我 辞职 专心 进行 本 书 的 编号， 在 此 期 
间 也 曾 拒绝 了 多 份 回报 丰厚 的 工作 , 现在 想 想 真是 疯狂 …… 苦 了 我 的 父母 和 女 朋 友 , 在 这 里 跟 你 们 说 声 抱 
歉 ， 你 们 “纵容 ”我 的 偏执 ， 真 心 不 容 易 ， 辛 苦 啦 ， 我 爱 你 们 ! 
感谢 我 在 北京 大 学 就 读 期 间 的 Linux 内 核 课 程 老师 (同时 也 是 我 的 研究 生 导 师 ) 荆 琦 教授 和 操作 系统 
课程 老师 陈 向 群 教授 , 很 荣幸 能 够 成 为 您 们 的 学 生 ， 时 至 今日 我 常常 回想 起 课堂 上 您 们 言传 身 教 并 为 我 解 
答 问题 的 身影 ， 您 们 渊博 的 知识 和 教学 上 严谨 的 态度 深 深 影响 了 我 ， 仅 以 此 书 向 我 这 两 位 恩师 致谢 。 

感谢 父母 给 予 我 的 理解 和 宽容 ， 以 后 我 一 定 加 倍 努 力 回 报 您 们 的 养育 之 恩 ! 

最 后 ， 感 谢 女 朋友 给 予 我 的 陪伴 和 照顾 ， 在 写 此 书 的 过 程 中 我 深 深 体会 到 : 爱 并 不 仅仅 体现 在 相信 对 
方 一 定 能 成 功 ， 更 多 是 体现 在 支持 对 方 去 做 想 做 的 事 ， 即 使 失败 了 也 不 会 嫌弃 。 尽 管 在 这 漫长 枯燥 的 19 
个 月 当中 ， 如 果 没 有 你 的 “ 啼 啼 明 明 ” 本 书 早 就 写 完了 ,但 恰恰 是 这 种 “ 啼 啼 嘱 明 ” 下 的 不 离 不 充 让 我 相 
信 这 世上 还 有 真爱 。 

我 爱 你 王 小 免 《对 我 女 朋 友 的 昵称 )， 本 书 是 我 送 给 你 的 礼物 。 

本 书 中 出 现 的 “兄弟 ”“ 大 伙 儿 ”同学 ”和 “咱们 ”的 称谓 ， 是 作者 为 了 活泼 写作 风格 故意 为 之 ， 别 
无 他 意 ， 在 此 说 明 一 下 。 本 书 读者 交流 QQ 群 为 : 148177180， 编 辑 联系 邮箱 : zhangtao@ptpress.com.cn。 
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正如 计算 机 中 数组 下 标 是 从 0 开始 的 ， 我 们 的 内 容 也 从 0 开 
只 是 尽量 )， 解 释 一 些 学 习 过 程 中 经 常 被 问 到 的 问 








是 0 基 





础 ， 而 且 还 














操作 系统 是 什么 


我 并 没有 给 你 








教科 书 上 对 操作 系统 








提供 


性 认识 ， 好 奇 心 强 的 读者 反而 会 产生 更 多 迷惑 。 为 了 说 清楚 问题 


让 我 们 


们 为 了 躲避 天 灾 、 
当时 所 有 人 都 在 做 这 
后 来 各 个 地 

















扯 点 远 








的 …… 在 盘古 开 天 之 际 ， 除 动物 以 外 ， 














一 些 你 可 能 正 


始 ， 


世界 上 内 














野兽 攻击 等 危险 , 开始 住 进 了 山洞 , 为 了 获取 食 4 
些 相 同 的 事 。 这 就 是 没有 组 织 的 人 类 类 
了 自己 权威 性 的 部 落 ， 



































又 有 





























大 部 分 人 不 需要 E 
以 过 来 交换 。 这 就 


























由 着 和 人 
办 事 ” 

















需要 的 工作 找 专 人 负责 ， 


性 工作 集中 化 ，i 


再 后 来 ， 部 落 之 间 为 了 通信 ， 
信和 越 来 越 频繁 了 ， 干 脆 搞 个 驿 
越 来 越 多 ， 衬 
， 人 们 的 生 老 病 刀 























己 打造 武器 了 。 后 来 嫌 打 猫 
是 把 大 家 的 重复 性 劳动 集 ! 



































部 落 都 专门 找 人 打造 武器 ， 
太 麻 烦 了 ,干脆 养 一 些 家 畜 好 了 ， 
到 了 一 起 ， 让 人 们 可 以 专注 于 
开始 有 信使 了 ， 这 是 最 原始 的 通信 方 


感到 迷惑 





于 
JM 


惑 的 问题 














的 定义 ， 因 为 解释 得 太 抽象 了 , 看 了 之 后 似乎 只 
， 让 我 给 您 举 个 例子 。 











有 土地 、 
斩 ，| 


荒草 、 


























谁 需 


尽量 做 到 低 基 
题 。 


j 石 头 和 树木 等 材料 打造 
社会 ， 所 有 人 都 在 重复 “ 造 轮子 ” 
要 武器 就 直接 申 i 





ES 

















直接 供给 
己 的 事 


是 获得 一 些 感 





石头 等 资源 。 人 
一 些 武器 。 


树木 、 























可 ， 
要 可 


请 领取 便 
结 人 们 ， 谁 需 








必 二 














月 。 

















式 。 到 


后 来 发 展 到 有 社 





























直接 写 信 ， 由 了 驿 








站 吧 ， 谁 需要 通信 ， 





站 代为 送 达 。 


















































E 都 要 到 那里 登记 申报 。 





上 会 组 织 需 要 了 解 到 底 有 多 少 人 ， 为 了 方便 人 


























口 管 大 与 理 

















已经 猜 出 我 所 说 的 了 ， 上 












































看 提 到 的 部 落 其 实 就 是 最 





原始 的 








大 家 不 用 重复 劳动 。 上 的 社 


还 有 了 自己 的 管理 策略 。 





而 以 









































jE 
当然 可 以 , 自 
担 不 担心 














用 的 例子 下 


己 制 造 武 器 完全 没有 问题 ， 
人 





> 








， 于 是 就 在 各 


操作 系统 和 


也 建 了 “户籍 











形 , 它 将 大 家 都 








会 组 织 其 实 就 是 代表 现代 操作 系统 ， 除 了 把 重复 


























体 一 下 ， 人 们 想 狩 猎 时 ， 可 不 可 以 





















































然 会 , 所 








的 资格 ， 给 不 给 还 是 要 看 人 家 部 落 的 意 














要 某 个 资源 时 ， 























直接 调 ) 1 





j 便 可 ， 不 用 















































用 户 进 程 ， 

直接 访问 硬件 
操作 系统 的 话 ， 
当 人 个 























] 户 进程 可 以 专注 于 自己 
资源 ， 比 如 


] 想 和 远方 的 朋 
己 经 给 提供 了 邮 
个 人 想 在 一 起 生活 ， 要 不 要 一 
组 织 为 了 方便 人 











但 部 落 既然 有 现成 的 武器 本 
以 部 落 不 允许 你 自己 制 
. 这 就 是 操作 系统 提供 给 用 户 进程 
的 事情 
的 工作 。 但 操作 系统 为 了 保护 计算 机 











' 先 打造 武器 ， 然 后 拿 着 








3 已 的 武器 去 狩 





























儿 
二 
日 











可 必 臣 


用 ， 


EE 费事 呢 。 


男 外 ， 





















































上 

















了 ， 














造 武 器 了 ， 人 们 上 
系统 调 
由 操作 系统 把 资源 获取 到 后 交 给 
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j 户 进程 需 



































， 当 







































































计 





法 运作 。 
时 ， 虽 然 可 以 徒步 走 到 亲朋 
己 再 大 老 远 跑 一 趟 呢 。 


算 机 将 会 次 疾 
友 说 话 


同和 电话 ， 何 必 上 E 
































好 友 身 边 再 对 
这 就 是 操作 系统 ( 社 


j 户 进程 将 操作 系统 所 占据 的 内 存 恶意 覆盖 了 ， 操 作 系统 也 就 不 复 存 在 了 ， 没 有 

















系统 不 被 损害 ， 不 多 











许 用 户 进程 





























表达 想 说 的 话 , 但 社会 组 织 





























一 定 先 结 
做 了 额外 约束 。 不 领证 




















口 管理 的 话 ， 至 少 神 




















LIH 











宏观 调 控 ? 


t 至 这 是 找到 你 家 人 的 一 种 方法 。 这 就 如 Linux 系统 中 的 内 存 管理 








山大 





Active， 哪 些 是 


内 存 吗 。 
以 上 说 的 社 


三 
会 影 





“ 脏 页 ” 不 记录 会 不 

















:会 组 织 和 人 们 之 间 的 关系 ， 正 是 操作 系统 和 用 














i 的 实践 中 我 们 将 实例 化 各 个 部 分 。 





结婚 呢 ? 完全 不 用 ， 领 不 领证 都 不 会 阻碍 人 们 
[会 组 织 无 法 预测 未 来 人 口 





会 组 纪 


内 ) 提供 的 资源 。 两 
在 一 起 生活 ， 但 是 社会 
数量 趋势 ， 无 法 做 


























响 程序 执行 ， 当 然 不 会 ， 记 录 这 些 状态 还 不 是 为 了 更 好 地 管理 


户 进程 的 关系 ， 和 希望 大 家 能 对 操作 系统 有 


， 分 别 要 记录 哪些 页 是 




















个 














你 想 研究 到 什么 程度 




















学 无 止境 ， 学 习 没 有 说 到 头 的 那天 。 学 习 到 任何 程度 都 是 存 有 疑惑 的 ， 就 像 中 学 和 大 学 都 讲 物理 ,但 





















































学 的 深度 不 一 样 ， 各 个 阶段 都 会 产生 疑问 。 我 们 只 是 基于 一 些 公认 的 知识 ， 使 其 作为 学 习 的 起 点 ， 并 以 此 

















展开 上 层 的 研究 。 























比如 我 对 太空 很 感 兴趣 ， 大伙 儿 都 知道 地 球 围绕 太阳 做 周期 性 公转 ,后 来 又 知道 电子 围绕 原子 核 来 做 






































周期 性 公转 运动 ， 这 和 地 球 绕 太 阳 公 转 的 行为 如 出 一 略 ， 甚 至 我 在 想 太 阳 是 不 是 相当 于 原子 核 ， 地 球 相当 



































于 一 个 电子 ,我 们 只 是 生活 在 一 个 电子 上 ……' 而 我 们 号 体 里 有 那么 多 的 原子 和 电子 ， 对 天 












































p 些 我 们 身体 中 更 




















为 细微 的 生物 来 说 ， 我 们 的 身体 是 不 是 一 个 宇宙 ， 无 尽 的 猜想 ， 无 尽 的 疑惑 。 想 法 虽然 有 些 蕊 诞 ， 但 基于 



























































现 有 科技 目前 谁 也 无 法 证 明 这 是 错 的 ， 而 且 近 期 已 有 科学 文献 证 明 人 的 大 脑 就 像 个 宇宙 。 












































们 认为 原子 是 不 可 再 分 的 ， 一 切 理论 研究 以 此 为 基础 展开 。 比 如 乘 
我 们 研究 3X4 等 于 多 少 ， 必 须要 承认 1+1 等 于 2， 并 认为 其 为 真理 ， 不 用 再 去 质疑 1+1 

































































如 果 无 止境 地 创 


根 问 底下 去 ， 虽 然 会 对 底层 科学 更 加 清晰 ， 但 这 对 上 层 知识 的 学 习 非 常 不 利 ， 从 而 我 们 需要 一 个 公设 ,我 








法 是 基于 加 法 的 ， 
为 什么 等 于 2 了 ， 





这 就 是 我 们 的 公设 ， 至 了 为 什么 141 等 于 2， 还 是 由 专门 研究 基础 和 学 的 学 者 们 去 探 取 。 
学 习 操作 系统 也 一 样 ， 不 必 纠 结 于 硬件 内 部 是 如 何 工 作 的 ,我 们 只 要 认为 给 硬件 一 个 输入 ， 硬 件 就 会 给 我 
一 个 输出 就 行 了 ， 因 为 即使 你 学 到 了 硬件 内 部 电子 电路 ， 随 着 你 不 断 进步 ， 钻 研 不 断 深入 ， 也 许 有 一 天 你 的 求 















































知 欲 到 了 物理 领域 ， 并 产生 了 物理 科学 方面 的 质疑 …… 这 让 我 想到 一 个 笑话 ， 某 人 准备 去 买 














自行 车 ， 结 果 被 销 





























售 人 员 不 断 田 说 ， 加 点 钱 就 能 买 摩托 啦 ， 等 决定 买 摩托 时 ， 销 售 人 员 又 说 既然 都 决定 买 摩托 














车 了 ,不 如 再 加 点 


























买 汽车 吧 ， 给 出 了 各 种 汽车 方面 的 优势 ， 欲 望 需求 不 断 升 级 ， 不 断 被 销售 劝说 ， 最 后 居然 花 了 几 百 万 元 买 车 ， 
最 后 才 想 起 自己 是 来 买 自行 车 的 ， 甚 至 他 还 没有 驾照 …… i 咱们 赶紧 就 此 打住 ， 我 们 是 来 学 操作 系统 的 。 

























































































你 想 学 到 哪个 程度 呢 ， 你 的 公设 是 什么 ， 要 不 咀 们 还 是 走 一 步 说 一 步 吧 。 


写 操作 系统 ， 哪 些 需要 我 来 做 





















































首先 应 该 明确 ， 在 计算 机 中 有 分 层 的 概念 ， 也 就 是 说 ,计算 机 是 一 个 大 的 组 合 物 ， 由 各 个 部 分 组 合成 


一 个 系统 。 每 个 部 分 就 是 一 层 功能 模块 ， 各 司 其 职 ， 它 只 完成 一 定 的 工作 ， 并 将 自己 的 工作 结果 (也 就 是 




















输出 ) 交 给 下 一 层 的 模块 ， 这 里 的 模块 指 的 是 各 种 外 设 、 硬 件 。 












































这 样 ， 各 种 工作 成 果 不 断 累加 ， 通 过 这 种 流水 线 式 的 上 下 游 协 作 ， 便 实现 了 所 谓 的 系统 。 可 见 ， 系 统 

















就 是 各 种 功能 组 合 到 一 起 后 ， 产 生 最 终 输 出 的 组 合 物 。 就 像 人 的 身体 ， 骨 负责 搅拌 食物 ， 



































魔 后 交 给 小 肠 ， 因 为 小 肠 只 能 处 理 流 食 ， 所 以 上 游 的 输出 一 定 要 适合 作为 下 游 的 输入 ， 是 不 是 有 点 类 似 管 























将 这 些 食物 变 食 









































道 操作 了 ， 哈 哈 ， 分 工 协作 是 大 自然 的 安排 ， 并 不 是 只 有 计算 机 世界 才 有 。 我 们 人 类 的 思想 是 大 自然 安排 























好 的 ， 所 以 人 类 创造 的 事物 也 是 符合 大 自然 规律 的 。 




































































像 用 Maya 造 一 个 人 体 模型 出 来 ， 首 先 我 得 知道 Maya 这 个 软件 提供 曲线 曲面 名利 





















































好 ， 赶 紧 回 到 正题 ， 操 作 系统 是 管理 资源 的 软件 ， 操 作 系 统 能 做 什么 ， 取 决 于 主机 上 硬件 的 功能 。 就 
建 模 方法 才 行 ， 换 句 话 





说 ， 对 于 人 体 建 模 ， 你 不 可 能 会 想到 用 QQ， 因 为 它 不 是 干 这 个 的 。 我 想 说 的 是 硬件 不 支持 的 话 ， 操 作 系 




























































































他 人 啊 。 是 啊 ， 操 作 系统 毕竟 是 软件 ， 而 软件 的 还 辑 是 需要 作用 在 硬件 上 才能 体现 出 ; 
所 以 说 ， 写 操作 系统 需要 了 解 硬件 ， 这 些 硬 件 提供 了 软件 方面 的 接口 ， 这 样 我 们 的 操作 系 






































统 也 没 招 …… 操 作 系 统一 直 是 所 请 的 底层 ， 拥 有 至 高 无 上 的 控制 权 , 一 副 牛 气 艇 艇 的 样子 ， 


原来 也 要 依仗 
的 。 
统 通 过 软件 (计算 
























































机 指令 ) 就 能 够 控制 硬件 ,我 们 需要 做 的 就 是 知道 如 何 通 过 计算 机 指令 来 控制 硬件 , 参考 硬件 手 














FE 册 这 下 少不了 啦 。 





软件 是 如 何 访问 硬件 的 




















硬件 是 各 种 各 样 的 ， 发 展 速度 还 是 非常 快 的 。 各 个 硬件 都 有 自己 的 个 性 ， 操 作 系统 不 可 能 及 时 更 新 各 

















种 硬件 的 驱动 方法 吧 。 比 如 ， 刚 出 来 某 个 新 硬件 ，OS 开发 者 们 便 开 始 为 其 写 驱 动 ， 这 不 太 现 实 ， 会 把 人 
累 死 的 。 于 是 乎 ， 便 出 现 了 各 种 硬件 适 配 设备 ， 这 就 是 IO 接口 。 接 口 其 实 就 是 标准 ， 大 家 生产 出 来 的 硬 
件 按照 这 个 标准 工作 就 实现 了 通用 。 

硬件 在 输入 输出 上 大 体 分 为 串 行 和 并 行 ， 相 应 的 接口 也 就 是 串 行 接口 和 并 行 接 a 
接口 与 CPU 通信 ， 反 过 来 也 是 ，CPU 通过 串 行 接口 与 串 行 设备 数据 传输 。 并 行 设 备 的 访问 类 似 ， 只 不 
是 通过 并 行 接口 进行 的 。 

访问 外 部 硬件 有 两 个 方式 。 

(1) 将 某 个 外 设 的 内 存 映 射 到 一 定 范围 的 地 址 空间 中 ，CPU 通过 地 址 总 线 访问 该 内 存 区 域 时 会 落 到 外 设 
的 内 存 中 ， 这 种 映射 让 CPU 访问 外 设 的 内 存 就 如 同 访问 主板 上 的 物理 内 存 一 样 。 有 的 设备 是 这 样 做 的 ， 比 如 
显卡 ， 显 卡 是 显示 器 的 适配器 ，CPU 不 直接 和 显示 器 交互 ， 它 只 和 显卡 通信 。 显 卡 上 有 片 内 存 叫 显存 ， 它 被 
映射 到 主机 物理 内 存 上 的 低 端 1MB 的 0xB8000~0xBFFFF。CPU 访问 这 片 内 存 就 是 访问 显存 ， 往 这 片 内 存 上 
写字 节 便 是 往 屏幕 上 打印 内 容 。 看 上 去 这 么 高 大 上 的 做 法 是 怎么 实现 的 ， 这 个 我 们 就 不 关心 了 ， 前 面 说 过 , 计 
算 机 中 处 处 是 分 层 ， _ 我们 要 充分 相信 上 一 层 的 工作 。 

(2) 外 设 是 通过 IO 接口 与 CPU 通信 的 ，CPU 访问 外 设 ， 就 是 访问 IO 接口 ， 由 IO 接口 将 信息 传递 
给 另 一 端的 外 设 ， 也 就 是 说 ，CPU 从 来 不 知道 有 这 些 设备 的 存在 ， 它 只 知道 自己 操作 的 IO 接口 ， 你 看 ， 
处 处 体现 着 分 层 。 

于 是 问题 来 了 ， 如 何 访问 到 IO 接口 呢 ， 答 案 就 是 IO 接口 上 面 有 一 些 寄存 器 ， 访 问 IO 接口 本 质 上 就 是 
访问 这 些 寄存 器 ， 这 些 寄存 器 就 是 人 们 和 常 说 的 端口 。 这 些 端口 是 人 家 IO 接口 给 咱们 提供 的 接口 。 人 家 接口 
有 路 也 有 自己 的 思维 (系统 )， 看 到 寄存 器 中 写 了 什么 就 做 出 相应 的 反应 。 接 口 提供 接口 ， 哈 喻 ， 有 意思 。 
不 过 这 是 人 家 的 约定 ， 没 有 约定 就 想 了 ， 各 干 各 的 ， 大 家 都 累 ， 咱 们 只 要 遵循 人 家 的 规定 就 能 访问 成 功 。 


应 用 程序 是 什么 ， 和 操作 系统 是 如 何 配合 到 一 起 的 


应 用 程序 是 软件 《似乎 是 废话 ， 别 急 ， 往 后 看 )， 操 作 系统 也 是 软件 。CPU 会 将 它们 一 视 同 仁 ， 甚 至 ， 
CPU 不 知道 自己 在 执行 的 程序 是 操作 系统 ， 还 是 一 般 应 用 软件 ，CPU 只 知道 去 cs: ip 寄存 器 中 指向 的 内 
存 取 指 令 并 执行 ， 它 不 知道 什么 是 操作 系统 ， 也 无 需 知道 。 

操作 系统 是 人 想 出 来 的 ， 为 了 让 自己 管理 计算 机 方便 而 创造 出 来 的 一 套 管理 办 法 。 

应 用 程序 要 用 某 种 语言 编写 ， 而 语言 又 是 编译 器 来 提供 的 。 其 实 根本 就 没有 什么 语言 ， 有 的 只 是 编译 
#。 是 编译 器 决定 怎样 解释 某 种 关键 字 及 某 种 语法 。 语言 只 是 编译 器 和 大 家 的 约定 , 只 要 写 入 这 样 的 代码 ， 
编译 器 便 将 其 翻译 成 某 种 机 器 指令 ， 翻 译 成 什么 样 取 雇 于 编译 器 的 行为 ， 和 语言 无 关 ， 比 如 说 C 语言 的 
printf 函数 ， 它 的 功能 不 是 说 一 定 要 把 字符 打印 到 屏幕 上 ， 这 要 看 编译 器 对 这 种 关键 字 的 处 理 。 
编译 器 提供 了 一 套 库 函 数 ， 库 函数 中 又 有 封装 的 系统 调用 ， 这 样 的 代码 集合 称 之 为 运行 库 。C 语言 的 

运行 库 称 为 C 运行 库 ， 就 是 所 谓 的 CRT (C Runtime Library )。 

应 用 程序 加 上 操作 系统 提供 功能 才 算 是 完整 的 程序 。 由 于 有 了 操作 系统 的 支持 , 一些 现成 的 东西 已 经 摆 
在 那 了 ,但 这 些 是 属于 操作 系统 的 ， 不 是 应 用 程序 的 ， 所 以 咱们 平时 所 写 的 应 用 程序 只 是 半成品 ， 需 要 调用 
操作 系统 提供 好 的 函数 才能 完整 地 做 成 一 件 事 ， 而 这 个 函数 便 是 系统 调用 。 

用 户 态 与 内 核 态 是 对 CPU 来 讲 的 ， 是 指 CPU 运行 在 用 户 态 (特权 3 级 ) 还 是 内 核 态 特权 0 级 )， 
很 多 人 误 以 为 是 对 用 户 进 程 来 讲 的 。 

用 户 进程 陷入 内 核 态 是 指 : 由 于 内 部 或 外 部 中 断 发 生 ， 当 前 进程 被 暂时 终止 执行 ， 其 上 下 文 被 内 核 的 
中 断 程序 保存 起 来 后 ， 开 始 执行 一 段 内 核 的 代码 。 是 内 核 的 代码 ， 不 是 用 户 程序 在 内 核 的 代码 ， 用 户 代 码 
怎么 可 能 在 内 核 中 存在 ， 所 以 “用 户 态 与 内 核 态 ”是 对 CPU 来 说 的 。 

当 应 用 程序 陷入 内 核 后 ， 它 自己 已 经 下 CPU 了 ， 以 后 发 生 的 事 ， 应 用 程序 完全 不 知道 ， 它 的 上 下 文 环境 已 
经 被 保存 到 自己 的 0 特权 级 栈 中 了 ， 那 时 在 CPU 上 运行 的 程序 已 经 是 内 核 程 序 了 。 所 以 要 清楚 ， 内 核 代码 并 不 
是 成 了 应 用 程序 的 内 核 化 身 ， 操 作 系 统 是 独立 的 部 分 ， 用 户 进程 永远 不 会 因为 进入 内 核 态 而 变 身 为 操作 系统 了 。 
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应 用 程序 是 通过 系统 调用 来 和 操作 系统 








Ea| 


写 什 么 系统 i 


| 








用 的 代码 啊 。 这 是 因为 你 用 到 的 标准 








配合 完成 某 项 功能 的 ， 有 人 可 


台 马 
能 会 





























库 帮 你 完成 了 这 些 事 ， 库 ， 











提 作 






































好 了 系统 调用 ， 你 需要 跟 下 代码 才 会 看 到 。 


Pik 





























说 ， 直 接 符 入 汇编 代码 “int 0x80” 便 可 以 直接 执行 系统 调 ) 


















































台 已 吕 


能 号 用 寄存 器 eax 存储 。 
会 不 会 有 人 又 问 ， 编 


子 功 






































统 版 本 ,编译 器 在 设计 时 也 要 知道 自 


统 都 有 自己 












































的 系统 调用 号 ， 编 译 器 三 商 在 代码 中 已 


己 将 来 运行 在 哪个 系统 












































经 把 宿主 系统 的 系统 





为 什么 称 为 “陷入 ” 





内 核 


前 面 提 到 了 用 户 进程 陷入 内 核 ， 这 个 好 解释 ， 如 果 把 软件 分 层 的 话 ， 
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到 











是 应 用 程序 ， 里 | 


尺 用 程序 处 于 特权 级 3， 操 作 系统 
访问 系统 资源 时 (无 论 是 硬件 ， 还 是 内 











7 
世 | 


外 



































而 是 操作 系统 ， 如 图 0-1 所 示 。 
内 核 处 于 特权 级 0。 当 用 户 程 序 欲 


核 数据 结构 )， 它 需要 进行 系统 调 








用 。 这样 CPU 便 进 入 了 内 核 态 ， 也 称 管 态 。 看 图 中 凸 下 去 的 部 分 ， 是 不 











是 有 陷 进 去 的 感觉 ， 这 就 是 “陷入 内 核 ”。 


内 存 访问 为 什么 要 分 段 










































































































































































其 实 也 可 以 跨 过 标准 库 直 接 执行 系统 i 
j， 当 然 要 提前 设置 好 系统 




































































用 户 














Pp 





问 : 我 写 应 用 程序 时 从 来 没 
的 函数 其 实 都 已 经 封装 
周 用 ， 对 于 Linux 系统 来 
































j 子 功能 号 ， 该 





图 
| 





译 器 怎么 知道 系统 调用 接口 是 什么 哈哈， 您 想 啊 ， 下 载 编译 器 时 ， 是 不 是 要 选择 系 
F 台 上 ， 所 以 这 都 是 和 系统 绑 定好 的 ， 各 个 操作 系 
周 用 号 写 死 了 ， 没 什么 神奇 的 。 


程序 特权 级 3 


0-1 ”陷入 内 核 



































































































































































































































































































































按理 说 咱们 应 该 先 看 看 段 是 什么 ， 不 过 了 解 段 是 什么 之 前 ， 先 看 看 内 存 是 什么 样子 ， 如 图 0-2 所 示 。 

内 存 按 访 问 方式 来 看 ， 其 结构 就 如 同上 面 的 长 方形 带子 ， 地 址 依次 升 高 。 为 了 解释 问题 更 明白 ， 我 们 
假设 还 在 实 模式 下 ， 如 果 读 者 不 清楚 什么 是 实 模式 也 不 要 紧 ， 这 并 不 影响 理解 段 是 内 存 高 地 址 
什么 ， 故 暂且 先 忽 略 。 站 | 

内 存 是 随机 读 写 设备 ， 即 访问 其 内 部 任何 一 处 ， 不 需要 从 头 开始 找 ， 只 要 直接 | 加 
给 出 其 地 址 便 可 。 如 访问 内 存 0xC00， 只 要 将 此 地 址 写 入 地 址 总 线 便 可 。 问 题 来 了 ， 

分 段 是 内 存 访问 机 制 ， 是 给 CPU 用 的 访问 内 存 的 方式 ， 只 有 CPU 才 关注 段 ， 那 为 Re0s 
什么 CPU 要 用 段 呢 ， 也 就 是 为 什么 CPU 非得 将 内 存 分 成 一 段 一 段 的 才能 访问 呢 ? 0OxC04 

说 来 话 长 , 现实 行业 中 有 很 多 问题 都 是 历史 遗留 问题 , 计算 机 行业 也 不 能 例外 。 OxC03 
分 段 是 从 CPU 8086 开始 的 ， 限 于 技术 和 经 济 ， 那 时 候 电 脑 还 是 非常 昂贵 的 东西 ， 0xC02 
所 以 CPU 和 寄存 器 等 宽度 都 是 16 位 的 ， 并 不 是 像 今天 这 样 寄存 器 已 经 扩展 到 64 0OxC01 
位 ， 当 然 编译 器 用 的 最 多 的 还 是 32 位 。16 位 寄存 器 意味 着 其 可 存储 的 数字 范围 是 OxC00 
2 的 16 次 方 ， 即 65536 字 节 ，64KB 。 那 时 的 计算 机 没有 虚拟 地 址 之 说 ， 只 有 物理 。 “图 0-2 内 存 示例 
地 址 ， 访 问 任 何 存储 单元 都 直接 给 出 物理 地 址 。 

编译 器 在 编译 程序 时 ， 肯 定 要 根据 CPU 访问 内 存 的 规则 将 代码 编译 成 机 器 指令 ， 这 样 编译 出 来 的 程序 才能 
在 该 CPU 上 运行 无 误 ， 所 以 说 ， 在 直接 以 绝对 物理 地 址 访问 内 存 的 CPU 上 运行 程序 ， 该 程序 中 指令 的 地 址 也 必 
须 得 是 绝对 物理 地 址 。 总 之 ， 要 想 在 该 硬件 上 运行 ， 就 要 遵从 该 硬件 的 规则 ， 操 作 系统 和 编译 器 也 无 一 例外 。 

若 加 载 程序 运行 ， 不 管 其 是 内 核 程 序 ， 还 是 用 户 程序 ， 程 序 中 的 地 址 若 都 是 绝对 物理 地 址 ， 那 该 程序 必须 放 
在 内 存 中 国定 的 地 方 ， 于 是 ， 两 个 编译 出 来 地 址 相同 的 用 户 程序 还 真 没 法 同时 运行 ， 只 能 运行 一 个 。 于 是 伟大 的 

















计算 机 前 非 们 用 分 段 的 方式 解决 了 这 一 问题 ， 


村 



































让 CPU 采 /) 


的 好 处 是 程序 可 以 重 定位 了 ， 尽 管 程序 指令 中 给 的 是 绝对 4 

















什么 是 重 定位 呢 ， 简 单 来 说 就 是 将 程 请 


























3“ 段 基 址 + 段 内 偏 移 地 址 ”的 方式 来 访问 任意 内 存 。 这 











多 理 地 址 ， 








但 终究 可 以 同时 运行 多 个 程序 了 。 
指令 的 地 址 改写 成 另外 一 个 地 址 , 但 该 地 址 处 的 内 容 还 是 原 





地 址 处 的 内 容 。 
CPU 采用 “ 段 基 址 + 段 内 偏 移 地 址 ”的 形式 访问 内 存 ， 就 需要 专门 提供 段 基 址 寄存 器 ， 这 些 是 cs、ds、 
es 等 。 程 序 中 需要 用 到 哪 块 内 存 ， 只 要 先 加 载 合适 的 段 到 段 基 址 寄存 器 中 ， 再 给 出 相对 于 该 段 基 址 的 偏 移 
地 址 便 可 ，CPU 中 的 地 址 单元 会 将 这 两 个 地 址 相 加 后 的 结果 用 于 内 存 访问 ， 送 上 地 址 总 线 。 
注意 ， 很 多 读者 都 觉得 段 基 址 一 定 得 是 65536 的 倍数 〈16 位 段 基 址 寄存 器 的 容量 )， 这 个 真 的 不 用 ， 
段 基 址 可 以 是 任意 的 。 这 就 是 段 可 以 重 又 的 原因 。 
举 个 例子 ， 看 图 0-2， 假 设 段 基 址 为 0xC00， 要 想 访问 物理 内 存 0xC01， 就 要 将 用 0xC00: 0x01 的 方 
式 来 访问 才 行 。 若 将 段 基 址 改 为 0xc01， 还 是 访问 0xC01， 就 要 用 0xC01: 0x00 的 方式 来 访问 。 同 样 ， 若 
想 访问 物理 内 存 0xC04， 段 基 址 和 有 段 内 偏 移 的 组 合 可 以 是 : 0xC01: 0x03、0xC02: 0x02、0xC00: 0xC04 
等 ， 总 之 要 想 访 问 某 个 物理 地 址 ， 只 要 凌 出 合适 的 段 基 地 址 和 段 内 偏 移 地 址 ， 其 和 为 该 物理 地 址 就 行 了 。 
这 时 估计 有 人 会 问 这 样 行 不 行 ，0xC05: -1， 能 这 样 提问 的 同学 都 是 求知 欲 极 强 的 ， 可 以 自己 试 一 下 。 
说 了 这 么 多 ,我 想 告诉 你 的 是 只 要 程序 分 了 段 ， 把 整个 段 平 移 到 任何 位 置 后 ， 段 内 的 地 址 相对 于 段 基 
址 是 不 变 的 ， 无 论 段 基 址 是 多 少 ， 只 要 给 出 段 内 偏 移 地 址 ，CPU 就 能 访问 到 正确 的 指令 。 于 是 加 载 用 户 
程序 时 ， 只 要 将 整个 段 的 内 容 复制 到 新 的 位 置 ， 再 将 段 基 址 寄存 器 中 的 地 址 改 成 该 地 址 ， 程 序 便 可 准确 无 
误 地 运行 ， 因 为 程序 中 用 的 是 段 内 偏 移 地 址 ， 相 对 于 新 的 段 基 址 ， 内存 段 重 定位 演示 
该 偏 移 地 址 处 的 内 存 内 容 还 是 一 样 的 ， 如 图 0-3 所 示 。 | 
所 以 说 ， 程 序 分 段 首先 是 为 了 重 定位 ， 我 说 的 是 首先 ， 下 面 
还 有 其 他 理由 呢 。 | 此 处 内 容 为 字符 D | 偏 移 地 址 为 0xb00 


偏 移 地 址 也 要 存 入 寄存 器 ， 而 那 时 的 寄存 器 是 16 位 的 ， 也 就 | 
将 段 A 移 动 


是 一 个 段 最 多 可 以 访问 到 64KB 。 而 那 时 的 内 存 再 小 也 有 1MB， 




































































































































































































































































































































































































































































































































































段 A 新 的 段 基 址 0x6000 




















改变 段 基 址 ， 由 一 个 段 变 为 另 一 个 段 ， 就 像 一 个 段 在 内 存 中 球 移 ， 

采用 这 种 在 内 存 中 来 回 挪 位 置 的 方式 可 以 访问 到 任意 内 存 位 置 。 
所 以 说 ， 程 序 分 段 又 是 为 了 将 大 内 存 分 成 可 以 访问 的 小 段 ， 
通过 这 样 变 通 的 方法 便 能 够 访问 到 所 有 内 存 了 。 | 

晶 想 一 想 ，1M 是 2 的 20 次 方 ，1MB 内 存 需 要 20 位 的 地 址 | ”| 

才能 访问 到 ， 如 何 做 到 用 16 位 寄存 器 访问 20 位 地 址 空间 呢 ? 4 图 0-3” 段 的 重 定位 
在 8086 的 寻 址 方式 中 ， 有 基 址 寻 址 ， 这 是 用 基 址 寄存 器 bx 或 bp 来 提供 偏 移 地 址 的 ， 如 “mov [bx]， 
0x5; ”指令 便 是 将 立即 数 0x5 存 入 ds: bx 指向 的 内 存 。 

大 家 看 ，bx 寄存 器 是 16 位 的 ， 它 最 大 只 能 表示 0~0xFFEF 的 地 址 空间 ， 即 64KB， 也 就 是 单一 的 一 个 寄存 
器 无 法 表示 20 位 的 地 址 空间 一 一 1MB 。 也 许 有 人 会 说 ， 段 基 址 和 段 内 偏 移 地 址 都 搞 到 最 大 ， 都 为 0xXFFFF， 对 
不 起 ， 即 使 不 溢出 的 话 ， 其 结果 也 只 是 由 16 位 变 成 了 17 位 ， 即 两 个 n 位 的 数字 无 论 多 大 ， 其 相 加 的 结果 也 超 不 
过 n+l 位 ， 因 为 即使 是 两 个 相同 的 数 相 加 ， 其 结果 相当 于 乘 以 2， 也 就 是 左 移 一 位 而 已 ， 依 然 无 法 访问 20 位 的 
地 址 空间 。 也 许 读者 又 有 好 建议 了 : CPU 的 寻 址 方式 又 不 是 仅仅 这 一 种 ， 上 面 的 限制 是 因为 寄存 器 是 16 位 ， 只 
要 不 全 部 通过 寄存 器 不 就 行 了 吗 。 既 然 段 寄存 器 必须 得 用 ， 那 就 在 偏 移 地 址 上 下 功夫 , 不 要 把 偏 移 地 址 写 在 寄存 
器 里 了 ， 把 它 直 接 写 成 20 位 立即 数 不 就 行 啦 。 例 如 mov ax，[0x12345]， 这 样 最 终 的 地 址 是 ds+0x12345， 肯 定 
是 20 位 ， 解 决 啦 。 不 错 ， 这 种 是 直接 寻 址 方式 ， 至 少 道理 上 讲 得 通 ， 这 是 通过 编程 技巧 来 突破 这 一 瓶颈 的 ， 能 
想到 这 一 点 我 觉得 非常 nice。 但 是 作为 一 个 严谨 的 CPU， 既 然 宣称 支持 了 通过 寄存 器 来 寻 址 ， 那 就 要 能 够 自 圆 
其 说 才 行 ， 不 能 靠 程 序 员 的 软 实力 来 克服 CPU 自身 的 缺陷 。 于 是 ， 一 个 大 胆 的 想法 出 现 了 。 

16 位 的 寄存 器 最 多 访问 到 64KB 大 小 的 内 存 。 虽 然 1MB 内 存 中 可 容纳 1MB/64KB=16 个 最 大 段 ， 但 
这 只 是 可 以 容纳 而 已 , 并 不 是 说 可 以 访问 到 。16 位 的 寄存 器 超过 0xffff 后 将 会 回 卷 到 0, 又 从 0 重新 开始 。 
20 位 宽度 的 内 存 地址 空间 必然 只 能 由 20 位 宽度 的 地 址 来 访问 。 问 题 又 来 了 ， 在 当时 只 有 16 位 寄存 器 的 
情况 下 是 如 何 做 到 访问 20 位 地 址 空间 的 呢 ? 
这 是 因为 CPU 设计 者 在 地 址 处 理 单元 中 动 了 手脚 ， 该 地 址 部 件 接 到 “ 段 基 址 + 段 内 偏 移 地 址 ”的 地 址 后 
自动 将 段 基 址 乘 以 16， 即 左 移 了 4 位 ， 然 后 再 和 16 位 的 段 内 偏 移 地 址 相 加 ， 这 下 地 址 变 成 了 20 位 了 吧 ， 行 
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将 整个 段 A 重 定位 到 新 地 址 
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偏 移 地 址 为 0xb00 























段 A 原 始 段 基 址 0x1000 



















































































































































































































































































































































































































































































































































































啦 ， 





5 
段 是 一 回 事 吗 


首先 ， 
全 可 以 将 很 多 菜 和 米饭 混合 在 一 起 ， 

















程序 不 是 一 定 要 分 段 才能 运行 的 ， 分 段 





有 了 20 位 的 地 址 便 可 以 访问 20 位 的 空间 ， 可 以 在 1MB 空间 内 自 

















只 





或 者 搅拌 成 一 





好 多 小 格子 ， 方 便 将 不 同 的 菜 和 人 饭 区 

x86 平台 的 处 理 器 是 必须 要 
问 的 内 存 段 起 始 地 二 
供 的 关键 字 有 所 区 别 ， 功 
器 要 用 硬件 




























































































分 段 机 人 


能 是 一 样 的 ) 和 内 存 访问 机 制 
段 寄 存 器 ， 指 向 软件 一 一 


分 存放 ， 这 样 














口 


E 厅 

















尺码 中 用 





是 为 了 使 
体 ， 哈 哈 ， 但 这 样 
会 让 我 们 骨 
曾 访 问 内 存 的 ， 正 因为 如 此 ， 处 理 


中 的 段 本 质 上 是 一 回 事 。 
section 或 segment 以 软件 形式 所 定义 的 内 存 段 。 

















程序 更 力 


可 
































[优美 。 就 像 
能 就 没什么 胃 
口 大 开 增加 食欲 。 








A 









































代码 中 为 什么 分 为 代码 段 、 数 据 段 ? 这 和 内 存 访问 机 制 中 的 


饭盒 装 饭 妆 一 样 ， 完 


啦 。 如 果 饭 盒 中 有 














器 才 提 供 了 段 寄 存 器 ， 用 来 指定 待 访 
止 。 我 们 这 里 讨论 的 程序 代码 中 的 段 〈 用 section 或 segment 来 定义 的 段 ， 不 同 汇编 编译 器 提 

















在 硬件 的 内 存 访 问 机 制 











处 理 








» 








分 段 是 必然 的 ， 只 是 在 平坦 


程 ， 便 件 段 寄存 器 中 指向 的 内 存 段 大 
对 于 在 代码 中 的 分 段 ， 有 的 是 操 

















小 不 一 。 














作 系统 做 的 ， 有 的 是 程 ) 








加 这 
~ 


内 














模型 下 , 硬件 段 寄存 器 中 指向 的 内 存 段 为 最 大 的 4GB, 而 在 多 段 模式 下 编 








己 划 分 的 。 如 果 是 在 多 段 模型 下 编程 ， 


我 们 必然 会 在 源码 中 定义 多 个 段 ， 然 后 需要 不 断 地 切换 段 寄存 器 所 指向 的 段 ， 这 样 才能 访问 到 不 同 段 中 的 





数据 ， 所 以 说 ， 在 多 段 模型 下 的 程序 分 段 是 程序 员 人 为 划分 的 。 如 果 是 在 平坦 模型 
个 4GB 内 存 都 放 在 同一 个 段 中 ， 我 们 就 不 需要 来 





这 取决 于 操作 系统 是 否 在 平坦 模型 下 








口 











o 





一 般 的 高 级 语言 不 允许 程序 员 





























作 系统 编写 的 ， 该 操作 系统 采用 的 是 
1 于 处 理 器 文 持 了 有 具有 


Se 





















































分 成 代码 段 和 数据 段 ， 如 编译 器 gcc 会 








部 分 。 这 会 由 操作 系统 将 编译 器 编译 

















平坦 模型 











[HH 
LI 








用 高 级 语言 编码 来 说 ， 我 们 之 所 以 不 





关心 如 何 将 程 








| 
/ 

















拟 内 存 管理 





依赖 的 操作 系统 又 采用 了 虚 














程序 分 段 ， 能 够 灵活 地 编排 











这 


切换 段 寄 存 器 所 指 


己 将 代码 分 成 各 种 各 样 的 段 , 这 是 
4， 所 以 该 编译 器 要 编译 日 


， 即 处 理 器 的 分 页 机 








就 











属于 人 为 将 程序 分 成 段 了 ， 也 就 是 





口 











大 








分 页 机 制 的 虚拟 内 存 ， 操 作 系统 也 采用 了 分 页 模型 ， 因 此 名 
EC 语言 写 出 的 程序 划分 成 代码 段 、 数 
来 的 用 户 程序 中 的 各 个 段 分 配 到 不 同 的 物理 内 存 上 。 对 于 目 
序 分 段 ， 正 是 由 于 
上 编 这 种 低级 语言 允许 程序 员 为 自 





上 。 像 ? 





1 的 段 。 对 于 代码 ! 


为 其 所 


编译 器 按 平 坦 模 型 编 


本 


















































有 译 占 会 将 程序 按 


时 段 、 栈 段 、.bss 段 、 
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六 ， 

















前 程 ， 操 作 系 统 将 整 


是 否 要 分 段 ， 


j 的 编译 器 是 针对 某 个 操 
8 适合 此 操作 系统 加 载运 行 的 程序 。 





前 
而 程序 所 








内 容 划 


堆 等 
咱们 








己 的 








AZ 

















j 多 段 模型 编程 。 























这 么 说 似乎 不 是 很 清楚 ， ] 








Er 














级 高 的 芯片 ， 就 像 心脏 一 样 ， 





CPU 是 个 自动 化 程度 
想到 Intel 的 广告 词 : 


万 














然后 重复 
运行 到 世界 























的 尽头 ， 能 让 它 停 下 来 的 





给 你 一 颗 奔 腾 的 心 。 
只 要 给 出 CPU 第 一 个 指令 的 起 始 地 址 ，CPU 在 它 执 行 本 指令 的 同时 ， 它 会 自动 获取 下 一 条 的 地 址 ， 
上 述 过 程 ， 继 续 执行 ， 继 续 取 址 。 假 如 执行 的 每 条 指令 都 


唯一 条 件 就 是 断 电 。 


] 例 子 和 大 伙 儿 解释 就 明白 





a- 消 








FEF 这 之 疹 
给 它 一 个 初始 的 收缩 ， 


FE 确 ， 没 有 异常 发 和 





1， 先 和 大 家 明确 一 件 事 。 
它 将 永远 地 跳 下 去 。 




















突然 


的 话 ， 我 想 它 可 以 





它 为 什么 能 够 取得 下 一 条 指令 地 址 ? 也 就 是 说 为 什么 知道 下 一 条 指令 在 哪里 。 这 是 因为 程序 中 的 指令 



































都 是 挨 着 的 ， 彼 此 之 间 











也 址 是 按照 前 面 


空 际 ， 下 一 条 指令 的 + 
能 够 自动 获得 下 一 条 指令 的 原理 ， 


























ym 








无 空 阶 。 有 同学 可 能 会 问 , 程 
中 塞 了 好 多 0。 是 的 ， 对 齐 确实 是 让 程序 ! 


























由 令 的 尺寸 大 小 排 下 来 
将 当前 eip 中 的 地 址 加 J 











令 的 起 始 地 址 。 即 使 指令 问 有 空 隐 或 其 





他 非 指令 的 数据 , 这 也 








外 令 将 非 指令 部 分 跳 过 以 保持 指令 在 逻辑 











出 现 了 好 多 空隙 ， 但 这 些 空 隙 是 数据 
的 ， 这 就 是 mtel 处 
上 当前 指令 机 器 码 


仅仅 是 在 物理 












































的 大 小 





序 中 不 是 有 对 齐 这 回 事 吗 ? 为 了 对 齐 ， 编 译 器 在 程序 
闻 的 空隙 ， 指 令 间 不 存在 
里 器 的 程序 计数 器 cs: eip 
便 是 内 存 中 下 一 








条 指 

















上 将 其 断 开 了 ,依然 可 以 J 























上 连续 ， 我 们 在 后 




















为 了 让 程序 内 指令 接连 不 断 地 执行 ， 要 把 指令 全 音 
段 。 这 样 CPU 肯定 能 接连 不 断 地 执行 下 去 。 指 令 是 由 
运行 不 仅 要 有 操作 码 ， 也 得 有 操作 数 ， 操 作 数 就 是 指 程序 中 的 数 提 
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所 

















用 会 通过 实例 验证 
EF 在 一 起 ， 形 成 一 片 连 续 的 指令 区 域 , 这 就 是 代码 
操作 码 和 操作 数组 成 的 ， 这 对 于 数据 也 一 样 ， 
局 。 把 数据 连续 地 并 排 在 一 起 存储 形成 的 




















这 原 Oo 











4 jmp 











程序 








段落 ， 就 称 为 数据 段 。 
指令 大 小 是 由 实际 指令 的 操作 码 决定 的 ， 也 就 是 说 CPU 在 译 码 阶 段 拿 到 了 操作 码 后 ， 就 知道 实际 指令 所 占 
的 大 小 。 其 实说 来 说 去 ， 本 质 上 就 是 在 解释 地 址 是 怎么 来 的 。 这 部 分 在 第 3 章 中 的 “什么 是 地 址 ” 

















给 大 家 演示 个 小 例子 ， 代 码 没 有 实际 意义 ， 是 我 随 介 


label: 


Cn 心情 


就 这 9 个 字 节 的 内 容 ， 有 


过 本 书 。 


mOV 
ImOV 


jmp 
Var 


本 示例 一 





dsrax 
ax, [var] 


label 
dw Ox99 

















就 5 行 ， 简 单纯 粹 为 演示 。 


| 8E D8 Al 07 00 EB FE 99 00 


























没有 觉得 一 阵 晕 炫 。 如 果 没 有 










































































code seg.S 

















将 其 编译 为 二 进 制 


E 写 的 ， 只 是 为 方便 大 家 至 





























其 实 这 9 个 字 节 的 内 容 就 是 机 器 码 。 为 了 让 大 家 理解 得 更 ; 






































文件 ， 程 序 内 


E 解 指令 的 








也 址 ， 


sR 日 


谷 契 : 


节 中 有 详解 。 
代码 如 下 。 





测 读者 兄弟 的 技术 水 平 远 在 我 之 上 ， 请 略 








晰 ， 给 大 家 列 个 机 器 码 和 源码 对 照 表 ， 见 表 0-1。 

















表 0-1 机 器 码 和 源码 对 照 表 

地 址 机 器 码 源 码 
00000000 8ED8 mov ds, ax 
00000002 A10700 mov ax, [Ox7] 
00000005 EBFE jmp short Ox5 
00000007 

var dw Ox99 
00000008 


表 0-1 第 1 行 ， 地址 0 处 的 指 








小 是 2 字 节 。 


0+2=2。 在 第 2 
列 的 指令 是 “mov ax， 


所 以 第 3 条 指令 的 地 址 是 2+3=5。 后 面 的 指令 1 











全 ， 完 美展 示 了 程序 中 代码 紧凑 无 际 的 布局 。 
现在 大 伙 儿 明白 为 什么 CPU 能 源源 不 断 才 
其 次 是 通过 指令 机 器 码 能 够 判断 当前 指令 长 度 ， 当 前 指令 地 

















加 

















上 面 给 出 的 例子 ，3 
E 上 连续 。 所 以 ， 明 











一 定 得 是 物理 








工 jmp 








[0x7]”(0x7 是 变量 


肯 令 
用 说 过 ， 下 一 条 指令 的 地 址 是 按照 前 孟 
行 的 地 址 列 中 ， 地 址 确实 是 2。 这 不 是 我 故意 写 上 去 的 ， 编 
var 经 过 编译 后 的 地 址 )， 其 机 器 码 是 A10700, 这 是 3 字 节 大 小 。 
算 的 。 程 序 虽 然 很 短 ，{1 





























i 指令 的 





























是 “mov ds，ax”， 其 机 器 码 是 8ED8， 这 是 








尺寸 排 下 来 


的 ， 导 












































邮 址 也 是 这 样 反 






































其 指令 在 物理 
确 一 点 ， 


























着 指令 被 数据 “上 断 开 ”了 。 
比如 这 样 的 汇编 代码 : 


start 





只 要 程序 中 有 








; 跳 转 到 第 三 行 的 

















上 是 连续 的 ， 其 实在 CPU 


start， 这 是 CPU 











址 + 当前 
眼 里 ， 只 要 指令 逻辑 | 





取 到 指令 了 吧 ， 如 前 所 述 , 原因 
站 令 长 度 = 下 一 条 指令 地 址 。 
上 是 连续 的 就 可 以 ， 没 必要 











译 器 真 




















六 进 制 表 示 ， 可 见 其 大 
第 2 行 指 令 的 起 始 地 址 是 
的 就 是 这 样 编排 的 。 第 2 














日 肪 省 虽 小 ， 五 脏 俱 

















先是 指令 是 















































接 执 





















































行 的 指令 
























































2 var dd 1 ;定义 变量 var 并 赋值 为 1。 分 配 变量 不 是 CPU 的 工作 
;汇编 器 负责 分 配 空间 并 为 变量 编 址 
3 start: ;标号 名 为 start， 会 被 汇编 器 翻译 为 某 个 地 址 
4 mov ax,0 ;将 ax 赋值 为 0 
这 几 行 代码 没有 实际 意义 ， 只 是 为 了 解释 清楚 问题 ， 咱 们 
么 要 jmp start。 如 果 将 上 面 的 汇编 代码 按 纯 二 进 制 编译 ， 如 果 








三 
息 


显示 无 效 指令 ， 也 六 
下 一 条 待 执行 指令 的 地 ] 






































数据 都 是 二 进 制 数字 ，CPU 可 








令 也 说 不 定 。 既 然 var 是 我 们 定义 的 数 # 
































F 不 知道 执行 到 哪里 去 了 。 





不 加 第 1 行 








大 | 














丝 ， 下 一 个 地 址 var 处 的 值 为 1 
分 不 出 这 是 指令 ， 还 是 数据 。 
中 ， 那 么 必须 加 上 jmp start 跳 过 这 个 var 所 




















就 行 啦 ， 最 典型 的 就 是 


， 显 然 我 们 从 定义 中 看 出 

















即使 数据 和 代码 在 物理 上 混在 一 起 ， 程 序 也 是 可 以 运行 的 ， 这 并 不 意味 
指令 能 够 跨 过 这 些 数 和 








] jmp 跳 过 数据 区 。 











只 要 关注 在 第 2 行 的 定义 变量 var 之 前 为 什 
的 jmp，CPU 也 许 会 发 出 异常 ， 
为 CPU 只 会 执行 cs: ip 中 的 指令 ， 这 两 个 寄存 器 记录 的 














这 只 是 数 提 








居 ， 但 指令 和 





保 不 准 某 些 “数据 ” 误 打 误 撞 恰恰 是 某 种 指 








占 的 空间 才 可 以 。 


加 个 jmp 指令 ， 这 样 做 一 点 都 不 影响 运行 ， 只 不 过 这 样 写 出 来 的 程序 ， 其 中 引用 的 地 址 大 部 分 是 不 连 
续 的 ， 也 就 是 程序 在 取 地 址 时 会 显得 跳 来 跳 去 。 就 美观 层面 上 看 ， 这 样 的 结构 显得 很 凌乱 ， 不 利于 程序 员 
阅读 与 维护 。 如 果 把 第 2 行 的 var 换 到 第 1 行 ， 数 据 和 代码 就 分 开 了 ， 没 有 混在 一 起 ， 标 号 都 不 用 了 ， 代 
码 简洁 多 了 ， 如 下 。 


Var dd 1 
mov ax,0 




















































































































做 过 开发 的 同学 都 清楚 ， 尽 量 把 同一 属性 的 数据 放 在 一 起 ， 这 样 易 于 维护 。 这 一 点 类 似 于 MVC， 在 程序 
逻辑 中 把 模型 、 视 图 、 控 制 这 三 部 分 分 开 ， 这 样 更 新 各 部 分 时 ， 不 会 影响 到 其 他 模块 。 

将 数据 和 代码 分 开 的 好 处 有 三 点 。 
第 一 ， 可 以 为 它们 赋予 不 同 的 属性 。 

例如 数据 本 身 是 需要 修改 的 ， 所 以 数据 就 需要 有 可 写 的 属性 ， 不 让 数据 段 可 写 ， 那 程序 根本 就 无 法 执 
行 啦 。 程序 中 的 代码 是 不 能 被 更 改 的， 这 样 就 要 求 代码 段 具 备 只 读 的 属性 。 真 要 是 在 运行 过 程 中 程序 的 下 
一 条 指令 被 修改 了 ， 谁 知道 会 产生 什么 样 的 灾难 。 

第 二 ， 为 了 提高 CPU 内 部 缓存 的 命中 率 。 
大 伙 儿 知道 ， 缓 存 起 作用 的 原因 是 程序 的 局 部 性 原理 。 在 CPU 内 部 也 有 缓存 机 制 ， 将 程序 中 的 指令 
和 数据 分 离 ， 这 有 利于 增强 程序 的 局 部 性 。CPU 内 部 有 针对 数据 和 针对 指令 的 两 种 缓存 机 制 ， 因 此 ， 将 
数据 和 代码 分 开 存储 将 使 程序 运行 得 更 快 。 
第 三 ， 节 省 内 存 。 

程序 中 存在 一 些 只 读 的 部 分 ， 比 如 代码 ， 当 一 个 程序 的 多 个 副本 同时 运行 时 (比如 同时 执行 多 个 ls 
命令 时 )， 没 必要 在 内 存 中 同时 存在 多 个 相同 的 代码 段 ， 这 将 浪费 有 限 的 物理 内 存 资源 ， 只 要 把 这 一 个 代 
码 段 共享 就 可 以 了 。 

后 两 点 较 容易 理解 , 咱们 深入 讨论 下 第 一 点 , 不 知 您 有 没有 想 过 , 数据 段 或 代码 段 的 属性 是 谁 给 添加 上 的 呢 ， 
是 谁 又 去 根据 属性 保护 程序 的 呢 ， 是 程序 员 吗 ? 是 编译 器 吗 ? 是 操作 系统 吗 ? 还 是 CPU 一 级 的 硬件 支持 ? 
首先 肯定 不 是 程序 员 ， 人 家 操作 系统 设计 人 员 为 了 让 程序 员 编写 程序 更 加 容易 ,肯定 不 会 让 他 们 分 心 去 
处 理 这 些 与 业务 逻辑 无 关 的 事 。 看 看 编译 器 为 我 们 做 了 什么 ， 它 将 程序 中 那些 只 读 的 代码 编译 出 来 后 ， 放 在 
一 片 连续 的 区 域 , 这 个 区 域 叫 代码 段 。 将 那些 已 经 初始 化 的 数据 也 放 在 一 片 连续 的 区 域 , 这 个 区 域 叫 数据 段 ， 
那些 具有 全 局 属性 的 但 又 未 初始 化 的 数据 放 在 bss 段 。 总 之 ， 程 序 中 段 的 类 型 可 多 了 ， 用 “readelf -e elf” 命 
令 便 可 以 看 到 很 多 段 的 类 型 ， 感 兴趣 的 读者 请 自行 查阅 。 好 了 ， 编 译 器 的 工作 到 此 就 完事 了 ， 显 然 ， 数 据 段 
和 代码 段 的 属性 到 现在 还 没有 体现 出 来 。 
先 看 CPU 为 我 们 提供 了 哪些 原生 的 支持 。 在 保护 模式 下 , 有 这 样 一 个 数据 结构 , 它 叫 全 局 描述 符 表 (Global 
Descriptor Table，GDT)， 这 个 表 中 的 每 一 项 称 为 段 描 述 符 。 先 递归 学 习 一 下 ， 什 么 是 描述 符 ? 描述 符 就 是 描 
述 某 种 数据 的 数据 结构 ， 是 元 信息 ， 属 于 数据 的 数据 。 就 像 人 们 的 身份 证 ， 上 面 有 写 性 别 、 出 生日 期 、 地 址 等 
昔 述 个 人 情况 的 信息 。 在 段 描 述 符 中 有 段 的 属性 位 ， 在 以 后 的 章节 中 可 以 看 到 ， 其 实 是 有 2 个 ,一 个 是 S 字 
段 ， 占 lbit 大 小 ， 另 外 一 个 是 占 4bit 大 小 的 TYPE 字段 ， 这 两 个 字段 配合 在 一 起 使 用 就 能 组 合 出 各 种 属性 ， 
如 只 读 、 向 下 扩展 、 只 执行 等 。 提 供 归 提供 ， 可 得 有 人 去 填写 这 张 表 啊 ， 谁 来 做 这 事 呢 ， 有 请 操作 系统 登场 。 
接着 看 操作 系统 为 我 们 做 了 什么 。 
操作 系统 在 让 CPU 进入 保护 模式 之 前 ， 首 先 要 准备 好 GDT， 也 就 是 要 设置 好 GDT 的 相关 项 ， 填 写 好 
和 描述 符 。 段 描述 符 填写 成 什么 样 , 段 具 备 什么 样 的 属性 , 这 完全 取决 于 操作 系统 了 , 在 这 里 大 家 只 要 知道 ， 
段 描 述 符 中 的 $ 字段 和 TYPE 字段 负责 该 段 的 属性 ， 也 就 是 该 属性 与 安全 相关 。 

说 到 这 里 ， 答 案 似 乎 浮 出 水 面 了 。 

(1) 编译 器 负责 挑选 出 数据 具备 的 属性 ， 从 而 根据 属性 将 程序 片段 分 类 ， 比 如 ， 划 分 出 了 只 读 属 性 的 
代码 段 和 可 写 属性 的 数据 段 。 再 补充 一 下 ， 编 译 器 并 没有 让 段 具备 某 种 属性 ， 对 于 代码 段 ， 编 译 器 所 做 的 
只 是 将 代码 归 类 到 一 起 而 已 ， 也 就 是 将 程序 中 的 有 关 代码 的 多 个 section 合并 成 一 个 大 的 segment( 这 就 是 
我 们 所 说 的 代码 段 )， 它 并 没有 为 代码 段 添加 额外 的 信息 。 
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ES 0.8 “代码 中 为 什么 分 为 代码 段 、 数 据 段 ? 这 和 内 存 访问 机 制 中 的 段 是 一 同事 吗 

(2) 操作 系统 通过 设置 GDT 全 局 描述 符 表 来 构建 段 描述 符 ， 在 段 描述 符 中 指定 段 的 位 置 、 大 小 及 属 
性 (包括 S 字段 和 TYPE 字段 )。 也 就 是 说 ， 操 作 系 统 认 为 代码 应 该 是 只 读 的 ， 所 以 给 用 来 指向 代码 段 的 
那个 段 描述 符 设置 了 只 读 的 属性 ， 这 才 是 真正 给 段 添加 属性 的 地 方 。 

(3) CPU 中 的 段 寄存 器 提前 被 操作 系统 赋予 相应 的 选择 子 ( 后 面 章节 会 讲 什 么 是 选择 子 ， 和 暂时 将 其 
理解 为 相当 于 段 基 址 )， 从 而 确定 了 指向 的 段 。 在 执行 指令 时 ， 会 根据 该 段 的 属性 来 判断 指令 的 行为 ， 若 
有 返回 则 发 出 异常 

总 之 ， 编 译 器 、 操 作 系统 、CPU 三 个 配合 在 一 起 才能 对 程序 保护 ， 检 测 出 指令 中 的 违规 行为 。 如 果 
GDT 中 的 代码 段 描述 符 具 备 可 写 的 属性 , 那 编译 器 再 怎么 划分 代码 段 都 没有 用 ， 有 判断 权利 的 只 有 CPU。 

好 ， 现 在 大 家 对 GDT 有 个 感性 认识 ， 随 着 以 后 章节 中 讲 GDT 的 时 候 ， 大 家 就 会 有 深刻 的 理解 了 。 

以 上 说 明了 程序 按 内 容 分 段 的 原因 ， 那 么 编译 器 编译 出 来 的 段 和 内 存 访问 中 的 段 是 一 回 事 吗 ? 

其 实 算 一 回 事 ， 也 不 算 一 回 事 。 怎 么 说 呢 ， 我 觉得 当初 ntel 公司 在 设计 CPU 时 ， 其 采用 分 段 机 制 访问 内 
存 的 原因 ， 肯 定 不 是 为 了 上 层 软件 的 优美， 毕竟 那 只 是 逻辑 上 的 东西 。 那 为 什么 也 算 一 回 事 呢 ? 

分 析 一 下 ， 编 译 出 来 的 代码 段 是 指 一 片 连续 的 内 存 区 域 。 这 个 段 有 自己 的 起 始 地 址 ， 也 有 自己 的 大 小 
范围 。 用 户 进程 中 的 段 ， 只 是 为 了 便于 管理 ， 而 编译 器 或 程序 员 在 “美学 方面 ”做 出 的 规划 ， 本 质 上 它 并 
不 是 CPU 用 于 内 存 访 问 的 段 ， 但 它们 都 是 描述 了 一 段 内 存 ， 而 且 程 序 中 的 段 ， 其 起 始 地 址 和 大 小 可 以 理 
解 为 CPU 访问 内 存 分 段 策略 中 的 “ 段 基 址 : 段 内 偏 移 地 址 ”这 么 说 来 ， 至 少 它们 很 接近 了 ， 让 我 们 更 近 
一 步 : 程序 是 可 以 被 人 为 划分 成 段 的 ， 并 且 可 以 将 划分 出 来 的 段 地 址 加 载 到 段 寄存 器 中 ， 见 下 面 的 代码 0-1。 

代码 0-1 程序 分 段 

2 “， 肖 过 入 中转 半 信守 冶 代 自 眉 千 存 器 cs 赋值 ox90 

3 jmp Ox90:start 

4 start: ;标号 start 只 是 为 了 jmp 跳 到 下 一 条 指令 

5 

6 ;初始 化 数据 段 寄存 器 DS 

4 mov ax,section.my data.start 

8 add ax, 0x900 ;加 0x900 是 因为 本 程序 会 被 mbr 加 载 到 内 存 0x900 处 

9 shr ax,4 ;提前 右 移 4 位 , 因为 段 基 址 会 被 CPU 段 部 件 左 移 4 位 

10 mov ds,ax 

六 省 

12 ;初始 化 栈 段 寄存 器 SS 

于 学 mov ax, section.my stack.start 

14 add ax, 0x900 ;加 0x900 是 因为 本 程序 会 被 mpr 加 载 到 内 存 0x900 处 

15 shr ax,4 ; 提前 右 移 4 位 , 因为 段 基 址 会 被 CPU 段 部 件 左 移 4 位 

16 mov ss,ax 

17 mov sp, stack top ” ;初始 化 栈 指针 

18 

19 ;此 时 cs、DS、SS 段 寄存 器 已 经 初始 化 完成 , 下 面 开始 正式 工作 

20 push word [var2] ; 变量 名 var2 编译 后 变 成 0x4 

21 jmp $ 

22 

23 定义 的 数据 段 

24 eis my_data align=16 vstart=0 

25 varl dq Oxl 

26 Var2 dd 0x6 

27 

28 定义 的 栈 段 

29 SET my_stack align=16 vstart=0 

30 times 128 db 0 

31 stack top: ;此 处 栈 项 , 标号 作用 域 是 当前 section， 

;以 当前 section 的 vstart 为 基 3 
32 
代码 0-1 是 实 模式 下 运行 的 程序 ， 其 中 自 定义 了 三 个 段 ， 为 了 和 标准 的 段 名 (.code、.data 等 ) 有 所 区 














别 ， 这 本 
载 到 物理 
的 段 基 址 
为 0x90《〈 在 实 模式 下 ， 由 



























































CPU 的 段 部 件 


有 代码 段 取 名 为 my_code， 数据 段 取 名 为 my_data， 栈 段 取 名 为 my_stack。 这 上段 代码 是 日 
内 存 地 址 0x900 后 ，mbr 通过 “jmp 0x900” 跳 过 来 的 ， 我 们 的 想法 是 让 各 段 寄存 器 左 移 4 位 后 
与 程序 中 各 分 段 实 际 内 存 位 置 相同 ， 所 以 对 于 代码 段 ， 希 望 其 基 
将 其 左 移 4 位 后 变 成 0x900， 所 以 要 初始 化 成 左 移 4 位 前 的 值 )。 


























址 是 0x900， 故 代码 段 CS 的 值 


昌 MBR 加 















































有 办 法 直接 为 CS 寄存 器 赋值 ， 所 以 在 代码 0-1 3 

















IP。 这 样 段 寄 




















存 器 CS 就 是 程序 中 咱们 EE 














各 section 的 起 始 地 址 是 16 的 整数 倍 ， 恨 
shr ax，4， 结 果 才 是 正确 的 ， 只 是 把 0 移 吕 
的 整数 倍 ， 右 移 4 位 可 





做 为 段 内 1 


AAA 


和 

















在 此 提醒 一 下 , 各 section 中 的 定义 都 有 align=16 和 vstart=0, 这 是 上 





























全 已 :全 
能 会 于 











6 一 10 行 是 初始 化 数据 段 寄 存 器 DS， 是 








] 








] 十 六 进 制 表 








数据 。vstart=0 是 指定 各 section 内 数 提 
扁 移 地 址 时 更 方便 。 具 体 vstart 内 容 请 参阅 本 书 相 应 章节 。 


示 的 话 ， 最 后 一 


















































开头 ， 用 “jmp 0x90: 0” 初 始 化 了 程序 计数 器 CS 和 
己 划 分 的 代码 段 了 。 
来 指定 各 section 按 16 位 对 齐 的 ， 
立 是 0。 所 以 右 移 操作 如 第 
去 了 。 和 否则 不 加 align=16 的 话 ，section 的 地 址 不 能 保证 是 16 


9 行 的 

















程序 中 自己 划分 的 段 my_data 的 地 址 来 初始 化 的 。 


或 指令 的 地 址 以 0 为 起 始 编号 ， 这 样 




















代码 0-1 本 身 是 脱离 操作 系统 的 程序 ， 是 MBR 将 其 加 载 到 0x900 后 通过 跳 转 指令 “jmp 0x900” 跳 入 执行 


Ey 


的 ， 所 以 要 


各 my_data 在 文人 











大 | 





移 4 位 的 原 
为 段 基 址 赋 


AAA 


第 12 一 











为 它 初始 化 的 值 stack top 是 最 后 一 行 ， 因 为 栈 指针 在 使 ) 





定 得 是 栈 段 的 最 高 地 址 。 

经 过 代码 段 、 数 所 
分 的 段 地 址 , 之 后 CPU 的 内 存 分 段 机 
岂 址 都 是 各 自 定义 段 内 的 指令 和 数 所 
编号 的 。 所 以 ， 程 序 中 的 分 段 和 CPU 内 存 访问 的 分 段 又 是 一 回 
， 可 能 是 我 们 一 般 都 是 
编译 器 在 编 


段 内 偏 移 


让 我 
段 这 种 工 





门 对 此 感到 疑惑 的 原 
乍 不 








17 行 是 初始 化 栈 段 寄存 器 ， 














大 











三 | 














我们 控制 ， 
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4GB 空间 为 1 个 段 ) 下 工作 ， 编 
整齐 排列 。 大 家 可 以 用 














段 : 
注 三 段 内 容 




















Program Headers: 列 出 了 程 / 
Section to Segment mapping: 列 昌 
有 关 section 和 segment 的 内 容 请 参见 本 
在 Section Headers 和 Program Headers 中 您 会 发 现 , 这 些 分 段 都 是 按照 地 址 由 低 到 高 在 4GB 空间 
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译 器 也 是 按照 习 
readelf -e /bin/ls 查看 一 下 1s 


F 内 的 地 址 section.my_data.start 加 j] 


























上 0x900 才 是 最 终 在 内 存 中 的 真实 地 址 。 石 





























己 划 分 的 数据 段 了 。 


同 代码 段 相同 ， 都 是 CPU 的 段 部 件 会 自动 将 段 基 址 左 移 4 位 ， 故 提前 右 移 4 位 。 此 地 址 作 
值 给 DS， 这 样 段 寄存 器 DS 中 的 值 是 程序 中 咱们 EE 


原理 和 数据 段 差 不 多 ， 唯 一 区 别 是 栈 段 初始 化 多 了 个 针 指 针 SP， 








央 “ 段 基 址 : 段 内 1 
届 地 址 ， 由 于 在 section : 








译 阶 段 完 
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Ey 


过 程 中 指向 的 地 址 越 来 越 低 ， 所 以 初始 化 时 一 


届 段 、 栈 段 的 初始 化 ，CPU 中 的 段 寄 存 器 CS、DS、SS 都 是 指向 程序 中 咱们 自己 划 























让 
员 。 





有 


局 移 地 址 ” 段 基 址 就 是 程 








序 中 咱们 











己 划分 的 段 ， 














vstart=0 限制 , 地 址 都 是 从 0 开始 


























成 





命令 ， 结 


























Section Headers: 列 出 了 程序 中 所 有 的 section， 这 些 section 是 gcc 编译 器 帮 用 
的 段 ， 即 segment， 这 是 程序 中 section 合并 后 的 结果 。 
了 一 个 segment 中 包含 了 哪些 section 。 
相关 章节 。 








| 高 级 语言 开发 程序 ， 在 高 级 语言 中 ， 程 序 分 
的 。 而 且 现代 操作 系统 者 
F 坦 模型 为 程序 布局 ， 程 序 中 的 代码 和 数据 都 在 同一 个 
果 太 长 ， 就 不 截图 啦 。1 





是 在 平坦 模型 (整个 








们 主要 关 




















划分 的 。 












































连 






































迷惑 了 。 其 实 








续 整洁 地 分 布 的 ， 在 平坦 模型 下 和 谐 融 治 。 
显然 ， 不 用 程序 员 手 工分 段 ， 并 且 采 用 平坦 模型 ， 这 种 操作 上 的 “隔离 ”固然 让 我 们 更 加 方便 ， 但 也 让 我 

们 更 加 感到 进程 空间 布局 的 神秘 。 如 果 程 序 分 段 像 代码 0-1 那样 地 直 白 、 亲 民 ， 大 家 肯定 不 会 感到 

我 想 说 的 是 无 论 是 否 为 平坦 模型 ， 程 序 中 的 分 段 和 CPU 中 的 内 存 分 段 机 制 ， 它 们 属于 物品 与 容器 的 关系 。 











段 寄 存 器 相当 于 盛 水 果 的 盘子 。 可 
来 ， 但 依然 是 分 门 别 类 


大 小 为 4GB 


块 儿 端 上 来 ， 这 就 是 
下 ， 程 序 中 的 段 只 是 逻辑 上 的 划分 ， 用 于 不 同 数据 的 归 类 ， 





负 疆 一 - 


ve 一 口 






































举 个 例子 ， 程 序 中 划分 的 段 相当 于 各 种 水 果 ， 比 如 代码 段 相 当 于 
香花 ， 数 据 段 相当 于 葡萄 ， 栈 段 相 当 于 西瓜 。CPU 内 存 分 段 策略 中 的 














以 














的 平坦 模型 。 也 可 以 
普通 的 分 段 模型， 









































巴 每 种 水 果 








分 另 


0-4 














如 图 所 示 。 





























但 是 可 以 用 





访问 程序 中 的 段 ， 在 这 一 点 上 看 








CPU : 











的 段 寄存 器 直接 指向 它们 ， 然 后 用 内 存 分 段 机 和 























中 的 段 是 内 存 中 的 内 容 ， 相 当 于 相片 ， 





相框 ， 有 了 相框 ， 照 片 才能 








地 摆 放 。 
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， 它 们 


属于 被 展示 的 内 容 ， 而 内 存 分 段 机 


很 像 相片 和 相机 








j 一 个 大 盘子 将 各 种 水 果 都 放 进 
也 摆 放 ， 不 能 失去 美感 混成 一 锅 弱 ， 这 就 是 段 
j 放 在 一 个 小 盘子 里 一 





十 


Ss 





一 


一 个 大 盘子 


西瓜 


平坦 模型 





三 个 小 盘子 


葡萄 | 香蕉 


分 段 模型 





受 | 








全 











0-4 ”程序 中 分 段 在 











匡 的 关系 : 程序 








分 段 模型 中 的 





平坦 模型 和 











区 别 


捉 则 是 访问 内 存 的 手段 ， 相 当 于 












































我 想 大 家 应 该 已 经 搞 清 楚 了 内 存 分 段 和 程序 分 段 的 关系 ， 甚 实 就 是 一 回 事 ， 内 存 分 段 指 的 是 处 理 器 为 
Re ed ee pe 程序 分 段 是 软件 中 人 为 逻辑 划分 的 内 存 区 域 ， 它 本 身 也 是 
内 存 ， 所 以 处 理 器 在 访问 该 区 域 时 ， 也 会 采用 内 存 分 段 机 制 ， 用 段 寄存 器 指向 该 区 域 的 起 始 地 址 。 


物理 地 址 、 逻 辑 地 址 、 有 效 地 址 、 线 性 地 址 、 虚 拟 地 址 的 区 别 














































































































物理 地 址 就 是 物理 内 存 真 正 的 地 址 , 相当 于 内 存 中 每 个 存储 单元 的 门牌 号 , 具有 唯一 性 。 不管 在 什么 模式 下 ， 

































































不 管 什么 虚拟 地 址 、 线 性 地 址 ，CPU 最 终 都 要 以 物理 地 址 去 访问 内 存 ， 












































人 

















































































































只 有 物理 地 址 才 是 内 存 访问 的 终点 站 。 
在 实 模式 下 ,“ 段 基 址 + 段 内 偏 移 地 址 ”经 过 段 部 件 的 处 理 ， 直 接 输出 的 就 是 物理 地 址 ，CPU 可 以 直 





















































而 在 保护 模式 下 ,“ 段 基 址 + 段 内 偏 移 地 址 ” 称 为 线性 地 址 ， 不 过 ， 此 时 的 段 基 址 已 经 不 再 是 真正 的 地 址 
了 ， 而 是 一 个 称 为 选择 子 的 东西 。 它 本 质 是 个 索引 ， 类 似 于 数组 下 标 ， 通 过 这 个 索引 便 能 石 
的 段 还 符 ， 在 该 描述 符 中 记录 了 该 段 的 起 始 、 大 小 等 信息 , 这 样 便 得 到 了 段 基 址 。 若 没有 开局 地 址 


FE GDT 中 找到 相应 


分 页 功能 ， 








此 线性 地 址 就 被 当 作物 理 地 址 来 用 ， 可 直接 访问 内 存 。 若 开启 了 分 页 功能 ， 此 线性 地 址 又 多 了 一 个 名 字 ， 就 是 














虚拟 地 址 (虚拟 地 址 、 线 性 地 址 在 分 页 机 制 下 都 是 一 回 
址 ， 这 样 CPU 才能 将 其 送 上 地 址 总 线 去 访问 内 存 。 
无 论 在 实 模式 或 是 保护 模式 下 ， 段 内 偏 移 地 址 又 称 为 有 效 地 








出 中 

























































































符 中 ， 所 以 只 要 给 出 段 内 偏 移 地 址 就 行 了 ， 这 个 地 址 虽然 只 是 段 
足够 有 效 。 





















































和 )。 虚 拟 地 址 要 经 过 CPU 页 部 件 转换 成 具体 的 物理 地 


址 ， 也 称 为 逻辑 地 址 ， 这 是 程序 员 可 
见 的 地 址 。 这 是 因为 ， 最 终 的 地 址 是 由 段 基 址 和 有 段 内 偏 移 地 址 组 合 而 成 的 。 由 于 段 基 址 已 经 有 默认 的 
啦 ， 要 么 是 在 实 模式 下 的 默认 段 寄 存 器 中 ， 要 么 是 在 保护 模式 下 的 默认 段 选择 子 寄存 器 指向 的 段 描述 


内 偏 移 ， 但 加 上 默认 的 段 基 























址 ， 依 然 


























线性 地 址 或 称 为 虚拟 地 址 ， 这 都 不 是 真实 的 内 存 地 址 。 它 们 都 








j 来 描述 程序 或 任务 的 地 址 空 











x 间 。 由 于 





分 页 功能 是 需要 在 保护 模式 下 开启 的 ，32 位 系统 保护 模式 下 的 寻 址 空间 是 4GB， 所 以 虚拟 地 址 或 线性 地 








址 就 是 0~4GB 的 范围 。 转 换 过 程 如 图 0-5 所 示 。 

















实 模 式 下 
段 部 件 
段 基 址 0xc0 段 基 址 乘 16 
十 
段 内 偏 移 地 址 1 段 内 偏 移 
保护 模式 下 
是 否 已 经 
页 
段 基 址 0xc00 打开 分 页 
段 内 偏 移 地 址 1 


开启 了 分 页 ， 输 出 的 地 址 i 
被 认为 是 虚拟 地 址 或 叫 线 人 
性 地 址 ， 此 地 址 需要 通过 直接 用 来 访问 内 存 


页 表 转换 成 物理 地 址 


CPU 通 过 查找 页 表 ， 找 到 
此 线性 地 址 对 应 的 物理 地 址 


0-5 ”虚拟 地 址 、 物 理 地 址 等 





p 
讨 





















Oxc04 


Oxc03 


Oxc02 





OxcO1 


Oxc00 









物理 地 址 不 固定 


什么 是 段 重 树 


灾 上 面 已 经 提 到 了 段 重 登 ， 也 许 有 的 读者 已 经 明白 了 ， 但 还 是 在 此 特意 解释 一 下 吧 。 

依然 假设 在 实 模 式 下 (并 不 是 说 在 保护 模式 下 就 不 存在 段 重合, 只 是 这 样 就 会 少 解释 了 相关 数据 结构 ， 
如 段 描述 符 , 不 过 这 不 重要 , 原理 是 一 样 的 ), 一 个 段 最 大 为 64KB, 其 大 小 由 段 内 偏 移 地 址 寻 址 范围 决定 ， 
也 就 是 2 的 16 次 方 。 其 起 始 位 置 由 段 基地 址 决定 。CPU 的 内 存 寻 址 方式 是 : 给 我 一 个 段 基 址 ， 再 给 我 


































































































































































































个 相对 于 该 段 起 始 位 置 的 偏 移 地 址 , 我 就 能 访问 到 相应 内 存 。 内 存 高 地 址 
它 并 不 要 求 一 个 内 存 地 址 只 隶属 于 某 一 个 段 ， 所 以 在 上 面 的 [| 
图 0-2 中 , 欲 访问 内 存 0xC03, 段 基 址 可 以 选择 0xC00,0xC01， 了 





























0xC02，0xC03， 只 不 过 是 段 内 偏 移 量 要 根据 段 基地 址 来 调整 
罢了 。 用 这 种 “ 段 基 地 址 : 段 内 偏 移 ”的 组 合 ，0xC00: 3 和 


























































































































































































































0xC02: 1 是 等 价 的 ， 它 们 都 访问 到 同一 个 物理 内 存 块 。 但 段 人 

的 大 小 决定 于 段 内 偏 移 地 址 寻 址 范围 ， 假 设 段 A 的 段 基 址 是 0xC04 自重 到 
从 0xC00 开始 ， 段 B 的 段 基 址 是 从 0xC02 开始 ， 在 16 位 宽 “有 段 ^ 0xC03 

度 的 寻 址 范围 内 ， 这 两 个 段 都 能 访问 到 0xC05 这 块 内 存 。 用 0xC02 

段 A 去 访问 ， 其 偏 移 为 5， 用 上 段 B 去 访问 ， 其 偏 移 量 为 3。 0OxC01 

这 样 一 来 ， 用 段 B 和 段 A 在 地 址 0xC02 之 后 ， 一 直到 段 B 0xC00 

偏 移 地 址 为 0xfffe 的 部 分 ， 像 是 重 芭 在 一 起 了 ， 这 就 是 段 重 4 图 0-6 段 重 芭 























全 了 ， 如 图 0-6 所 示 。 


平坦 模型 是 相对 于 多 段 模型 来 说 的 ， 所 以 说 平坦 模型 指 的 就 是 一 个 段 。 比 如 在 实 模式 下 ， 访 问 超过 
64KB 的 内 存 ， 需 要 重新 指定 不 同 的 段 基 址 ， 通 过 这 种 迁 回 变通 的 方式 才能 达到 目的 。 在 保护 模式 下 ， 
1 于 其 是 32 位 的 ， 寻 址 范围 便 能 够 达到 4GB， 段 内 偏 移 地 址 也 是 地 址 ， 所 以 也 是 32 位 。 可 见 ， 在 32 
位 环境 下 用 一 个 段 就 能 够 访问 到 硬件 所 支持 的 所 有 内 存 。 也 就 是 说 ,， 段 的 大 小 可 以 是 地 址 总 线 能 够 到 达 
的 范围 。 既 然 平坦 模型 是 相对 于 多 段 模型 来 说 的 ， 为 什么 不 称 为 单 段 模型 ， 而 称 为 平坦 呢 ， 我 估计 很 多 
读者 已 经 明白 了 , 用 多 个 小 段 再 加 上 不 断 换 段 基 址 的 方式 访问 内 存 确实 够 麻烦 的 , 可 能 换 着 换 着 就 蛇 了 ， 
别 忘 记 了 ， 这 种 多 段 模型 为 了 访问 到 1MB 地 址 空间 ， 还 需要 额外 打开 A20 地 址 线 呢 ， 这 种 访 存 方式 本 
身 就 是 种 补救 措施 ， 相 当 于 给 硬件 打 了 个 补丁 ， 既 然 是 补丁 ,访问 内 存 的 过 程 必然 是 不 顺畅 的 。 相 对 于 
那么 麻烦 的 多 段 模型 ,平坦 模型 不 需要 额外 打开 A20 地 址 线 , 不 需要 来 回 切 换 段 基 址 就 可 以 在 地 址 空间 
内 任意 蔓 翔 。 如 果 把 内 存 段 比 喻 成 小 格子 的 话 ， 平 坦 模 型 下 的 内 存 访 问 ， 没 有 众多 小 格子 成 为 芽 绊 ， 可 
谓 一 路 “平坦 ”。 

所 以 “平坦 ”这 两 个 字 ， 突 显 了 当时 的 程序 员 受 多 段 模型 折磨 之 苗 ， 和 迫不及待 地 想 表 达 其 优势 的 喜 
悦 之 情 。 


~ A、 六 和 这 类 & 米 段 寄存 器 ， 位 宽 是 多 少 


CPU 中 存在 段 寄存 器 是 因为 其 内 存 是 分 段 访问 的 ， 这 是 设计 之 初 决定 的 ， 属 于 基因 里 的 东西 。 前 面 
已 经 介绍 过 了 内 存 分 段 访问 的 方法 ， 这 里 不 再 歼 述 。 

CPU 内 部 的 段 寄 存 器 〈Segment reg) 如 下 。 

(1) CS 代码 段 寄存 器 (Code Segment Register)， 其 值 为 代码 段 的 段 基 值 。 























































































































































































































































































































































































































(2) DS 一 一 数据 段 寄 存 器 (Data Segment Register)， 其 值 为 数 和 





居 段 





的 段 基 值 。 


(3) ES 一 一 附加 段 寄 存 器 〈Extra Segment Register)， 其 值 为 附加 数据 段 的 段 基 值 ， 称 为 “附加 ”是 


因为 此 段 寄存 器 用 途 不 像 其 他 sreg 寻 

(4) FS 一 一 附加 上段 寄存 器 (Extra Segment Register), 其 值 为 附加 数 扩 
上 灵活 机 动 。 
(5) GS 一 一 附加 段 寄 存 器 (Extra Segment Register)， 了 
(6) SS 一 一 堆栈 段 寄存 器 (Stack Segment Register)， 其 值 为 堆栈 段 的 段 值 。 














使 用 














32 位 CPU 有 两 种 不 同 的 工 


每 种 模式 下 ， 段 寄存 器 中 值 
在 实 模式 下 ，CS、DS、 
值 : 段 内 1 


在 哪里 。 
6 段 基 





























局 移 量 ”的 天 

















Pp 样 











固定 ， 可 以 额外 做 他 




















的 意义 是 不 同 的 ， 但 
ES、SS 中 的 值 




















bp 用 。 











乍 模式 : 实 模式 和 保护 模式 。 


四 段 的 段 基 值 




















有 同上 ， 





途 不 固定 ， 























其 值 为 附加 数据 段 的 段 基 值 。 
































不 管 其 为 何 值 ， 帮 











为 段 基 址 ， 




















多 式 。 在 保护 模式 下 , 装 入 段 寄存 器 的 不 再 是 段 
选择 子 也 是 数值 ， 其 依然 为 16 位 宽度 。 





是 具体 的 物 到 


E 段 寄存 器 中 所 表达 的 都 是 指向 的 段 











EE 地址 ， 内 存单 元 的 逻辑 地 址 仍 为 
也 址 , 而 是 “ 段 选择 子 ”(Selector)， 








可 见 ， 在 32 位 CPU 中 ，sreg 无 论 是 工作 在 16 位 的 实 模 式 ， 还 是 32 位 的 保护 模式 ， 用 的 段 寄 存 器 都 


是 同一 组 ， 并 且 在 32 位 下 的 段 
上 所 述 ，sreg 都 是 16 位 宽 。 











什么 是 工程 ， 什 么 是 协议 


这 两 个 小 问题 ， 
为 这 名 词 似 乎 也 没 法 i 





吧 ( 基 











软件 中 的 工程 是 指 开 
在 一 般 的 集成 开发 环境 中 如 eclipse 或 vc++， 在 程序 的 开 
它 相 当 于 一 个 大 
全 部 文人 
司 事 写 





程 ， 














一 些 非 





















































件 目录 ， 











法 彼 上 上 


协议 是 一 种 大 家 共 
调用 对 方 成 果 的 情 





录 ， 以 后 写 的 














F 包 含 实 际 代 码 和 环境 配置 两 
4 头 文件 ,若是 与 他 方 合作 ， 还 要 包含 第 三 方 头 文件 。 环 ] 


尺码 都 在 这 里 面 。 


开发 型 技术 人 员 经 常会 问 到 ， 
说 复杂 )。 
发 一 套 软 件 所 需要 的 全 部 文件 ， 包 括 配 置 环境 。 

先 建立 一 个 project， 这 就 是 所 谓 的 工 




















选择 子 是 16 位 宽度 ,排除 了 段 寄 存 器 在 32 位 环境 下 是 32 位 宽 的 可 能 ， 综 








做 过 
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部 分 。 实 际 代 码 部 分 


开发 的 同学 肯定 ] 


解 。 想 想 还 是 简 


前 单 说 一 下 














， 除 了 


己 写 的 代码 文件 之 外 ， 


一 般 都 要 包 









































同 遵守 


的 规约 ， 主 要 
况 ， 从 而 给 大 家 统一 一 种 接 
大 家 达成 一 致 后 ， 都 遵守 这 个 约定 开发 自 1 


那 句 话 ， 工 程 就 是 为 了 完成 软件 编写 所 涉及 的 全 半 











人 体 还 要 根据 所 用 的 实际 框架 来 配置 , 包含 一 些 服务 器 的 ] 


bp 
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用 来 实现 通信 、 


、 协 作 ; 














画图 














已 ,的 户 品 ， 别人 只 要 








果 ， 从 而 实现 了 彼 山 
据 OSI 七 
接收 方 都 彼 出 











议 。 根 
发 送 方 和 
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当前 层 的 
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理 层 ) 中 的 数据 
ji 层 ) TCP 或 UDP 的 属性 








属性 ， 相 








容 。 只 要 
层 模 型 ， 它 规定 数据 的 第 
认同 最 外 
民 据 此 属性 就 能 找到 需要 的 数据 














是 技术 人 员 都 对 TCP/IP 有 所 了 
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一 纪 














下调 




















境 配 置 部 分 ,一般 是 配置 
地 ] 


或 者 分 析 的 约定 。 
也 按照 这 个 约定 就 能 够 享用 自 
解 ， 这 就 是 我 们 








些 模板 、 
也 都 在 配置 文件 中 。 
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此 ， 端 











起 初 是 为 避免 大 家 各 干 各 的 ， 无 








己 的 成 
前 赖 以 生存 的 网 络 协 

































































层 的 就 是 











层 , 也 就 是 最 外 
电路 传输 用 的 数据 。 每 一 层 中 的 前 











居 。 各 


民 中 的 数 





民 物 理 层 ， 
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据 部 分 都 是 更 上 





层 包含 的 是 电路 相关 的 数据 。 
『 几 个 固定 的 字 节 必须 是 描述 
层 的 数据 , 如 第 一 层 ( 物 









































居 训 


了 分 是 第 二 








所 需要 的 数据 。 由 此 可 见 


件 )， 


三 
只 是 


如 图 0-7 所 示 ， 两 边 的 应 


一 小 点 啦 。 


民 〈 数 据 链 路 








+ 数据 


， 对 方 一 大 串 数据 发 过 来 后 ， 经 过 层 


中。 各 层 都 是 如 此 ， 


民 ) 的 ) 





盟 性 + 数 志 











上 十 ， 


第 三 层 〈 网 络 








层 ) 的 数据 部 分 是 第 四 层 〈 传 

















直至 
























































第 七 
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(应 | 





:) 的 数据 部 分 才 是 真正 应 用 软件 




















民 和 剥离 处 理 ， 到 了 最 终 的 接收 方 〈 应 























j 软 






































便 加 了 各 
这 样 





说 似乎 还 是 很 扩 





] 程 月 











层 的 报 文 头 ， 























上 层 整个 (包括 自己 
象 ， 具体 地 说 ,就 是 需要 的 数 
是 多 少 ， 就 是 协议 中 所 规定 的 。 不 了 解 TCP/P 的 同学 可 以 参看 各 























互 发 数据 时 


， 其 实 发 的 就 是 最 项 
的 报 文 头 和 报 文体 ) 全 部 成 了 下 
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全 





的 那 一 小 点 “ 数 


二 屋 ， 











一 层 的 数 志 




















是 在 




















局 移 文件 固定 大 小 的 字 节 处 ， 这 个 
层 报 文 格式 ， 自 行 查 
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子 陪 








定 











yp 





阅 吧 。 














网 络 层 


数据 





FAC 数据 chk 
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物理 传输 介质 
0-7 0SI 七 层 模型 

















应 用 程序 


Application 
Laycr 
Presentation 
Layer 
Session 
Layer 
Transport 
Layer 
Network 
Layer 


Physical 
Layer 


区 为 什么 wf 系统 下 的 应 用 程序 不 能 在 # :时 ;CD A 系统 下 运行 


其 实 》 Wind 





ows 下 














对 于 这 个 问题 ,很 多 同学 都 会 马 .] 












































的 程序 也 无 法 直接 在 Linux 下 运行 。 
上 给 出 答案 : 格式 不 同 。 其 实 …… 答 对 啦 ， 确 实 是 格式 不 同 ， 不 过 这 只 





























































































































是 一 方面 ， 还 有 另 一 方面 ， 系 统 API 不 同 ，API 即 Application Programming Interface， 应 用 程序 编程 接口 。 
先 说 说 格式 。 其 实 格式 也 算是 协议 ， 就 是 在 某 个 固定 的 位 置 有 固定 意义 的 数据 。Linux 下 的 可 执行 程序 格式 
是 elf， 也 就 是 “Executable and Linking Format” 平 时 咱们 用 readelf 命令 可 以 查看 elf 文件 涉 , 里 面 有 节 (section ) 
信息 、 段 (segment) 信息 、 程 序 入 口 〈entry_point)、 哪 个 段 由 哪些 节 组 成 等 信息 。 
而 Windows 下 的 可 执行 程序 是 PE 格式 〈portable executable， 可 移植 的 可 执行 文件 )， 因 为 我 没 了 解 














过 ， 所 以 
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API 不 同 。Linux 中 的 API 称 为 系统 调 ) 





人 体 文 件 头 0 
bP 如果 Linux 支持 了 PE 格式 就 可 以 运行 Wndows 程序 了 吗 ? 也 不 行 ， 因 为 在 上 面 说 过 了 ， 还 有 系统 
j， 是 通过 int 0x80 这 个 软 中 断 实 3 























们 就 不 关注 了 ， 有 兴趣 的 


司 学 自行 查看 。 


























纲 的 。 而 Windows 中 的 API 是 存 


放 在 动态 链接 库 文件 中 的 ， 也 就 是 Windows 开发 人 员 常 说 的 DLL， 即 Dynamic Link Library 的 缩写 。LL 是 





一 个 库 ， 里 





























有 包含 代码 和 数据 ， 可 供用 户 程序 调用 ，DLL 不 是 可 执行 文件 ， 不 能 够 单独 运行 。 也 就 是 说 ， 


Linux 中 的 可 执行 程序 获得 系统 资源 的 方法 和 Windows 不 一 样 ， 所 以 显然 是 不 能 在 Windows 中 运行 的 。 


除 以 上 原因 

















外 ， 这 还 和 编译 器 、 标 准 库 有 

















关 ， 不 再 列举 。 








局 部 变量 和 函数 参数 为 什么 要 放 在 栈 中 
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局 部 变量 ， 顾 名 思 义 
可 以 随时 随地 访问 ， 所 以 























作 ) 

















] 域 
放 在 数据 段 中 。 而 局 部 变 


属于 


局 部 ， 














并 不 是 像 static 忆 


属于 全 局 | 


























B 样 
只 是 白 


只 是 自己 在 用 ， 
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有 要， 








故 将 其 放 在 自己 的 栈 
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是 向 下 生长 的 ， 


E 栈 机 














9 随时 


E 架 就 是 把 esp 
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可 以 清理 





FE 体现 了 局 部 的 意义 。 




















储 局 部 变量 。 解释 一 个 概念 ， 














规划 的 , 属于 软 伯 
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范畴 。 栈 是 处 至 


是 程序 运行 j 


字 
指名 


过 程 中 用 








[提前 加 一 个 数 ， 





这 个 就 是 
原 esp 指针 到 新 esp 





生 的 。 全 局 的 变量 ， 意 味 着 谁 





放 在 数据 段 中 纯 忆 


E 栈 框架 ， 




















浪费 空间 ， 没 有 必 
提 到 了 就 说 一 点 


巴 ， 




















器 运行 必 备 


























的 内 存 空间 ， 是 硬 伯 


必需 的 ， 1 








日 又 是 











虽 针 之 间 的 栈 空 间 用 来 
动态 内 存 分 配 的 内 存 空 间 ， 是 操作 系统 为 每 个 用 户 进程 
软件 〈 操 作 系统 ) 提供 的 。 


存 

















是 堆 ， 而 堆栈 就 是 栈 ， 和 堆 没关系 ， 只 是 都 这 么 叫 。 栈 和 堆栈 都 是 指 的 栈 ,在 C 程序 的 内 存 布局 中 ， 由 于 
和 栈 的 地 址 空间 是 接壤 的 ， 栈 从 高 地 址 往 低地 址 发 展 ， 挫 是 从 低地 址 往 高 地 址 发 展 ， 堆 和 栈 早 晚会 碰头 ， 候 
们 各 自 的 大 小 取决 于 实际 的 使 用 情况 ， 界 限 并 不 明朗 ， 所 以 这 可 能 是 堆栈 常 放 在 一 直 称 呼 的 原因 吧 。 

函数 参数 为 什么 会 放 到 栈 区 呢 ? 第 一 也 是 其 局 部 性 导致 的 ， 只 有 这 个 函数 用 这 个 参数 ,何必 将 其 放 在 
数据 段 呢 。 第 二 ， 这 是 因为 函数 是 在 程序 执行 过 程 中 调用 的 ， 属 于 动态 的 调用 ， 编 译 时 无 法 预测 会 何 时 调 
用 及 被 调用 的 次 数 ， 函 数 的 参数 及 返回 值 都 需要 内 存 来 存储 ， 如 果 是 递归 调用 的 话 ， 参 数 及 返回 值 需要 的 
内 存 空间 也 就 不 确定 了 ， 这 取决 于 递归 的 次 数 。 也 许 这 么 说 您 也 依然 觉得 费解 ， 如 果 完 全 明白 ,需要 了 解 

下 编译 原理 , 很 多 知识 都 是 通过 实践 后 才 搞 明白 的 。 当 然 我 不 是 说 让 您 为 了 搞 明 白 这 个 问题 而 去 尝试 写 
个 编译 器 。 

总 之 ， 在 函数 的 编译 阶段 根本 无 法 确定 它 会 被 调用 几 次 ， 其 参数 和 函数 的 返回 地 址 也 要 内 存 来 存储 ， 
所 以 也 不 知道 其 会 需要 多 少 内 存 。 我 想 ， 即 使 神通 广大 的 编译 器 设计 者 可 以 预测 这 些 了 ， 那 提前 准备 好 内 
存 也 是 一 种 浪费 ， 而 且 您 想 啊 ， 在 系统 中 可 用 内 存 紧缺 的 情况 下 ， 提 前 把 内 存 分 配给 目前 并 不 使 用 内 存 的 
进程 《只 因为 要 存储 其 函数 参数 )， 而 眼前 需要 内 存 的 程序 若 无 内 存 可 用 ， 引 用 罗 永 浩 老师 的 一 句 话 :“ 我 
想不到 比 这 个 更 伤感 的 事情 了 ”所 以 编译 器 为 了 让 世界 更 美好 一 些 ， 选 择 将 为 函数 参数 动态 分 配 内 存 ， 也 
就 是 在 每 次 调用 函数 时 才 为 它 在 栈 中 分 配 内 存 。 


为 什么 说 汇编 语言 比 + 语言 快 


首先 说 这 是 雇 论 (有 没有 想 喷 我 的 冲动 ? 大 人 且慢 ， 请 听 我 慢 慢 道 来 )。 

不 管用 什么 语言 , 程序 最 终 都 是 给 CPU 运行 的 ， 只 有 CPU 才能 让 程序 跑 起 来 。CPU 不 知道 什么 是 ; 
编 语 言 、C 语言 ， 甚 至 Java、PHP、Python 等 ， 它 根本 不 知道 交 给 它 的 指令 曾经 经 历 过 那么 多 的 解释 、 编 
译 工 序 。 不 管 什么 语言 ， 编 译 器 最 终 翻译 出 来 的 都 是 机 器 指令 。 所 以 在 这 一 点 来 说 ， 汇 编 语 言 编 译 器 纺 
出 来 的 机 器 指令 和 C 编译 器 编译 出 来 的 机 器 指令 无 异 。 

那 为 什么 还 说 汇编 语言 更 快 呢 ? 

我 觉得 应 该 说 汇编 语言 生成 的 指令 数 更 少 ， 从 而 “显得 ”执行 得 快 ， 并 不 是 汇编 语言 本 身 有 多 少 威 
武 霸气 ， 而 是 因为 汇编 语言 本 身 就 是 机 器 指令 的 符号 化 ， 意 思 是 说 ， 一 个 汇编 语言 中 的 符号 对 应 一 个 机 
器 指令 ， 它 们 是 一 一 对 应 的 。 用 汇编 语言 写 程序 就 相当 于 直接 在 写 机 器 指令 ， 汇 编 语 言 编译 器 并 不 会 添 
加 额外 的 语句 ， 因 此 汇编 语言 写 的 程序 会 更 直接 ，CPU 不 会 因 多 执行 一 些 无 关 的 指令 而 浪费 时 间 ， 当 然 
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再 看 看 C 编译 器 为 咀 们 做 了 什么 。 为 了 让 C 程序 员 更 加 方便 地 编程 ，C 编译 器 在 背后 做 了 大 量 的 工 
作 ,， 不 仅 如 此 ， 出 于 通用 性 、 易 用 性 或 者 其 他 方面 的 考虑 ，C 编译 器 往往 会 在 背后 加 入 额外 的 C 语言 代码 
来 支撑 ， 因 此 实际 的 C 代码 量 就 变 得 很 大 。 另 外 在 编译 阶段 ，C 代码 会 率先 被 编译 成 汇编 代码 ， 然 后 再 由 
汇编 器 将 汇编 代码 翻译 成 机 器 指令 ， 由 于 C 代码 已 经 变 得 元 余 了 ， 编 译 出 的 汇编 代码 自然 也 会 元 余 ， 其 
机 器 指令 也 会 多 很 多 。 

大 多 数 人 愿意 用 C 语言 写 程序 是 因为 C 语言 强大 且 更 容易 掌握 。 但 这 份 优势 是 有 代价 的 。C 程序 员 
不 用 考虑 切换 栈 , 不 用 考虑 用 哪个 段 。 这 些 必 须要 考虑 的 事情 , 程序 员 不 考虑 ， 只 好 由 编译 器 帮 着 考虑 了 。 
而 且 为 了 通用 性 、 功 能 ， 甚 至 安全 方面 的 考虑 ， 自 然 在 背后 要 多 写 一 些 代码 。 就 拿 打印 字符 串 来 说 ，C 语 
言 的 printft0， 这 里 面 的 工作 可 多 了 去 了 , 不 仅 要 检查 打印 的 数据 类 型 ,还 要 负责 格式 ， 小数 点 保留 位 数 …… 
而 在 汇编 语言 中 只 要 往 显 存 地 址 处 mov 一 个 字符 就 行 了 ， 字 符 串 也 就 是 多 几 个 mov 操作 而 已 。 您 说 ，C 语 
言 为 了 让 开发 者 用 得 更 ， 自 己 在 背后 做 了 多 少 贡 献 。 

总 结 : 高 级 语言 如 C 语言 为 了 通用 性 等 ， 需 要 兼顾 的 东西 比较 多 ， 往 往 还 加 入 了 一 些 额 外 的 代码 ， 
因此 编译 出 来 的 汇编 代码 比较 多 ， 很 多 部 分 都 是 一 些 周边 功能 ， 并 不 是 直接 起 作用 的 ， 不 如 用 汇编 语言 直接 
写 功能 相关 的 部 分 效果 来 得 更 直接 ,C 语言 被 编译 成 机 器 指令 后 , 生成 的 机 器 指令 当然 也 包括 这 些 额外 的 部 分 ， 
相当 于 多 执行 了 一 些 “ 看 似 没 用 ”的 指令 ， 因 此 会 比 直接 用 汇编 语言 慢 。 
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先 有 的 语言 ， 还 是 先 有 的 编译 器 ， 第 “个 编译 器 是 怎么 产生 的 








首先 肯定 的 是 先 有 的 编程 语言 ， 















































这 个 问题 属于 哲学 中 鸡 生 和 蛋 、 





哪怕 这 个 语言 简单 到 只 有 一 个 符号 。 先 是 设计 好 语言 的 规则 ， 然 后 编写 能 
够 识别 这 套 规 则 的 编译 器 ， 否 则 若 没有 语言 规则 作为 指导 方向 ， 编 译 器 编写 将 无 从 下 笔 。 
第 1 个 编译 器 是 怎么 产生 的 ? 这 个 问题 我 并 没有 求证 ,不 过 可 以 谈 下 自己 的 理解 ,请 大 伙 儿 辩证 地 看 。 








和 蛋 生 鸡 的 问题 ， 











现实 生活 中 这 样 的 例子 太 多 了 。 

































































这 种 思维 回旋 性 质 的 本 源 问题 经 常 让 人 产生 迷惑 。 可 是 

















(1) 英语 老师 教学 生 英 语 ， 学 生成 了 英语 老师 后 又 可 以 教 其 他 学 生 英 语 。 








(2) 写 新 的 书 需 要 参考 其 他 旧书 ， 新 的 书 将 来 又 会 被 更 新 的 书 参 考 ， 就 像 本 书 编写 过 程 





许多 前 辈 的 著作 。 























(3) 用 工具 可 以 制造 工具 ， 被 制造 出 来 的 工具 将 来 又 可 以 千 











(4) 编译 器 可 以 编译 出 新 的 编译 器 。 


























这 种 自己 创造 自己 的 现象 ， 称 为 自 举 
自 举 ? 是 不 是 自己 把 自己 举 起 来 ? 是 










































































果 必 须 有 前 因 ” 的 现象 。 
以 上 前 
(1) 第 一 个 会 英语 的 人 是 谁 教 的 ? 
(2) 第 一 本 书 是 怎样 产生 的 ? 

















(3) 第 一 个 工具 是 如 何 制 造 出 来 的 ? 

















的 ， 人 是 不 能 把 自己 举 起 来 的 ， 这 个 词 很 形象 地 描述 了 这 类 “后 












































一 样 ， 要 参考 
|j 造 新 的 工具 。 



























































三 个 列举 的 都 是 生活 例子 , 似乎 比 第 4 个 更 容易 接受 。 即 使 这 样 , 对 于 前 三 个 例子 大 家 依然 会 有 疑问 。 





其 实 看 到 第 2 个 例子 大 家 就 可 能 明白 了 ,世界 上 的 第 一 本 书 ， 它 的 知识 来 源 肯定 是 人 的 记忆 ， 通 过 向 


























个 人 或 群众 打听 ， 把 大 家 都 认同 的 知识 记录 到 某 个 介质 上 ， 这 样 第 一 本 书 就 出 生 了 。 此 后 再 记录 新 的 知识 






























































时 , 由 于 有 了 这 本 书 的 参考 , 不 需要 重新 再 向 众人 打听 原 有 知识 了 , 从 此 以 后 便 形 成 了 书生 书 的 因果 循环 。 














就 像 先 有 鸡 还 是 先 有 蛋 一 样 ， 












































类 。 人 一 开始 接触 的 便 是 现在 的 鸡 而 不 知道 那个 4 






































从 书 的 例子 可 以 证 明 ， 本 源 问题 中 的 第 一 个 ， 






































都 是 由 其 他 事物 创建 出 来 的 ， 不 是 自己 创造 的 自己 。 




















一 定 是 先 有 其 他 生命 体 ， 这 个 生命 体 不 是 今天 所 说 的 鸡 。 伴 随 这 个 生命 
体 漫长 的 进化 中 ， 突 然 有 一 天 它 有 具备 了 生 蛋 的 能 力 〈 也 许 这 个 蛋 在 最 初 并 不 能 孵化 成 鸡 ， 这 个 生命 体 又 经 
过 漫长 的 进化 ， 最 终 可 以 生出 能 够 退化 成 鸡 的 蛋 )， 于 是 这 个 和 蛋 可 以 生出 鸡 了 。 过 了 很 久之 后 ， 才 有 的 人 
























































上 E 命 体 的 存在 ， 所 以 人 只 知道 鸡 是 由 蛋 生出 来 的 。 
很 容易 让 人 混淆 的 是 编译 C 语言 时 ， 它 先是 被 编译 成 汇编 代码 ， 再 由 汇编 代码 编译 为 机 器 码 ， 这 样 
很 容易 让 人 误 以 为 一 种 语言 是 基于 一 种 更 底层 的 语言 。 



























































似乎 没有 汇编 语言 ，C 语言 就 没有 办 法 编译 一 样 。 拿 gcc 来 说 ， 其 内 部 确实 要 调用 汇编 器 来 完成 汇编 


























语言 到 机 器 码 的 翻译 工作 。 因 为 已 经 有 了 汇编 语言 编译 器 ， 那 何必 浪费 这 个 资源 不 用 ， 自 己 非 要 把 C 语 














言 直接 翻译 成 机 器 码 呢 ， 毕 竟 汇 








晶 器 已 经 无 比 健 由 

















汇编 语言 大 多 了 ， 这 属于 重新 造 轮子 的 行为 。 

曾经 我 就 这 样 问 过 自己 ，PHP 解释 器 是 C 语言 写 的 ，C 编译 器 是 汇编 号 的 〈 这 人 句 话 不 正确 )， 汇 编 是 
谁 写 的 呢 ? 后 来 才 知 道 ， 编 译 器 GCC 其 实 是 用 C 
创造 自己 ,就 像 电 影 超 验 骇 客 一 样 。 当 时 的 思维 似乎 陷入 了 死 循环 一 样 ， 现 在 看 来 这 不 奇怪 。 其 实 编译 器 









































用 什么 语言 号 是 无 所 谓 的 , 关键 是 

















上 了 ， 将 C 直接 变 成 机 器 码 这 个 难度 比 将 C 语言 翻译 为 









































语言 写 的 。 乍 一 听 , 什么 ? 用 C 语言 写 C 编译 器 ? 自己 












































全 | 

















能 编译 出 指令 就 行 了 。 编译 出 的 可 执行 文件 是 要 写 到 磁盘 上 的 , 理论 上 ， 





























只 要 茶 个 进程 ， 无 论 其 是 不 是 编译 器 ， 只 要 















































二 进 制 可 执行 文件 ， 新 复制 出 来 的 文 从 
































其 关于 读 写 文件 的 功能 足够 强大 ， 可 以 往 磁盘 上 写 任 意 内 容 ， 
都 可 以 生成 可 执行 文件 ， 直 接 让 操作 系统 加 载运 行 。 想 象 一 下 ， 用 Python 写 一 个 脚本 ， 功 能 是 复制 一 个 












































执行 文件 ， 它 自然 就 是 可 以 直接 执 












































F 肯 定 是 可 以 执行 的 。 那 Python 脚本 直接 输出 这 样 的 一 个 二 进 制 可 
\ 行 的 ， 完 全 脱离 Python 解释 器 了 。 
编译 器 其 实 就 是 语言 ,因为 编译 器 在 设计 之 初 就 是 先 要 规划 好 某 种 语言 , 根据 这 个 语言 规则 来 写 合适 的 纺 
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译 器 。 所 以 说 ， 要 发 明 一 种 语言 ， 关 键 是 得 写 出 与 之 配套 的 编译 器 ， 这 两 者 是 同时 出 来 的 。 最 初 的 编译 器 肯定 











先 有 的 语言 ， 还 是 先 有 的 编译 器 ， 第 1 个 编译 器 是 怎么 产生 的 








六 


是 简单 粗糙 的 ， 





























且 符 合 规范 ， 有 自己 























码 。 编 程 语言 只 是 文本 ,文本 只 是 ) 





























为 当时 的 编程 语言 肯定 不 完善 ， 顶 多 是 儿 个 符号 而 已 ， 所 以 难以 称 之 为 语言 。 只 有 功能 完善 














套 体系 后 才能 称 之 为 语言 。 不 用 说 ， 这 个 最 初 的 编译 器 肯定 无 法 编译 今天 的 C 语言 代 
] 来 看 的 ， 没 有 执行 能 力 。 最 初 的 编译 器 肯定 是 用 机 器 码 写 出 来 的 。 这 个 编 
译 器 能 识别 文本 ， 可 以 处 理 一 些 符号 关键 字 。 随 着 符号 越 来 越 多 ， 不 断 地 改进 这 个 编译 器 就 是 了 。 

















以 上 的 符号 就 是 编程 语言 。 后 来 这 个 编译 器 支持 的 关键 字 越 来 越 多 了 ， 


也 就 是 这 个 编译 器 支持 的 编程 语言 越发 强大 了 ， 可 以 写 出 一 些 复杂 的 功能 欠 
写 个 新 的 编译 器 ， 这 个 新 的 编译 器 出 生 时 ， 还 是 
有 了 新 的 编译 器 ， 之 后 就 可 以 和 老 的 编 
译 嚣 说 拜拜 了 。 发 明 新 的 编译 器 实际 上 就 是 为 了 能 够 处 理 更 多 的 符号 关键 
也 就 是 又 有 新 的 开发 语言 了， 这 个 语言 可 以 是 全 新 的 ， 也 可 以 是 最 初 的 
这 取决 于 编译 器 的 实现 。 这 个 过 程 不 断 持续 ， 不 断 进化 ， 逐 渐 才 有 了 
今天 的 各 种 语言 解释 器 ， 这 是 个 从 代 的 过 程 。 4 

图 0-8 所 示 这 张 图 片 在 网 络 上 非常 火 ， 它 常常 与 励志 类 的 文字 相关 。 起 。 履 ， 


时 候 ， 干脆 直接 用 这 个 语言 


三 ID 吾 


j 老 的 编译 器 编译 出 来 的 。 只 要 














需要 ) 





4 














一 一 
字 ， 
语言 ， 


初 看 到 这 个 雕像 在 雕刻 自己 时 , 我 着 实 被 感动 了 , 感受 到 的 是 一 种 成 长 之 痛 。 六 
今天 把 它 贴 过 来 的 目的 是 想 告诉 大 家 ， 起 初 的 编译 器 也 是 : 
范 ， 然 而 经 过 不 断 自我 “雕刻 ”， 







































































i 
A 
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他 对 求知 者 的 奉献 。 


下 面 的 内 容 我 参考 了 别人 的 文章 ， 由 于 找 不 到 这 位 大 玫 


























功能 简单 ， 不 成 规 
它 才 有 了 今天 功能 的 完善 。 









4 图 0-8 雕刻 (来源 网 络 ) 














的 署名 ， 只 好 在 此 先 献 上 我 真挚 的 敬意 ， 感 谢 








要 说 到 C 编译 器 的 发 展 , 必须 要 提 到 这 两 位 大 神 一 一 C 语言 之 父 Dennis Ritchie 和 Ken Thompson。Dennis 





和 Ken 在 编程 语言 和 操作 系统 的 深远 贡献 让 他 们 获得 了 计算 机 科学 的 最 高 荣 兴 





得 了 ACM 图 灵 奖 。 





编译 器 是 靠 不 断 学 习 、 积累 才 发 展 起 来 的 , 这 是 自我 学 习 的 过 程 , 下 


























Dennis 和 Ken 于 1983 年 赢 





甸 来 看 看 他 们 是 如 何 让 编译 器 长 大 的 。 



































起 初 的 C 编译 器 中 并 没有 处 理 转 义 字符 ， 为 叙述 方便 ， 我 们 现在 称 之 为 老 编译 器 。 如 果 待 编译 的 代码 文 


件 中 有 字符 串 \， 在 老 编译 器 眼 里 ， 这 就 是 \ 字 符 串 ， 并 不 是 转 义 后 的 单个 字符 \。 





























为 了 表明 编译 器 与 作为 其 





输入 的 代码 文件 的 关系 , 我 们 称 作为 输入 的 代码 文件 为 应 用 程序 文件 ,毕竟 虽然 待 编译 的 代码 文件 实现 了 一 个 











编译 器 ， 但 








在 编译 器 眼 里 ， 


心口 有 旦 个 











序 级 角色 。 








已 人 十 人 应 用 


























例如 ，gcc -c ac 中 ，a.c 就 是 应 用 程序 文件 。 





现在 想 在 编译 器 中 添加 对 转 义 字符 的 支持 , 那 就 需要 修改 老 编译 器 的 源 代码 , 假设 老 编译 器 的 源 代码 





文件 名 为 compile_old.c。 被 修改 后 的 编译 器 代码 ， 已 不 




















compile new a.c, 下 














看 是 修改 后 的 内 容 。 














代码 compile new a.c 


c= next(); 
if(c != \) 
return c; 
c= next(); 
if(c == \) 
return \; 


OHNOMnpAwWN= 























属于 老 编译 器 的 源 代 码 ， 故 我 们 命名 其 文件 名 为 








用 老 编 译 器 将 新 编译 器 的 源 代码 compile_ new_a.c 编译 ， 生 成 可 执行 文件 ， 该 文件 就 是 新 的 编译 器 ， 


我 们 取 名 为 新 编译 器 _a。 为 了 方便 至 























E 清 它们 的 关系 ， 将 它们 列 入 表格 中 。 








编译 器 自身 源 代码 





编译 器 

















应 用 程序 源 代码 


输出 文件 名 








compile old.c 








compile new a.c 


新 编译 器 a， 文 持 '\\' 














这 下 编译 出 来 的 新 编译 器 a 可 以 编译 合 





所 以 此 时 新 编译 器 a 是 无 法 编译 自己 的 源 代码 compile_new_a.c 的 ， 








编译 器 _a 只 认得 \'。 














转 义 字符 \ 的 应 用 程序 代码 了 , 也 就 是 说 , 待 编译 的 文件 (也 
就 是 应 用 程序 代码 ) 中， 应 该 用 \ 来 表示 \。 而 单独 的 字符 \' 在 新 编译 器 _a 中 未 做 处 理 而 无 法 通过 编译 。 



































因为 该 源 文件 中 只 是 单个 \ 字 符 ， 新 





17 


第 0 章 一 些 你 可 能 正 感到 迷惑 的 问题 


先 更 新 它们 的 关系 ， 见 下 表 。 






























































编译 器 自身 源 代码 编译 器 应 用 程序 源 代码 输出 文件 名 
compile_old.c 老 编译 器 compile_new_a.c 新 编译 器 _a， 支 持 '\\' 
compile_new_a.c 新 编译 器 _a compile_new_a.c 编译 失败 

也 就 是 说 ， 现 在 新 编译 器 _a 无 法 编译 自己 的 源 文件 compile new_a.c， 只 有 老 编译 器 才能 编译 它 。 






































分 析 一 下 ， 新 编译 器 _a 无 法 正确 编译 自己 的 源 文件 compile new_a.c， 其 原因 是 compile_new a.c 中 
字符 应 该 用 转 义 字符 的 方式 来 引用 ， 即 所 有 用 \ 的 地 方 都 应 该 替换 为 久 。 再 嗓 嗪 一 下 ， 请 见 新 编译 器 a 的 
源 代 码 compile_new_a.c， 它 只 处 理 了 字符 串 闪 ， 单 个 \ 没 有 对 应 的 处 理 逻 辑 。 下 面 修改 代码 ， 将 新 修改 后 
的 代码 命名 为 compile_new_b.c。 

代码 compile_new_b.c 

















































































































1 Wm 
2 c= next(); 
3 if(c {= W) 
4 return c; 
c= next(); 
6 if(c == \) 
7 return W'; 
8 sé 


其 实 compile new_b.c 只 是 更 新 了 转 义 字符 的 语法 ， 这 是 新 编译 器 a 所 支持 的 新 的 语法 ， 此 文 伯 
是 编译 器 源码 没什么 关系 。 所 以 下 面 还 是 以 新 编译 器 _a 来 编译 新 的 编译 器 。 
用 新 编译 器 _a 编译 此 文件 ， 将 生成 新 编译 器 b， 将 新 的 关系 录入 到 表格 中 。 

















tT 


苹 








































































































编译 器 自身 源 代码 编译 器 应 用 程序 源 代码 输出 文件 名 
compile old.c 老 编译 器 compile new a.c 新 编译 器 _a， 支 持 '\\' 
compile new a.c 新 编译 器 a compile new a.c 编译 失败 
compile new a.c 新 编译 器 _a compile new b.c 新 编译 器 _b， 支持 '\' 

现在 想 加 上 换行 符 \n' 的 支持 。 

1 if(c == 'n') 


2 return \n'; 

由 于 现在 编译 器 还 不 认识 \n'"， 故 这 样 做 肯定 不 行 ， 不 过 可 以 用 其 ASCII 码 来 代替 ， 将 其 命名 为 
compile new_c.c。 

代码 compile_new _c.c 








































































































-- c= next(); 
3 | if(c!=™%) 
4 return c; 
5 c= next(); 
6 if(c ==\) 
7 return V'; 
8 | if(c=='n') 
9 return 10; 
10 i 
用 新 编译 器 _a 来 编译 compile_ new_c.c， 将 生成 新 编译 器 _c。 
编译 器 自身 源 代码 编译 器 应 用 程序 源 代码 输出 文件 名 
compile old.c 老 编译 器 compile new a.c 新 编译 器 _a， 支 持 '\\' 
compile new a.c 新 编译 器 _a compile new a.c 编译 失败 
compile new a.c 新 编译 器 _a compile new b.c 新 编译 器 bp， 支 持 '\' 
compile new a.c 新 编译 器 a compile new c.c 新 编译 器 _c， 间 接 支 持 “\n” 
最 后 再 修改 compile new_c.c 为 compile new_d.c， 将 10 用 '\m' 蔡 代 。 











1 ss 

2 c= next(); 
3 if(c != \\') 

4 return ci; 

5 c= next(); 
6 if(c == \') 
7 return \W'; 

8 if(c == 'n') 
9 return \n'; 

10 


用 新 编译 器 _ c 编译 compile _ new_d.c， 生 成 新 编译 器 d， 将 直接 识别 \n'。 
















































































编译 器 自身 源 代码 编译 器 应 用 程序 源 代码 输出 文件 名 
compile old.c 老 编译 器 compile new a.c 新 编译 器 _a， 支 持 '\\' 
compile new a.c 新 编译 器 _a compile new a.c 编译 失败 
compile new a.c 新 编译 器 _a compile new b.c 新 编译 器 bp， 支持 '\' 
compile new a.c 新 编译 器 _a compile new c.c 新 编译 器 _c， 间 接 支持 “\n” 
compile new c.c 新 编译 器 _c compile new d.c 新 编译 器 9， 直 接 支 持 “\n” 
编译 器 经 过 这 样 不 断 的 训练 ， 功 能 越 来 越 强 大 ， 不 过 体积 也 越 来 越 大 了 。 























区 编译 型 程序 与 解释 型 程序 的 区 别 


解释 型 语言 ， 也 称 为 脚本 语言 ， 如 JavaScript、Python、Perl、PHP、Shell 脚本 等 。 它 们 本 身 是 文本 文 
件 ， 是 茶 个 应 用 程序 的 输入 ， 这 个 应 用 程序 是 脚 本 解释 器 。 
于 只 是 文本 ， 这 些 脚 本 中 的 代码 在 脚本 解释 器 看 来 和 字符 串 无 蜡 。 也 就 是 说 ， 脚 本 中 的 代码 从 来 没 真 
正 上 过 CPU 去 执行 ，CPU 的 cs: ip 寄存 器 从 来 没 指向 过 它们 ， 在 CPU 眼 里 只 看 得 到 脚本 解释 器 ， 而 这 些 
脚本 中 的 代码 ，CPU 从 来 就 不 知道 有 它们 的 存在 。 这 些 脚本 代码 看 似 在 按照 开发 人 员 的 逻辑 执行 ， 本 质 上 
是 脚本 解释 器 在 时 时 分 析 这 个 脚本 ,动态 根据 关键 字 和 语法 来 做 出 相应 的 行为 。 因 此 脚本 中 车 出 现 错误 ， 先 
前 正确 的 部 分 也 会 被 正常 执行 ， 这 和 编译 型 程序 有 很 大 区 别 。 

顺便 猜想 一 下 解释 型 语言 是 如 何 执 行 的 。 我 们 在 执行 一 个 PHP 脚本 时 ， 其 实 就 是 启动 一 个 C 语言 编 
写 出 来 的 解释 器 而 已 ， 这 个 解释 器 就 是 一 个 进程 ， 和 一 般 的 进程 是 没有 区 别 的 ， 只 是 这 个 进程 的 输入 则 是 
这 个 php 脚本 ， 在 php 解释 器 中 ， 这 个 脚本 就 是 个 长 一 些 的 字符 串 ， 根 本 不 是 什么 指令 代码 之 类 。 只 是 这 
种 解释 器 了 解 这 种 语法 ， 按 照 语法 规则 来 输出 罢了 。 
举 个 例子 ， 假 设 下 面 是 文件 名 为 a.php 的 PHP 代码 。 























































































































二 

















































































































































































































<?php 这 是 php 语法 中 的 固定 始 标签 
echo "abcd",; 输出 字符 串 abcd 
?> 固定 结束 标签 


















































PHP 解释 器 分 析 文 本 文件 aphp 时 ， 发 现 里 面 的 echo 关键 字 ， 将 其 后 面 的 参数 获取 后 就 调用 C 语言 中 提供 
的 输出 函数 ， 如 Printf 〈(echo 的 参数 ))。PHP 解释 器 对 于 PHP 脚本 ， 就 相当 于 浏览 器 对 于 JavaScript 一 样 ， 不 
过 这 个 可 完全 是 我 猜测 的 ， 我 不 知道 PHP 解释 器 里 面 的 具体 工作 ， 以 上 为 了 说 清楚 我 的 想法 ， 请 大 家 辩证 地 看 。 

而 编译 型 语言 编译 出 来 的 程序 ， 运行 时 本 身 就 是 一 个 进程 。 它 是 由 操作 系统 直接 调用 的 。 也 就 是 由 操作 系 
统 加 载 到 内 存 后 ， 操 作 系统 将 CS: IP 寄存 器 指向 这 个 程序 的 入 口 ， 使 它 直接 上 CPU 运行 。 总 之 调度 器 在 就 
绪 队 列 中 能 看 到 此 进程 。 而 解释 型 程序 是 无 法 让 调度 器 “入 眼 ” 的 ， 调 度 器 只 会 看 到 该 脚本 语言 的 解释 器 。 


什么 是 大 端 字 节 序 、 小 端 字 节 序 


先 说 一 下 为 什么 会 产生 字 节 序 的 问题 。 
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内 存 是 以 字 贡 为 单位 读 写 的 ， 其 最 小 的 读 写 单位 就 是 字 ? 









































个 每 


了 。 故 如 果 在 内 存 中 只 写 入 








存 的 存储 单元 便 可 将 其 容纳 了 ,只 要 访问 这 一 内 存 地 址 就 能 够 完整 取出 这 1 字 节 。 可 是 1 字 节 要 




















0 一 255( 先 只 考虑 无 
， 定 义 的 数据 


范围 只 有 

们 的 32 位 程序 ! 
占用 8 字 节 。 正 丸 
么 多 个 字 节 该 
存 中 ， 

于 是 就 产生 了 
























































Ar | 


符号 
型 很 多 。1 字 节 的 数据 
Hh 了 新 的 问题 一 样 , 解决 了 数值 
的 数字 必然 要 占用 2 个 字 节 以 上 ， 这 两 个 字 节 ,在 物理 内 
内 存 的 高 地 址 处 ， 还 是 低地 址 处 ? 


类 
解决 了 一 个 问题 又 护 ! 
以 怎样 的 顺序 排放 呢 。 一 个 超过 255 
哪个 在 前 ? 哪个 在 后 ? 拿 0x1234 举例 ， 数 
这 两 种 相反 的 排列 顺序 。 














节 , 一 个 内 


能 够 表示 的 














数 )， 超 过 这 个 范围 的 数 ， 只 好 用 多 个 字 贡 连 在 一 起 来 表示 。 








类 型 只 











有 char 型 ， 像 int 型 要 占 4 字 节 ， 
围 的 问题 ， 那 带 来 的 新 





站 























层 


CC 





寻 此 ， 在 我 
double 型 要 


的 问题 是 这 





























值 中 的 高 位 12 是 放 在 




















字 是 数值 的 低 


了 











ct ot 


9 放 在 内 存 的 











氏 地 址 处 ， 数 值 的 入 放 在 内 存 的 高 地 址 。 











了 
































C1) 小 端 字 
(2) 大 端 字 节 序 是 数 人 
名 7 J 日 


为 了 让 大 家 理 征集 


的 低 






































了 





更 直观 ， 我 在 虚拟 机 bochs 中 操作 一 下 ， 咀 

















是 怎样 存储 的 ， 如 图 0-9 所 示 。 


9 放 在 内 存 的 高 





也 址 。 























也 址 处 ， 数 值 的 入 放 在 内 存 的 低 + 


局 二 

















看 

















上 面 的 b 0x7c00 是 我 在 内 存 的 0x7c00 处 插入 了 一 个 断 点 ， 其 实 这 与 要 说 明 的 问题 无 关 ， 











奇 就 稍 带 说 一 句 ， 医 





























为 0x7c00 是 BIOS 才 





































































































邓 mbr 加 载 到 内 存 后 会 跳 转 过 去 的 地 址 ， 所 以 在 此 处 
















































































下 真正 的 0x12345678 在 内 存 中 





怕 有 同学 好 





能 停 下 来 。 





咱们 只 要 关注 xp/4 0x200000， 这 是 显示 以 物理 内 存 0x200000 开始 处 的 4 个 字 节 ， 可 见 其 为 00、00、00、 
00， 地 址 是 从 左 到 右 逐 渐 升 高 的 ， 其 中 每 一 对 00 就 占用 1 个 字 节 ， 它 们 的 值 都 是 0。 现 在 用 setpmem 命令 
在 该 地 址 处 写 入 0x12345678 后 , 再 用 xp/4 命令 查看 内 存 地 址 0x200000 处 的 内 容 , 可 见 已 经 不 是 4 个 00 了 ， 
| 内 存 的 低地 址 到 高 地 址 ， 依 次 变 成 了 0x78、0x56、0x34、0x12。 这 说 明 bochs 模拟 的 x86 体系 结构 虚拟 
机 是 小 端 字 节 序 ， 即 数值 上 的 低 字 节 0x78 在 物理 内 存 上 的 低地 址 ， 其 他 数值 也 依次 符合 小 端 字 节 序 。 

选择 哪 种 字 节 序 ， 这 是 硬件 厂商 考虑 的 问题 ， 对 于 这 种 二 选 一 的 选择 ， 选 择 了 一 方 的 时 候 ， 就 必然 丢 
了 男 一 方 。 

看 看 这 两 种 字 节 序 的 优势 。 

(1) 小 端 : 因为 低位 在 低 字 节 ， 强 制 转换 数据 型 时 不 需要 再 调整 字 节 了 。 

(2) 大 端 : 有 符号 数 ， 其 字 节 最 高 位 不 仅 表示 数值 本 身 ， 还 起 到 了 符号 的 作用 。 符 号 位 固定 为 第 一 字 
节 ， 也 就 是 最 高 位 占据 最 低地 址 ， 符 号 直接 可 以 取出 来 ， 容 易 判 断 正 负 。 

简要 说 明 一 下 小 端的 优势 。 因 为 在 做 强制 数据 类 型 转换 时 ， 如 果 转 换 是 由 低 精 度 转向 高 精度 ， 这 数值 











本 身 没 什么 变化 , 如 














数值 上 是 不 变 的， 只 是 存储 形式 上 变 了 。 
些 存储 字 节 ， 这 必然 是 要 丢弃 一 部 分 数值 。 编 译 器 的 转换 原则 是 强 于 














只 保留 数值 的 低 字 节 ， 如 














节 位 ， 














<bochs:3> xp/4 OQx200000 
[bochs]: 


x00200000 <bogus+ 
<bochs:4> setpmem OQx200000 4 0x12345678 
<bochs:5> xp/4 OQx200000 
[bochs]: 


:= 


0>: 








short 是 2 字 节 , 将 其 转换 为 4 字 节 的 int 类 型 , 无 非 是 由 















































9x00 


9x78 


图 0-10 所 示 。 


9x00 


9x56 






























































| 转换 到 低 精 度 类 型 ， 于 弃 





0x1234 变 成 了 0x00001234， 
如 果 转 换 是 高 精度 转向 低 精 度 ， 也 就 是 多 个 字 节 的 数值 要 减少 一 


数值 的 高 字 








[work@localhost tmp]$ cat 1.c 
aldli <stdio.h> 
int mainC) { 

unsigned int a = 0x12345678; 


Ox00 Ox00 


return 0; 


} 

[work@localhost tmp]$ ./1 
int 12345678, short 5678 
[work@localhost tmp]$ 


Ox34 0x12 







































































printfC"int %x, short %x\n", a, (short)a); 




































































A 图 0-9 内 存 中 存储 形式 4 图 0-10 “强制 类 型 转换 与 字 节 序 
由 图 0-10 上 输出 可 见 ，0x12345678 由 4 字 节 的 int 型 强制 转向 了 2 字 节 的 short 型 后 ， 只 保留 了 低 字 
节 的 0x5678。 
对 于 大 端的 优势 ， 就 硬件 而 言 ， 就 是 符号 位 的 判断 变 得 方便 了 。 最 高 位 在 最 低地 址 ， 也 就 是 直接 就 可 以 
取 到 了 ， 不 用 再 跨越 几 个 字 节 ， 减 少 了 时 钟 周期 。 另 外 ， 对 于 人 类 来 说 ， 还 是 大 端 看 上 去 顺眼 ， 毕 竟 咱 们 存 
储 0x12345678 到 内 存 时 , 它 在 内 存 中 的 存储 顺序 也 是 0x12345678, 而 不 是 0x78563412, 这 样 看 上 去 才 直 观 。 





办 二 
中 


见 CPU 的 字 节 序 如 下 。 
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(1) 大 端 字 节 序 : IBM、Sun、PowerPC。 

(2) 小 端 字 节 序 : x86、DEC。 

ARM 体系 的 CPU 则 大 小 端 字 节 序 通 吃 ， 具 体 用 哪 类 字 节 序 由 硬件 选择 。 

字 节 序 不 仅 是 在 CPU 访问 内 存 中 的 概念 ， 而 且 也 包括 在 文件 存储 和 网 络 传输 中 。bmp 格式 的 图 片 就 
属于 小 端 字 节 序 ， 而 jpeg 格式 的 图 片 则 为 大 端 字 节 序 ， 这 没什么 可 说 的 ， 采 用 什么 序列 完全 是 开发 者 设 
计 产 品 时 的 需要 。 

网 络 字 节 序 就 是 大 端 字 节 序 ， 所 以 在 x86 架构 上 的 程序 在 发 送 网 络 数据 时 ， 要 转换 字 节 顺序 。 

关于 字 节 序 就 介绍 到 这 里 ， 读 者 若 觉 得 意犹未尽 可 以 自行 查阅 。 






























































































































































到 7 站 米 中 断 、 汪 kk 中断 、 双 一 4 中 断 的 区 别 


在 计算 机 系统 中 ， 无 论 是 在 实 模式 ， 还 是 在 保护 模式 ， 在 任何 情况 下 都 会 有 来 自 外 部 或 内 部 的 事件 发 生 。 
如 果 事 件 来 自 于 CPU 内 部 就 称 为 异常 ， 即 Exception。 例 如 ，CPU 在 计算 算法 时 ， 发 现 分 母 为 0， 就 抛 出 了 除 
0 异常 。 如 果 事 件 来 自 于 外 部 ， 也 就 是 该 事件 由 外 部 设备 发 出 并 通知 了 CPU， 这 个 事件 就 称 为 异常 。 

BIOS 和 DOS 都 是 存在 于 实 模式 下 的 程序 ， 由 它们 建立 的 中 断 调用 都 是 建立 在 中 断 向 量 表 (Interrupt 
Vector Table，IVT) 中 的 。 它 们 都 是 通过 软 中 断 指令 int 中 断 号 来 调用 的 。 
断 向 量 表 中 的 每 个 中 断 向 量 大 小 是 4 字 节 。 这 4 字 节 描述 了 一 个 中 断 处 理 例 程 〈 程 序 ) 的 段 基 址 和 
段 内 偏 移 地 址 。 因 为 中 断 向 量 表 的 长 度 为 1024 字 节 ， 故 该 表 最 多 容纳 256 个 中 断 向 量 处 理 程序 。 计 算 机 
启动 之 初 ， 中 断 向 量 表 中 的 中 断 例 程 是 由 BIOS 建立 的 ， 它 从 物理 内 存 地 址 0x0000 处 初始 化 并 在 中 断 向 
量 表 中 添加 各 种 处 理 例 程 。 
BIOS 中 断 调用 的 主要 功能 是 提供 了 硬件 访问 的 方法 ， 该 方法 使 对 硬件 的 操作 变 得 简单 易 行 。 这 人 句 话 
是 否 也 表明 了 不 通过 BIOS 调用 也 是 可 以 访问 硬件 的 ?必须 是 的 ， 否 则 BIOS 中 断 处 理 程序 又 是 如 何 操作 
硬件 呢 ? 操作 硬件 无 非 是 通过 in/out 指令 来 读 写 外 设 的 端口 ，BIOS 中 断 程序 处 理 是 用 来 操作 硬件 的 ， 故 
该 处 理 程序 中 一 定 到 处 都 是 in/out 指令 。 

BIOS 为 什么 添加 中 断 处 理 例 程 呢 ? 

(1) 给 自己 用 ， 因 为 BIOS 也 是 一 段 程序 ， 是 程序 就 很 可 能 要 重复 性 地 执行 某 段 代码 ， 它 直接 将 其 写 
成 中 断 函 数 ， 直 接 调 用 多 省 心 。 

(2) 给 后 来 的 程序 用 ， 如 加 载 器 或 boot loader。 它 们 在 调 

BIOS 是 如 何 设置 中 断 处 理 程序 的 呢 ? 

BIOS 也 要 调用 别人 的 函数 例 程 。 

BIOS 够 底层 吧 ? 难道 它 还 要 依赖 别人 ? 是 啊 ,， BIOS 也 是 软件 ， 也 要 有 求 于 别人 。 首 先 硬件 厂商 为 了 

让 自己 生产 的 产品 易 用 , 肯定 事先 写 好 了 一 组 调用 接口 , 必然 是 越 简 单 越 好 , 直接 给 接口 函数 传 一 个 参数 ， 
硬件 就 能 返回 一 个 输出 ， 如 果 不 易 用 的 话 ， 厂 商 肯 定 倒闭 了 。 
那 这 些 硬件 自己 的 接口 代码 在 哪里 呢 ? 
每 个 外 设 ， 包 括 显卡 、 键 盘 、 各 种 控制 器 等 ， 都 有 自己 的 内 存 〈 主 板 也 有 自己 的 内 存 ，BIOS 就 存放 
在 里 面 )， 不 过 这 种 内 存 都 是 只 读 存储 器 ROM。 硬 件 自 己 的 功能 调用 例 程 及 初始 化 代码 就 存放 在 这 ROM 
中 。 根 据 规 范 ， 第 1 个 内 存单 元 的 内 容 是 0x55， 第 2 个 存储 单元 是 0xAA， 第 3 个 存储 单位 是 该 rom 中 以 
512 字 节 为 单位 的 代码 长 度 。 从 第 4 个 存储 单元 起 就 是 实际 代码 了 , 直到 第 3 个 存储 单元 所 示 的 长 度 为 止 。 
有 问题 了 ，CPU 如 何 访问 到 外 设 的 ROM 呢 ? 

访问 外 设 有 两 种 方式 。 

(1) 内 存 映射 : 通过 地 址 总 线 将 外 设 自己 的 内 存 映射 到 某 个 内 存 区 域 (并 不 是 映射 到 主板 上 插 的 内 存 条 中 )。 

(2) 端口 操作 : 外 设 都 有 自己 的 控制 器 ,控制 器 上 有 寄存 器 ,这 些 寄存 器 就 是 所 谓 的 端口 ,通过 in/out 
指令 读 写 端 口 来 访问 硬件 的 内 存 。 

控制 显卡 用 的 便 是 内 存 映射 + 端口 操作 的 方式 ， 这 个 以 后 会 在 操作 显卡 时 介绍 。 
























































































































































































































































































































































































































































































































































硬件 资源 时 就 不 需要 自己 重 写 代码 了 。 


Mr 
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从 内 存 的 物理 地 址 0xA0000 开始 到 0xFFFFF 这 部 分 内 存 中 ， 
的 ROM 会 被 映射 到 这 片 内 存 : 
的 工作 。 

0-11 所 示 ，BIOS 在 运行 


存在 ， 硬 件 自己 








这 是 硬件 完成 
如 图 





























部 分 是 专门 用 来 做 映射 的 ， 如 果 硬 件 

















期 间 会 扫 





























的 某 处 ， 至 于 如 何 映射 过 去 的 ， 咀 们 暂时 先 不 要 深入 了 ， 


描 0xC0000 到 0xE0000 之 间 的 内 存 ， 若 在 某 个 区 域 发 现 前 两 个 字 





节 是 0x55 和 0xAA 时 ， 这 意味 着 该 区 域 对 应 的 rom 中 有 代码 存在 ， 再 对 该 区 域 做 累加 和 检查 ， 知 结果 与 第 3 


个 字 节 的 值 相符 ， 说 明代 码 无 误 ， 就 从 第 4 个 字 
最 后 ，BIOS 填写 中 断 向 量 表 ， 


























法 ， 他 们 在 很 久 以 前 就 解决 了 。 有 知道 的 同学 希望 
另外 ， 上 面 说 的 是 BIOS 在 填写 





























节 进 入 。 这 时 开始 执行 了 硬件 




















自 带 的 例 程 以 初始 化 硬件 自身 ， 









































相关 项 ， 使 它们 指向 硬件 自 带 的 例 程 。 
ROM Area 
start end size region/exception description 


Standard usage of the ROM Area 


0x000A0000 0x000BFFFF 128 KiB 


Ox000C0000 Ox000C7FFF 32 KiB (typically) ROM 


video RAM VGA display memory 


Video BIOS 


Ox000C8000 0x000EFFFF 160 KiB (typically) ROMs and unusable space Mapped hardware & Misc. 


0x000F0000 0x000FFFFF 64 KiB 


A 


断 向 量 表 中 第 OH 一 1FH 项 是 BIOS 中 断 


ROM Motherboard BIOS 





0-11 rom area 











有 没有 新 的 疑问 ?外 设 的 内 存 是 如 何 被 昌 


o 




















射 的 ? 我 也 不 知道 , 这 是 早期 硬件 工程 师 们 大 胆 且 天 才 的 做 
























































由 


向 量 表 ， 那 该 表 是 谁 创建 的 呢 ? 答案 就 是 CPU 


你 告诉 我 ， 哈 哈 ， 在 这 里 ， 我 就 先 当 它 是 我 的 公设 了 。 
原生 支持 的 ， 不 用 谁 负 

































































































































































责 创建 。 之 前 我 曾 说 过 , 软件 是 靠 硬件 来 运行 的 , 软件 能 实现 什么 功能 , 很 大 程度 上 取决 于 硬件 提供 了 哪些 支持 。 
软件 中 只 要 执行 int 中断 向 量 号 ，CPU 便 会 把 向 量 号 当 作 下 标 ， 去 中 断 向 量 表 中 定位 中 断 处 理 程序 并 执行 。 
如 果 哪 位 同学 想 查 看 下 BIOS 在 中 断 向 量 表 IVT 中 建立 了 哪些 中 断 例 程 , 可 以 在 虚拟 机 bochs 或 qume 
中 查看 ， 我 在 这 里 贴 个 表 ， 即 表 0-2， 大 家 可 以 先 了 解 下 。 
表 0-2 中 断 向 量 表 
中 断 向 量 中 断 处 理 例 程 地 址 中 断 描 述 

INT# 00 F000:FF53 (0x000fff53) DIVIDE ERROR ; dummy iret 

INT# 01 F000:FF53 (0x000fff53) SINGLE STEP ; dummy iret 

INT# 02 F000:FF53 (0x000fff53) NON-MASKABLE INTERRUPT ; dummy iret 

INT# 03 F000:FF53 (0x000fff53) BREAKPOINT ; dummy iret 

INT# 04 F000:FF53 (0x000fff53) INTO DETECTED OVERFLOW ; dummy iret 

INT# 05 F000:FF53 (0x000fff53) BOUND RANGE EXCEED ; dummy iret 

INT# 06 F000:FF53 (0x000fff53) INVALID OPCODE ; dummy iret 

INT# 07 F000:FF53 (0x000fff53) PROCESSOR EXTENSION NOT AVAILABLE ; dummy iret 

INT# 08 F000:FEA5 (Ox000ffea5) IRQ0 - SYSTEM TIMER 

INT# 09 F000:E987 (0x000fe987) IRQ1 - KEYBOARD DATA READY 

INT# 0a F000:E9DF (Ox000fe9df) IRQ2 - LPT2 

INT# 0b F000:E9DF (Ox000fe9df) IRQ3 - COM2 

INT# 0c F000:E9DF (Ox000fe9df) IRQ4 - COMI 

INT# 0d F000:E9DF (0x000fe9df) IRQ5 - FIXED DISK 

INT# 0e F000:EF57 (0x000fef57) IRQ6 - DISKETTE CONTROLLER 

INT# Of F000:E9DF (0x000fe9df) IRQ7 - PARALLEL PRINTER 

INT# 10 C000:014A (Ox000c014a) VIDEO 

INT# 11 F000:F84D (Ox000ff84d) GET EQUIPMENT LIST 

INT# 12 F000:F841 (OxO00ff841) GET MEMORY SIZE 

INT# 13 F000:E3FE (Ox000fe3fe) DISK 
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中 断 向 量 中 断 处 理 例 程 地 址 中 断 描述 
INT# 14 F000:E739 (0x000fe739) SERIAL 
INT# 15 F000:F859 (0x000ff859) SYSTEM 
INT# 16 F000:E82E (0x000fe82e) KEYBOARD 
INT# 17 F000:EFD2 (0x000fefd2) PRINTER 
INT# 18 F000:969B (0x000f969b) CASETTE BASIC 
INT# 19 F000:E6F2 (Ox000fe6f2) BOOTSTRAP LOADER 
INT# la FOO00:FE6E (0x000ffe6e) TIME 
INT# 1b F000:FF53 (0x000fff53) KEYBOARD - CONTROL-BREAK HANDLER ; dummy iret 
INT# 1c F000:FF53 (0x000fff53) TIME - SYSTEM TIMER TICK ; dummy iret 
INT# 1d 0000:0000 (0x00000000) SYSTEMDATA-VIDEO PARAMETER TABLES 
INT# le F000:EFDE (0x000fefde) SYSTEM DATA - DISKETTE PARAMETERS 
INT# 1f C000:1378 (0x000c1378) SYSTEM DATA - 8x8 GRAPHICS FONT 
INT# 20 F000:FF53 (0x000fff5S3) ; dummy iret 
INT# 21 F000:FF53 (Ox000fff53) ; dummy iret 
INT# 22 F000:FF53 (Ox000fff53) ; dummy iret 
INT# 23 F000:FF53 (Ox000fff53) ; dummy iret 
INT# 24 F000:FF53 (Ox000fff53) ; dummy iret 
INT# 25 F000:FF53 (Ox000fff53) ; dummy iret 
INT# 26 F000:FF53 (0x000fff53) ; dummy iret 
INT# 27 F000:FF53 (Ox000fff53) ; dummy iret 
INT# 28 F000:FF53 (Ox000fff53) ; dummy iret 
INT# 29 F000:FF53 (Ox000fff53) ; dummy iret 
INT# 2a FOO0:FFS53 (Ox000fff53) ; dummy iret 
INT# 2b F000:FF53 (Ox000fff53) ; dummy iret 
INT# 2c FOO0:FFS53 (Ox000fff53) ; dummy iret 
INT# 2d F000:FF53 (Ox000fff53) ; dummy iret 
INT# 2e F000:FF53 (Ox000fff53) ; dummy iret 
INT# 2f F000:FF53 (0x000fff53) ; dummy iret 
INT# 30 FOOO:FFS53 (Ox000fff53) ; dummy iret 
INT# 31 F000:FF53 (Ox000fff53) ; dummy iret 
INT# 32 F000:FF53 (Ox000fff53) ; dummy iret 
INT# 33 F000:FF53 (Ox000fff53) ; dummy iret 
INT# 34 F000:FF53 (Ox000fff53) ; dummy iret 
INT# 35 F000:FF53 (Ox000fff53) ; dummy iret 
INT# 36 F000:FF53 (Ox000fff53) ; dummy iret 
INT# 37 F000:FF53 (Ox000fff53) ; dummy iret 
INT# 38 F000:FF53 (0x000fff53) ; dummy iret 
INT# 39 F000:FF53 (0x000fff5S3) ; dummy iret 
INT# 3a F000:FF53 (Ox000fff53) ; dummy iret 
INT# 3b F000:FF53 (0x000fff53) ; dummy iret 
INT# 3c F000:FF53 (0x000fffS3) ; dummy iret 
INT# 3d F000:FF53 (0x000fff53) ; dummy iret 
INT# 3e F000:FF53 (Ox000fff53) ; dummy iret 
INT# 3f F000:FFS53 (0x000fff53) ; dummy iret 
INT# 40 FE000:EC59 (0x000fec59) 
INT# 41 9FC0:003D (0x0009fc3d) 
INT# 42 F000:FF53 (0x000fff5S3) ; dummy iret 
INT# 43 C000:2578 (Ox000c2578) 
INT# 44 F000:FF53 (Ox000fff53) ; dummy iret 
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第 0 章 一 些 你 可 能 正 感到 迷惑 的 问题 








































































































































































































中 断 向 量 中 断 处 理 例 程 地 址 中 断 描 述 
INT# 45 F000:FF53 (0x000fff53) ; dummy iret 
INT# 46 9FC0:004D (Ox0009fc4d) 
INT# 47 F000:FF53 (0x000fff53) ; dummy iret 
INT# 48 F000:FF53 (0Ox000fff53) ; dummy iret 
INT# 49 F000:FF53 (0Ox000fff53) ; dummy iret 
INT# 4a F000:FF53 (0x000fff53) ; dummy iret 
INT# 4b F000:FF53 (0x000fff53) ; dummy iret 
INT# 4c F000:FF53 (0x000fff53) ; dummy iret 
INT# 4d F000:FF53 (0Ox000fff53) ; dummy iret 
INT# 4e F000:FF53 (0x000fff53) ; dummy iret 
INT# 4f F000:FF53 (0x000fff53) ; dummy iret 
INT# 50 F000:FF53 (0x000fff53) ; dummy iret 
INT# 51 F000:FF53 (0Ox000fff53) ; dummy iret 
INT# 52 F000:FF53 (0x000fff53) ; dummy iret 
INT# 53 F000:FF53 (0x000fff53) ; dummy iret 
INT# 54 F000:FF53 (0x000fff53) ; dummy iret 
INT# 55 F000:FF53 (0Ox000fff53) ; dummy iret 
INT# 56 F000:FF53 (0x000fff53) ; dummy iret 
INT# 57 F000:FF53 (0x000fff53) ; dummy iret 
INT# 58 F000:FF53 (0x000fff53) ; dummy iret 
INT# 59 F000:FF53 (OxOO0OfFF53) ; dummy iret 
INT# 5a F000:FF53 (0x000fff53) ; dummy iret 
INT# 5b F000:FF53 (0x000fff53) ; dummy iret 
INT# 5c F000:FF53 (0x000fff53) ; dummy iret 
INT# 5d F000:FF53 (0x000fff53) ; dummy iret 
INT# 5e F000:FF53 (0x000fff53) ; dummy iret 
INT# 5f F000:FF53 (0x000fff53) ; dummy iret 
INT# 60 0000:0000 (0x00000000) 项 为 空 ， 未 添加 中 断 处 理 例 程 
INT# 61 0000:0000 (0x00000000) 项 为 空 ， 未 添加 中 断 处 理 例 程 
INT# 62 0000:0000 (0x00000000) 项 为 空 ， 未 添加 中 断 处 理 例 程 
INT# 63 0000:0000 (0x00000000) 项 为 空 ， 未 添加 中 断 处 理 例 程 
INT# 64 0000:0000 (0x00000000) 项 为 空 ， 未 添加 中 断 处 理 例 程 
INT# 65 0000:0000 (0x00000000) 项 为 空 ， 未 添加 中 断 处 理 例 程 
INT# 66 0000:0000 (0x00000000) 5 项 为 空 ， 未 添加 中 断 处 理 例 程 
INT# 67 0000:0000 (0x00000000) 项 为 空 ， 未 添加 中 断 处 理 例 程 
INT# 68 F000:FF53 (0x000fff53) ; dummy iret 
INT# 69 F000:FF53 (0Ox000fff53) ; dummy iret 
INT# 6a F000:FF53 (0x000fff53) ; dummy iret 
INT# 6b F000:FF53 (0x000fff53) ; dummy iret 
INT# 6c FOOO0:FFS3 (OxO00fff53) ; dummy iret 
INT# 6d F000:FF53 (0x000fff53) ; dummy iret 
INT# 6e F000:FF53 (0x000fff53) ; dummy iret 
INT# 6f F000:FF53 (0x000fff53) ; dummy iret 
INT# 70 F000:FE93 (0x000ffe93) IRQ8 - CMOS REAL-TIME CLOCK 
INT#71 F000:E9D6 (0x000fe9d6) IRQ9 - REDIRECTED TO INT 0A BY BIOS 
INT# 72 F000:E9E5 (0x000fe9e5) IRQ10 - RESERVED 
INT# 73 F000:E9E5 (0x000fe9e5) IRQ11 - RESERVED 
INT# 74 F000:95C9 (0x000f95c9) IRQ12 - POINTING DEVICE 
































































































































续 表 
中 断 向 量 中 断 处 理 例 程 地 址 中 断 描 述 
INT# 75 F000:E2C7 (0x000fe2c7) IRQ13 - MATH COPROCESSOR EXCEPTION 
IRQ14-HARD DISK CONTROLLER 
INT# 76 F000:9A60 (0x000f9a60) OPERATION COMDLETE 
IRQ15-SECONDARYIDE CONTROLLER 
INT# 77 F000:E9ES (Ox000fe9e5) ODER A ON CO 
INT# 78 0000:0000 (0x00000000) 此 项 为 空 ， 未 添加 中 断 处 理 例 程 
DOS 是 运行 在 实 模式 下 的 , 故 其 建立 的 中 断 调 用 也 建立 在 中 断 向 量 表 中 , 只 不 过 其 中 断 向 量 号 和 BIOS 
的 不 能 冲突 。 
0x20 一 0x27 是 DOS 中 断 。 因 为 DOS 在 实 模式 下 运行 ， 故 其 可 以 调用 BIOS 中 断 。 












































DOS 中 断 只 占用 0x21 这 个 中 断 号 ， 也 就 是 DOS 只 有 这 一 个 中 断 例 程 。 

DOS 中 断 调用 中 那么 多 功能 是 如 何 实现 的 ? 是 通过 先 往 ah 寄存 器 中 写 好 子 功能 号 ， 再 执行 int 0x21。 
这 时 在 中 断 向 量 表 中 第 0x21 个 表 项 ， 即 物理 地 址 0x21*4 处 中 的 中 断 处 理 程序 开始 根据 寄存 器 ah 中 的 值 
来 调用 相应 的 子 功能 。 
而 Linux 内 核 是 在 进入 保护 模式 后 才 建 立 中 断 例 程 的 ， 不 过 在 保护 模式 下 ， 中 断 向 量 表 已 经 不 存在 了 ， 
取而代之 的 是 中 断 描述 符 表 〈Interrupt Descriptor Table，IDT)。 该 表 与 中 断 向 量 表 的 区 别 会 在 讲解 中 断 时 详 
细 介 绍 。 所 以 在 Linux 下 执行 的 中 断 调用 ， 访 问 的 中 断 例 程 是 在 中 断 描述 符 表 中 ， 已 不 在 中 断 向 量 表 里 了 。 

Linux 的 系统 调用 和 DOS 中 断 调 用 类 似 , 不 过 Linux 是 通过 int 0x80 指令 进入 一 个 中 断 程序 后 再 根据 
eax 寄存 器 的 值 来 调用 不 同 的 子 功 能 函数 的 。 再 补充 一 多: 如 果 在 实 模式 下 执行 int 指令 ， 会 自动 去 访问 
中 断 向 量 表 。 如 果 在 保护 模式 下 执行 int 指令 ， 则 会 自动 访问 中 断 描 述 符 表 。 

以 上 主要 对 BIOS 中 断 多 介绍 了 一 点 ， 尽 管 对 DOS 说 得 不 多 , 不 过 有 了 BIOS 中 断 的 表述 ， 相 信和 同学 
们 对 DOS 中 断 调用 也 清楚 了 ， 其 原理 介 于 BIOS 中 断 调 用 和 Linux 中 断 调 用 之 间 。 后 面 在 实现 系统 调用 
时 ， 全 是 基于 Linux 思想 的 ， 所 以 在 此 对 Linux 系统 调用 的 介绍 点 到 为 止 。 


区 me 和 SHOD 半 9 的 区 别 


C 程序 大 体 上 分 为 预 处 理 、 编 译 、 汇 编 和 链接 4 个 阶段 。 预 处 理 阶 段 是 预 处 理 器 将 高 级 语言 中 的 宏 展 

开 ， 去 掉 代码 注释 ， 为 调试 器 添加 行 号 等 。 编 译 阶 段 是 将 预 处 理 后 的 高 级 语言 进行 词法 分 析 、 语 法 分 析 、 
语义 分 析 、 优 化 ， ei 汇编 阶段 是 将 汇编 代码 编译 成 目标 文件 ， 也 就 是 转换 成 了 目标 机 器 
全 下 和民 。 链接 阶段 是 将 目标 文件 连接 成 可 执行 文件 。 这 里 我 们 只 关注 汇编 和 链接 这 两 个 阶段 。 
在 汇编 源码 中 ， 通 常用 语法 关键 字 section 或 segment 来 表示 一 段 区 域 ， 它 们 是 编译 器 提供 的 伪 指 令 ， 作 
用 是 相同 的 ， 都 是 在 程序 中 “逻辑 地 ”规划 一 段 区 域 ， 此 区 域 便 是 节 。 注 意 ， 此 时 所 说 的 section 或 segment 
都 是 汇编 语法 中 的 关键 字 ， 它 们 在 语法 中 都 表示 “ 节 ” 不 是 段 ， 只 是 不 同 编译 器 的 关键 字 不 同 而 已 ， 关 键 字 
segment 在 语法 中 也 被 认为 与 section 意义 相同 。 首 先 汇编 器 根据 语法 规则 ， 会 将 汇编 源码 中 表示 “ 节 ” 的 语法 
关键 字 section 或 segment 在 目标 文件 中 编译 成 “ 节 ” 此 “ 节 ” 便 是 我 们 要 讨论 的 section。 经 过 汇编 生成 目标 
文件 之 后 ， 由 这 些 section 或 segment 修饰 的 程序 区 域 便 成 为 了 “ 节 ”(section)。 但 操作 系统 加 载 程序 时 并 不 关 
心 节 的 数量 和 大 小 ， 操 作 系统 只 关心 节 的 属性 ， 因 为 程序 必然 是 要 加 载 到 内 存 中 才能 运行 的 ， 而 内 存 的 访问 会 
涉及 到 全 局 描述 符 表 中 段 描 述 符 的 访问 权限 等 属性 ,保护 模式 下 对 任何 内 存 的 访问 都 要 经 过 段 描述 符 才 行 。 比 
如 程序 代码 所 在 的 段 描述 符 权 限 属性 必须 是 只 读 , 数据 所 在 的 段 描述 符 的 权限 属性 必然 是 可 读 写 , 程序 中 那些 
只 读 的 节 《〈 比 如 代码 区 域 ) 必然 不 能 指向 可 读 写 的 段 描述 符 ， 同 样 ， 程 序 中 的 数据 也 不 能 用 只 读 权 限 的 段 描述 
符 去 访问 。 如 果 此 时 您 对 段 描述 符 不 了 解 ， 以 后 咱们 在 介绍 保护 模式 下 全 局 描述 表 时 就 明白 了 。 操 作 系统 在 加 
载 程序 时 ， 不 需要 对 逐个 节 进 行 加 载 ， 只 要 给 出 相同 权限 的 节 的 集合 就 行 了 ， 例 如 把 所 有 只 读 可 执行 的 节 〈 如 
代码 节 .text 和 初始 化 代码 节 .init) 归并 到 一 块 ， 所 有 可 读 写 的 节 〈 如 数据 节 .data 和 未 初始 化 节 .bss) 归并 到 
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一 块 ， 这 样 操作 系统 就 


能 为 它们 分 配 不 同 的 段 选择 子 ， 从 而 指向 不 同 段 





苗 述 符 ， 实 现 不 同 的 访问 权限 了 。 为 了 

















程序 能 在 操作 系统 上 运行 ， 
这 个 将 “ 节 ” 合 3 














操作 系统 和 编译 器 需要 相互 配合 ， 此 时 汇编 器 只 生成 了 目标 文件 ， 尚 未 链接 ， 因 此 














F 的 工作 是 由 链接 器 来 完成 的 ， 链 接 器 











秆 目标 文件 中 属性 相同 的 节 合 并 成 一 个 大 的 section 集 


























合 ， 此 集合 便 称 为 segment， 也 就 是 段 ， 此 段 便 是 我 们 平时 所 说 的 可 执行 程序 内 存 空间 中 的 代码 段 和 数据 段 。 





现在 总 结 一 下 。 














section 称 为 节 ， 是 指 在 汇编 源码 中 经 由 关键 字 section 或 segment 修饰 、 逻 辑 划 分 的 指令 或 数据 区 域 ， 











汇编 器 会 将 这 两 个 关键 字 修饰 的 区 域 在 
segment 称 为 段 ， 是 

















标 文 件 中 编译 成 节 ， 也 就 是 说 “ 节 ” 最 初 诞 生 于 目标 文件 中 。 
是 链接 器 根据 目标 文件 中 属性 相同 的 多 个 section 合并 后 的 section 集合 ， 这 个 集合 
































称 为 segment， 也 就 是 段 ， 链 接 器 把 





























标 文 件 链接 成 可 执行 文件 ， 
平时 所 说 的 可 执行 程序 内 存 空 间 中 的 代码 段 和 数据 段 就 是 指 的 segment。 








大 








此 段 最 终 诞生 于 可 执行 文件 中 。 我 们 





























在 大 多 数 情况 下 ， 这 两 者 都 被 混为一谈 ， 现 如 





咱们 做 个 实际 测试 ， 通 过 实验 结果 来 展示 出 这 两 者 的 不 











同 。 其 实用 一 个 测试 样 例 就 能 得 出 结果 ， 不 过 为 J 








备 了 两 个 小 汇编 文件 ， 将 它们 编译 链接 后 ， 我 们 通过 readelf 命令 查看 其 信息 来 入 








消除 大 家 的 疑虑 ， 测 试 得 更 彻底 一 点 ， 在 这 里 给 大 家 准 
出 结论 。 上 菜 了 。 
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文件 1.asm 
[work@localhost test]$ cat 1.asm 
section .bss 
resb 2*32 
section file1data ; 自 定义 的 数据 段 ， 未 使 用 "传统 "的 .data 
strHello db “Hello, world!", OAh 


STRLEN equ $-strHello 


section file1text 


; 自 定义 的 代码 段 ， 未 使 用 "传统 "的 .text 


extern print ; 声明 此 函数 在 别 的 文件 中 ， 
; 告诉 编译 器 在 编译 本 文件 时 找 不 到 此 符号 也 没关系 ， 在 链接 时 会 找到 
global _start ; 链接 器 把 _start 当 作 程 序 的 入 口 
_Start: 
push STRLEN ”; 传人 参数 ， 字 符 串 长 度 
push strHello  ”; 传 入 参数 ， 待 打印 的 字符 串 
call print ; 此 函数 定义 在 2.asm 
;返回 到 系统 
mov ebx, 0 ; 返回 值 4 
mov eax, 1 ; 系统 调用 号 1:sys_exit 
int 0x80 ; 系统 调用 














这 个 汇编 文件 是 在 本 地 中 声明 了 字符 串 ， 并 调用 外 部 的 打印 函数 print,， 大 家 可 以 参考 注释 , 和 弄 个 大 概 


白 就 行 。 


文件 2.asm 








[work@localhost test]$ cat 2.asm 


Section .text 
mov eax , 0x10 
jmp$ 


section file2data 


file2vardb 3 


section file2text 


; 自 定义 的 数据 段 ， 未 使 用 "传统 "的 .data 义 数据 段 


; 自 定义 的 代码 段 ， 未 使 用 "传统 "的 .text 


global print ; 导出 print, 供 其 他 模块 使 用 
print: 

mov edx,[esp+8] ”; 字符 串 长 度 

mov ecx, [esp+4] ”; 字符 串 

mov ebx, 1 

mov eax, 4 ;Sys_write 

intOx80 ; ; 系统 调用 

ret 


在 文件 2.asm 中 声明 了 函数 print。 下 面 将 这 两 个 文件 分 别 编译 成 elf 格式 ， 这 样 方便 我 们 通过 readelf 
来 查看 其 编译 结果 。 开 始 编译 ， 链 接 成 可 执行 文件 12。 


| [work@localhost test]$nasm -f elf 1.asm -o 1.0 















































[work@localhost test]Snasm -f elf 2.asm -o 2.0 
[work@localhost test]$ld 1.0 2.0 -o 12 

















没 问题 ， 再 执行 一 下 。 


[work@localhost test]$ 
Hello, world! 


打印 出 了 Hello，world!， 结 果 正 确 。 让 我 们 用 readelf 查看 下 文件 12 的 头 信息 ， 如 图 0-12 所 示 。 


[work@localhost test]$ readelf -e ./12 








2 

















ELF Header: 
Magic: 7f45 4c 46 01 01 01 00 00 00 00 00 00 00 00 00 
Class: ELF32 
Data: 2's complement, little endian 
Version: 1 (current) 
OSIABI: UNIX - System V 
ABI Version: 0 
Type: EXEC (Executable file) 
Machine: Intel 80386 
Version: Ox1 
Entry point address: 0x8048095 


Start of program headers: 


52 (bytes into file) 


Start of section headers: 276 (bytes into file) 
Flags: Ox0 

Size of this header: 52 (bytes) 

Size of program headers: 32 (bytes) 
Number of program headers: 过 

Size of section headers: 40 (bytes) 
Number of section headers: 10 


Section header string table index: 7 


Section Headers: 


[Nr] Name Type Addr Off Size ES Flg Lk InfAI 
[0] NULL 00000000 000000 00000000 000 
[1] .text PROGBITS 08048080 000080 000007 00 AX 0 016 
[2] file1data PROGBITS 08048087 000087 00000e 00 A001 

readelf 输出 信息 1 

[3]file1text PROGBITS 08048095 000095 00001800 A0 01 

[4] file2data PROGBITS 080480ad 0000ad 00000100 A001 

[ 5] file2text PROGBITS 080480ae 0000ae 00001500 A0 0 1 

[ 6] .bss NOBITS 080490c4 0000c4 000040 00 WA 0 0 4 

[7] .shstrtab STRTAB 00000000 0000c3 00004e00 001 

[8] .symtab SYMTAB 00000000 0002a4 000110 10 9 124 

[9] .strtab STRTAB 00000000 0003b4 00004b00 0 01 

Key to Flags: 


W (write), A (alloc), X (execute), M (merge), S (strings) 
| (info), L (link order), G (group), x (unknown) 
O (extra OS processing required) o (OS specific), p (processor specific) 


Program Headers: 
Type Offset VirtAddr PhysAddr FileSiz MemSiz Flg Align 
LOAD 0x000000 0x08048000 0x08048000 0x000c3 0x000c3 R E 0x1000 
LOAD 0x0000c4 0x080490c4 0x080490c4 0x00000 0x00040 RW 0x1000 


Section to Segment mapping: 

Segment Sections... 
00 .text file1data file1text file2data file2text 
01 .bss 


readelf 输出 信息 2 
全 图 0-12 头 信息 
结果 好 长 ， 为 了 方便 查看 ， 我 对 关键 部 分 加 以 注释 ， 如 图 0-13 和 图 0-14 所 示 。 
在 上 面 重点 部 分 我 都 用 文字 标 出 了 ， 要 注意 section headers 的 部 分 ， 此 部 分 显示 可 执行 文件 中 所 有 的 
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section， 也 包括 我 们 在 两 个 汇编 文件 中 用 关键 字 section 定义 的 部 分 。 从 第 2 个 section 到 第 5 个 section， 
是 1.asm 中 的 自 定义 数据 section: fileldata， 自 定义 代码 section: fileltext 和 2.asm 中 的 自 定 义 数 据 section: 
file2data 和 自 定 义 代 码 section: file2text。 
再 往 下 看 Program Headers 部 分 ， 此 处 一 共有 两 个 段 ， 第 一 个 段 是 我 们 的 代码 段 ， 通 过 其 Flg 值 为 RE 便 可 
推断 ， 只 读 〈Readonly) 可 执行 (Execute)， 其 MemSiz 为 0x000c3。 此 段 对 应 Section to Segment mapping 部 分 
中 的 第 00 个 Segment， 此 segment 中 包括 section: .text fileldata fileltext file2data file2text。 










































































Section Headers: 


[Nr] Name Type Addr Off Size ES Flg Lk InfAl 
[0] NULL 00000000 000000 00000000 0 00 
[1] .text PROGBITS 08048080 000080 000007 00 AX 0 016 


以 下 2、3、4、5 是 需要 关注 的 部 分 ， 这 是 源 程 序 中 定义 的 section 部 分 
可 见 ，elf 中 的 section 部 分 ， 便 是 源 程序 中 定义 的 section 


[2]flle1data PROGBITS 08048087 000087 00000e 00 A0 01 

[3]file1text PROGBITS 08048095 000095 00001800 A0 0 1 

[4] file2data PROGBITS 080480ad 0000ad 00000100 A0 01 

[ 5] file2text PROGBITS 080480ae 0000ae 00001500 A0 01 
下 面 的 输出 暂且 忽略 
[6] .bss NOBITS 080490c4 0000c4 00004000 WA 0 0 4 
[7] .shstrtab STRTAB 00000000 0000c3 00004e00 001 
[8] .symtab SYMTAB 00000000 0002a4 000110 10 912 4 
[9] .strtab STRTAB 00000000 0003b4 00004b 00 0 01 
Key to Flags: 


W (write), A (alloc), X (execute), M (merge), S (strings) 
| (info), L (link order), G (group), x (unknown) 
O (extra OS processing required) o (OS specific), p (processor specific) 


重点 又 来 了 ， 程 序 中 有 两 个 segment， 也 就 是 Program Headers,flg 分 别 是 RE 和 RW, 可 推测 
第 1 个 为 只 读 可 执行 的 代码 段 ， 第 2 个 是 可 读 写 的 数据 段 


Program Headers: 


Type Offset VirtAddr PhysAddr FileSiz MemSiz Flg Align 
LOAD 0x000000 0x08048000 0x08048000 0x000c3 0x000c3 R E 0x1000 
LOAD 0x0000c4 0x080490c4 0x080490c4 0x00000 0x00040 RW 0x1000 


这 里 是 section 映 射 到 segment， 也 就 是 多 个 section 归 并 到 segment 中 
0-13” 节 和 段 








网 





A 





Section to Segment mapping: 

Segment Sections... 
可 见 下 面 在 section header 中 显示 的 节 被 归 入 了 第 1 个 段 ， 也 就 是 上 面 的 flg 为 RE 的 只 读 可 执行 的 代码 段 
左边 这 列 是 segment 号 ， 右 边 这 列 是 左边 segment 中 包含 的 所 有 section 

Segment Sections... 
00 .text file1data file1text file2data file2text 


下 面 这 个 .bss 就 单独 归 为 一 个 段 
01 .bss 











4 图 0-14 ” 节 合 并 到 段 


第 二 个 段 便 是 我 们 的 数据 段 ， 但 此 数据 段 中 只 包含 .bss 节 (section)， 它 用 于 存储 全 局 未 初始 化 数据 ， 
故 其 Flg 必然 可 读 写 ， 其 属性 为 RW。 此 段 MemSiz 大 小 为 0x40， 即 十 进 制 的 64， 可见， 这 和 1.asm 中 定 
义 的 bss 大 小 一 致 , 而 在 2.asm 中 未 定义 .bbs section, 所 以 此 bss 指 的 就 是 1.asm 中 的 定义 。 此 段 对 应 Section 
to Segment mapping 部 分 中 的 第 01 个 Segment， 而 此 segment 只 包括 .bss 节 ， 独 立成 一 个 段 了 。 

到 此 文件 分 析 完 毕 ， 总 结 一 下 。 

自 定义 的 section 名 ， 会 在 elf 的 section header 中 显示 出 来 。 下 面 是 几 个 标准 的 section 〈 节 ) 名 ， 不 
是 segment〈 段 ) 名 ，segment 没有 名 称 。 


节 名 说 明 
.data 用 于 存 入 数据 ， 可 读 可 写 
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于 存 入 代码 ， 只 读 可 执行 
全 局 未 初始 化 区 域 














在 汇编 代码 中 ， 若 以 标准 








中 的 要 求 使 用 














不 管 定义 



































section 内 的 数据 。 











节 名 定义 section， 如 我 们 定义 的 .bss 便 是 标准 节 名 。 编 译 器 会 按照 以 上 说 明 
































segment ! 








,也 就 是 elf 中 说 的 program header ! 

















了 多 少 节 名 ， 最 终 要 把 属性 相同 的 section, 或 者 编译 认为 可 以 放 到 一 块 的 , 合并 到 一 个 大 的 
的 项 。 由 此 可 见 , 某 个 节 (section ) 属于 某 个 段 (segment)， 











段 是 由 节 组 成 的 。 另 外 多 说 一 句 ， 最 终 给 加 载 器 用 的 也 是 program header 中 显示 的 段 , 这 才 是 进程 的 资源 ， 


这 部 分 内 容 将 在 加 载 内 核 时 展开 。 在 第 3 章 ! 


了 解 下 。 
































区 2 什么 是 魔 数 


魔 数 ，magic number， 这 让 一 部 分 人 感觉 到 
搞 迷 惑 了 ， 作 者 你 到 底 想 表达 什么 意思 啊 。 没 错 ， 了 



































不 知道 其 代表 1 
司空 见 惯 的 东西 


所 当然 地 接受 了 。 当 我 向 别人 请 教 一 个 类 似 的 问题 时 ， 如 果 被 回 






















































































迷惑 ， 也 证 另 一 部 分 人 人 迷惑。 哈哈， 两 个 迷惑 ， 把 我 们 都 
其 实 魔 数 的 本 意 就 是 让 人 感到 迷惑 的 数 ， 看 到 某 个 数 ， 
可 意 ， 用 东北 话说 ， 都 蒙 圈 了 。 一 部 分 人 对 这 个 概念 迷惑 的 原因 是 这 有 什么 好 解释 的 ， 一 种 
， 即 使 不 知道 是 怎么 来 的 ， 但 由 于 大 脑 经 常 被 其 训练 ， 对 其 已 经 形成 深刻 的 印象 ， 似 乎 理 
复 “ 这 是 规定 ”时 ， 我 就 很 无 语 。 任 何 规 














介绍 了 section 在 地 址 分 配 上 的 内 容 ， 大 家 有 兴趣 可 以 提前 

































































定 都 是 出 自 于 某 种 
季 ， 季 是 由 season 翻译 

















原因 才 做 






































落 是 一 样 的 ， 这 较 容易 理解 。 
男 一 部 分 人 感到 迷惑 的 原因 是 真心 想 搞 清 楚 概念 是 什么 意思 ， 我 也 属于 这 一 类 。 





















































的 ,很 省 有 规定 是 靠 拍 脑 门 或 抓 痢 决 定 的 。 就 像 国 外 的 电视 剧 , 一 部 称 为 
过 来 的 ， 表 示 季 节 ， 一 个 时 段 。 一 个 季节 过 去 了 ， 这 和 电视 剧 整体 情节 暂 告 一 段 









































的 数据 定义 标签 ， 


秘 力量 。” 


对 魔 数 简单 的 



























































其 实 也 称 为 神奇 数字 ， 我 们 大 多 数 人 是 在 学 习 计算 机 过 程 中 接触 到 这 个 词 的 。 它 被 用 来 为 重要 
独特 的 数字 唯一 地 标识 该 数据 ， 这 种 独特 的 数字 是 只 有 少数 人 才能 掌握 其 奥秘 的 “ 神 




















阐述 就 是 : 不 明 就 理 地 出 现 一 个 数字 ， 不 知道 其 是 什么 意思 ， 感 觉 看 不 透 ， 猜 不 出 ， 就 























像 魔法 一 样 很 神秘 。 了 解 一 定 上 下 文 的 人 肯定 知道 是 什么 意思 ,一 般 局 外 人 绞 尽 脑汁 也 不 解 其 意 。 就 像 小 

















寻 娘 对 着 小 伙 子 们 

















如 果 程 

















| int a = 2014 - 1987; 





根据 直觉 ， 似 乎 这 是 在 求 年 龄 ， 因 为 2014 是 和 现在 很 接近 的 年 份 ， 而 1987 似乎 是 生日 。 但 这 只 是 主 




















出 大 拇指 和 食指 ， 小 伙 子 马上 就 意 会 了 ， 这 是 让 我 晚上 8 点 在 村 口 东边 老 槐 树 下 见 。 
E 施 : 出 现 这 样 的 代码 : 



































观 估计 , 万 一 这 两 个 数字 表示 的 是 这 个 月 和 上 个 月 的 电表 计数 呢 , 人 家 在 查 电费 不 行 吗 …… 修 改 一 下 代码 。 


#define birthday 1987; 
int a = 2014 - birthday; 





由 于 1987 用 了 一 个 宏 代 
故 ， 直接 











如 elf 文件 头 。 


| ELF Header: 


Magic 


了 下 
































， 即 使 变量 名 称 不 改 为 age， 还 叫 作 a， 大 家 也 明确 了 这 是 在 求 年 纪 呢 。 





























45 4c 46 01 01 01 00 00 00 00 00 00 00 00 00 








tH 现 的 一 个 数字 ,只 要 其 意义 不 明确 , 感觉 很 诡异 ,就 称 之 为 魔 数 。 魔 数 应 用 的 地 方太 多 了 ， 

















这 个 Magic 后 面 的 一 长 串 就 是 魔 数 , elf 解析 器 〈 通 常 是 程序 加 载 器 ) 用 它 来 校 验 文件 的 类 型 是 否 是 elf。 



































主 引导 记录 最 后 的 两 个 字 节 的 内 容 是 0x55，0xaa， 这 表明 这 个 扇 








它 来 校 验 该 扇 区 是 否 可 引导 。 


























都 不 像 熟 悉 的 出 生 
还 要 额外 增加 一 些 



























































区 里 面 有 可 加 载 的 程序 ，BIOS 就 用 











青 晰 可 维护 性 强 ， 尽 量 





有 人 说 只 要 为 这 些 数字 赋予 实际 的 意义 不 就 行 了 吗 。 其 实 , 无 论 怎么 给 这 组 陌生 的 数字 赋予 名 称 ， 它 
日 期 那样 直观 易 懂 (如 对 于 19590318， 不 解释 大 家 也 会 知道 0318 是 3 月 18 日 )， 反 而 
内 容 来 解释 ， 得 不 偿 失 ， 所 以 这 就 是 魔 数 不 得 不 存在 的 原因 。 

可 见 ， 计 算 机 中 处 处 是 协议 、 约 定 。 不 过 为 了 程序 意义 》 








还 是 少 用 魔 数 。 
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区 操作 系统 是 如 何 识别 文件 系统 的 














我 们 知道 , 一 个 硬盘 上 可 以 有 很 多 分 
又 能 识别 ext4。 可 能 有 同学 会 说 , 这 两 个 分 区 
可 是 自己 的 东西 也 得 有 个 辨别 的 地 方 ， 否 则 
其 实 这 是 之 前 介绍 过 的 魔 数 的 作用 















































的 文件 系统 都 是 Linux 


和 凭 


， 文件 








区 , 每 个 分 区 的 格式 又 可 以 不 同 ,就 拿 Linux 来 说 , 既 能 识别 ext3， 











自己 专用 的 , 当然 认得 自 























什么 说 “认得 ” 呢 。 


让 3 











系统 也 有 

















都 有 超级 块 ， 一 般 位 于 本 分 区 的 第 2 个 悄 区 ， 
块 的 起 始 扇 区 。 超级 块 里 面 记录 了 此 分 区 的 信 
比 对 此 值 便 


知道 文件 系统 类 型 了 。 

































































己 的 魔 数 ， 魔 数 的 神秘 力量 在 此 施展 了 。 各 分 


己 的 东西 了 。 


区 








比如 车 各 分 区 的 局 
恩 , 其 中 就 有 文件 系统 的 魔 数 , 一 种 文件 系统 对 























区 如 何 控制 的 下 一 条 指令 






































其 实 此 问题 我 一 直 犹 隐 要 不 要 写 出 来 ， 因 为 大 部 人 都 觉 
它 会 按照 程序 的 执行 流程 走 ， 此 问题 
觉得 很 证 异 ， 甚 至 我 觉得 自己 可 能 没 














如 


导 这 个 问题 有 











上 5 





























x 以 0 开始 索引 ， 其 第 1 个 扇 区 便 是 超级 





应 一 个 魔 数 ， 


匪夷所思 ，CPU 是 负责 执行 指令 的 ， 
























































IP 寄存 器 吧 ?” 我 说 :“ 是 啊 ” 他 又 问 : 


“CS 和 了 P 寄存 器 ， 是 

































































个 问题 很 有 意义 ， 上 暗自 对 他 有 些小 敬 1 
是 这 样 的 ， 我们 常 说 的 
个 名 词 在 我 看 来 是 个 概念 级 别 和 


lL 


























， 我 相信 


台 已 
能 | 








很 多 人 都 没 想 过 ，CS 和 卫 能 不 




















的 内 容 ， 它 只 是 CPU ! 

















用 来 表示 下 一 条 指令 的 存放 地 址 ， 








( 体 的 实现 形式 不 





P| 会 有 所 讨论 。 





民 ， 后 国 









































CPU 按照 指令 集 可 以 分 为 很 多 种 ， 由 了 
































注意 啦 , 这 里 的 “不 同 种 类 ”不 是 指 CPU 品 

















sp 


秆 ， 












































如 果 您 对 此 不 了 解 ， 细心 的 我 早已 在 下 硬 














独立 ， 我 专门 将 其 组 织 成 一 个 小 节 供 大 伙 儿 参考 ， 如 果 您 








微 架 构 、 编 程 语言 ”这 一 节 。 














在 x86 体系 结构 的 CPU 中 ， 也 就 是 咱们 大 多 数 人 使 用 








岗 在 感 兴趣 ， 


的 目的 其 实 就 是 想 知道 如 何 牵 着 CPU 的 鼻子 走 。 当 初 我 被 问 这 个 问题 时 也 
里 解 人 家 的 意思 。 后 来 他 这 样 跟 我 说 :“CPU 要 执行 的 下 一 条 指令 是 在 CS: 
] mov 指令 修改 的 吗 ? ”我 听 后 ， 顿 时 觉 
] mov 指令 去 修改 。 

于 存放 下 一 条 指令 地 址 的 寄存 器 称 为 程序 计数 器 PC (Program Counter)。 这 
有 关 下 一 条 指令 存放 地 址 的 统称 ， 也 就 是 说 PC 是 


和 他 这 





PC 只 是 个 概念 ， 所 以 在 不 同 种 类 的 CPU 中 ， 有 不 同 的 实现 。 
EE， 而 是 指 CPU 体系 结构 , 如 INTEL 和 AMD 同 
为 您 准备 好 了 体系 结构 、 指 令 集 的 相关 内 容 。 由 于 此 方面 内 容 较 
可 以 先 参阅 “指令 集 、 





属 x86 构架 ， 


体系 结构 、 








的 INTEL 或 AMD 公司 出 品 的 桌 








四 处 理 器 ， 程 























序 计数 器 PC 并 不 是 单一 的 某 种 寄存 器 ， 它 是 





种 寄存 器 组 














CS 和 了 下 是 CPU 待 执行 的 下 一 条 于 





和 令 的 段 基 








址 和 上 段 内 


























我 想 可 能 的 一 个 原因 
其 中 一 个 会 引起 错 











日 已 人 
是 : mov 指令 


























次 只 能 改变 






































址 ip 处 的 指令 是 正确 的 。 因 此 ， 有 
改 cs 和 记 ， 它 们 在 硬件 级 别 上 实现 了 









































与 x86 不 同 的 是 在 ARM 中 可 以 
的 名 称 在 汇 多 





mov 才 


























专门 改变 执行 
原子 操作 。 
以 上 说 的 是 x86 体系 的 CPU, 其 他 类 型 的 CPU 是 和 


语言 中 是 以 “7 数字 ”的 形式 命名 的 ， 例 如 汇 绢 





怎 











单 的 有 


LA 








[ 编 


合 ， 指 的 段 寄存 器 CS 和 指令 指令 寄 
局 移 地 址 ， 不 能 直接 用 mov 指令 去 改变 它们 ， 

个 寄存 器 ， 不 能 同时 将 cs 和 ip 都 改变 。 如 果 只 改变 了 
误 。 如 改变 了 cs 的 值 后 , 认 的 值 还 是 原先 cs 段 的 偏 移 ， 很 难保 证 新 的 cs 段 内 的 偏 移 地 


i 的 指令 ， 如 jmp、call、int、ret， 这 些 指令 可 


存 器 IP。 


以 同时 修 


EE? 这 就 取决 于 具体 实现 啦 , 咱们 这 里 拿 ARM 
举例 ， 它 的 程序 计数 器 有 个 专门 的 寄存 器 ， 名 字 就 叫 PC， 想 要 改变 程序 流程 ， 直 接 对 该 寄存 器 赋值 便 可 。 
外 令 来 修改 程序 流 ， 在 ARM 体系 CPU 的 



























































容 赋值 给 程序 寄存 器 PC， 这样 就 直接 改变 了 程序 的 执行 流 。 
下 ， 程 序 计数 器 PC 负责 处 理 器 的 执行 方向 ， 
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vv 
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一 口 




















结构 的 CPU 中 有 不 同 的 实现 方法 。 














GAS 





是 什么 ? 表面 上 看 它 是 一 套 指令 的 


集合 。 集 合 的 意思 显而易见 ， 那 只 








器 中 ， 寄 存 器 
家 代码 : mov pc，r0， 表 示 将 寄存 器 r0 中 


的 内 




















是 获取 下 一 条 指令 的 方法 形式 ， 


已 只 


>% 指令 集 、 体 系 结构 、 微 架构 、 编 程 语言 


























们 说 说 什么 是 指 








在 不 同体 系 


令 。 





6 不 是 2 


人 发 


不 同 的 语言 对 同一 种 引 


浆 之 为 狗 ， 


局 | 








为 了 更 好 地 说 明 指 令 人 


恰好 用 

















在 计算 机 中 ，CPU 只 能 识别 0、1 这 两 个 数 ， 甚 至 它 都 不 知道 数 是 什么 ， 它 只 
0、1 来 表示 这 两 种 状态 而 已 。 

















明 的 东西 





逃 不 日 


















































别 出 各 种 不 同 的 声音 和 颜色 不 同 


y dog 





8 人 的 思维 ， 所 以 ， 先 看 看 我 们 人 类 的 
有 物 有 不 同 的 名 字 ， 这 个 名 字 其 实 就 是 
但 在 英文 中 它 被 称 ; t 














语言 是 怎么 回 事 。 


码 。 比 如 说 人 类 的 好 朋友 : 狗 ， 咱 们 在 中 文 里 
i 述 的 都 是 这 种 会 汪汪 


口 



























































， 虽 然 用 





i 
































物 。 人 是 怎样 识别 小 狗 的 呢 ? 识别 信息 来 自 



































两 种 语言 ， 但 ] 由、 对 人 类 无 比 忠 诚 的 动 
上 听觉、 视觉 等 ， 这 是 因为 人 天 生 有 具备 处 理 声 音 和 图 像 的 能 力 ， 能 够 识 























的 





多 
































像 。 可 





是 计算 机 只 能 处 理 0、1 这 两 个 数 ， 所 以 让 计算 机 识别 茶 个 事物 ， 只 

















有 用 01 这 两 个 数 来 定义 。 也 就 是 说 ， 要 用 0、1 来 为 各 种 事物 编码 。 














咱们 











~ 























这 里 不 再 用 现 有 的 语言 举例 子 ， 当 然 也 不 是 要 自 创 指令 集 。 下 面 举 个 简 








可 洒 








单 的 例子 来 演示 指令 集 的 模型 。 











咱们 拿 表 达 式 A=B+C 为 例 。 假设 A、B、C 都 是 内 存 变量 的 值 ， 它 们 的 地 址 分 别 是 0x3000、0x3004、 

















0x3008。 在 此 用 Ra 表示 寄存 器 A，Rb 表示 寄存 器 B，Rc 表示 寄存 器 C。 
完成 这 个 加 法 的 步骤 是 先 将 B 
器 Ra， 之 后 再 将 寄存 器 Ra 的 值 写 入 到 地 址 为 0x3000 的 内 存 中 。 


步骤 有 了 , 
步骤 1: 将 内 存 ! 
































操作 码 


以 上 指令 名 都 是 假设 的 ， 名 字 可 
























































寄存 器 操作 数 1 寄存 器 操作 数 2 
步 又 2; 两 个 寄存 器 的 加 法 指令 ， 假 设 指令 名 为 add。 
步 又 3: 将 寄存 器 中 的 内 容 存储 到 内 存 ， 假 设 指令 名 为 store。 





和 C 载 入 到 Ra 和 Rb 寄存 器 中 ， 再 将 两 个 寄存 器 的 值 相 加 后 送 入 寄存 




















们 再 设计 完成 这 些 步 骤 的 指令 。 
的 数据 载 入 到 寄存 器 ， 咱 们 假设 它 的 指令 名 为 load。 


寡 存 器 操作 数 3 立即 数 











以 任意 取 ， 攻 








为 CPU 不 识别 指令 名 。 指 令 名 是 编译 器 用 来 给 人 看 的 ， 























































































































为 的 是 方便 人 来 编程 ，CPU 它 只 认 编 码 。 目 前 CPU 中 的 指令 ， 无论 是 哪 种 指令 集 ， 都 由 操作 码 和 操作 数 
两 部 分 组 成 《有 些 指令 即使 指令 格式 中 没有 列 出 操作 数 ， 也 会 有 隐 含 的 操作 数 )。 咱 们 也 采用 这 种 操作 码 + 
操作 数 的 思路 ， 分 别 为 这 两 部 分 编码 。 
咱们 先 为 操作 码 设计 编码 。 
操作 码 名 称 二 进 制 编码 
load 00 
add 01 
store 10 
接 下 来 为 操作 数 编码 ， 操 作 数 一 般 是 立即 数 、 寄 存 器 、 内 存 等 ， 咱 们 这 里 主要 是 为 寄存 器 编码 。 
寄存 器 名 称 二 进 制 编码 
Ra 00 
Rb 01 
Rc 10 
好 啦 ， 操 作 码 和 操作 数 都 有 了 ， 其 实 指令 集 已 经 完成 了 。 不 过 在 一 长 串 的 二 进 制 01 中 ， 哪 些 是 操作 码 ， 


哪些 是 操作 数 呢 ? 这 就 是 指令 格式 的 
在 CPU 硬件 





假设 我 们 的 指令 格式 最 大 支持 三 个 寄存 器 参数 和 一 个 立即 数 参数 其 | 














电路 




















来 啦 。 我 们 人 为 规定 个 格式 ， 规 定 操作 码 和 操作 数 的 大 小 及 位 置 ， 然 后 








写 死 这 些 规则 ， 让 CPU 在 硬件 一 级 上 识别 这 些 格式 ， 从 而 能 识别 出 操作 码 和 操作 数 。 






































1 字 节 ， 立 即 数 部 分 占 4 字 节 。 各 条 指令 并 不 是 完全 按照 此 格式 填充 ， 不 同 的 指令 有 不 
作 码 部 分 是 固定 的 ， 其 人 
操作 数 ， 


公 重 西 





令 需 要 什么 样 的 
为 了 演示 指令 集 模型 
了 , 不 过 , 为 方便 咱们 了 解 编译 器 ,不 如 














由 操作 数 部 





这 是 写 死 在 硬件 电路 中 的 ， 所 以 不 同 的 指令 
4， 我 们 在 上 面 假设 了 寄存 器 名 、 指 令 名 、 格 式 。 按 理 说 这 对 于 指令 集 来 说 已 经 全 























操作 码 和 各 寄存 器 操作 数 各 

同 的 参数 ， 只 有 1 
分 是 可 选 的 。 当 CPU 在 译 码 阶段 识别 出 操作 码 后 ，CPU 自然 知道 该 
机 器 码 长 度 很 可 能 不 一 致 。 
























































































































































们 再 假设 个 指令 的 语法 吧 , 





们 这 里 学 习 Intel 的 语法 格式 :“ 指 
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的 操作 数 ， 源 操作 数 ”。 目 
这 种 语序 ， 如 a=b， 便 
























































的 操作 数 在 左 ， 源 操作 数 在 右 ， 此 赋值 顺序 比较 直观 。Intel 想 表达 的 是 a=b 


是 mova，b。 






































































































































以 上 三 个 步骤 的 机 器 码 按照 十 六 进 制 表示 为 : 
步 又 自 定义 的 指令 十 六 进 制 机 器 码 
load Rb,0x3004 000104300000 
r load Re,0x3008 001008300000 
2 add Ra,Rb,Rc 01000110 
3 store Ox300c,Ra 10000c300000 
以 上 自 定义 的 指令 便 是 按照 咱们 假设 的 语法 来 生成 的 。 对 于 机 器 码 的 大 小 ， 由 于 指令 不 同 ,需要 的 操 
作 数 也 不 同 ， 所 以 机 器 码 大 小 也 不 同 。 另外， 机 器 码 中 的 立即 数 是 按照 x86 架构 的 小 端 字 节 序 写 的 ， 这 
点 大 家 要 注意 。 小 端 字 节 序 是 数值 中 的 低位 在 低地 址 ， 高 位 在 高 地 址 ， 数 位 以 字 节 为 单位 。 前 面 有 一 小 节 
说 明 大 小 端 字 节 序 问 题 。 


步骤 2 的 机 器 码 为 01 00 01 10。 操 作 码 占 工 字 节 ，CPU 识别 出 第 1 字 节 的 二 进 制 01 是 add 指令 ， 知 





道 此 指令 的 操作 数 是 3 个 寄存 器 , 














都 是 我 们 假定 的 ， 并 且 是 写 死 在 硬 伯 
合作 为 操作 数 的 加 法 指令 )。 于 是 到 第 2 字 节 去 读 取 寄存 嚣 编 














且 第 1 个 寄存 器 操作 数 是 目 
F 中 的 规则 ,不 同 的 指令 有 不 














应 的 编码 。 接 着 到 下 


























个 字 节 处 继续 
将 寄存 器 Rb 和 Re 的 值 相 加 后 存 入 至 





的 寄存 器 , 男 外 两 个 寄存 器 是 源 操作 数 ( 这 








同 的 规则 ， 您 也 可 以 创造 出 内 存 和 寄存 器 混 




















码 ， 





发 现 其 值 为 二 进 制 00， 就 是 寄存 器 Ra 对 











前 码 ， 发 现 是 二 





读 出 寄存 器 9 
| 寄存 器 Ra。 





步骤 3 中 ， 机 器 码 为 10 00 0c300000，CPU 


令 store， 于 是 便 确 定 了 ， 月 























部 分 便 作为 立即 数 ， 这 样 便 ; 





和 寄存 器 Ra 


























以 上 指令 集 的 模型 ， 确 
得 多 。 下 面 我 们 看 看 目前 世面 



































实 太 过 
上 的 指令 集 








卓 


读 取 机 器 码 的 第 1 字 节 发 现 其 为 二 进 
的 操作 数 是 个 立即 数 形式 的 内 存 地 址 ， 源 操作 数 是 个 寄存 器 。 接 着 到 
中 的 寄存 器 操作 数 1 的 位 置 去 读 取 寄存 器 编码 ， 发 现 其 值 为 00， 这 就 是 寄存 器 Ra 的 编码 。 机 器 码 ! 
的 值 写 入 到 内 存 0x0000300c 中 了 。 

简单 了 ， 也 许 称 之 为 模型 都 非常 勉强 。 现 实 中 的 指令 格式 
有 哪些 。 
































进 制 01， 也 就 是 寄存 器 Rb，Rc 同 理 。 于 是 

















制 10， 知 道 其 为 指 
间 令 格式 
剩 下 的 






































EE, 





最 早 的 指令 集 是 CISC (Complex Instruction Set Computer)， 意 为 复杂 指令 集 计算 机 。 从 名 字 上 看 ， 这 














了 相对 精简 高 效 的 指令 















































CISC 和 RISC 并 不 是 














套 指令 集 相当 复杂 ， 当 初 这 套 指 令 集 问世 日 
集 ， 所 以 人 们 为 了 加 以 区 分 ， 
后 来 精简 高 效 的 指令 集 称 为 RISC (Reduced Instruction Set Computer ) 。 
着 ， 而 是 两 种 不 同 的 指令 体系 ， 相 当 于 指令 


马公 
中 令 细 


人 体 的 # 











的 时 候 ， 它 的 研发 者 们 都 没 想 过 要 给 它 起 名 ， 
才 将 最 初 的 这 套 相 














设计 思想 。 举 个 例子 ， 就 像 中 医 与 
































西医 ， 中 医 讲究 从 整体 
两 种 不 同 的 医疗 思路 ， 类 似 于 CISC 和 RISC 这 两 种 指令 体 丰 


























日 、 
人 二 大 3 


的 指令 集 命名 为 CISC， 而 


日 六 未 遇 











对 复杂 





集中 的 门派 ， 是 指令 的 




















EE: 调 理 





身体 ， 西 医 则 更 多 的 是 偏向 局 部 。 这 就 是 











No 






































那 什么 是 指令 集 呢 ? 拿 中 医 举例 ， 像 华 伦 、 













































































张仲景 这 两 位 医 圣 ， 他 们 虽然 都 是 基于 中 医 的 思想 治 病 ， 但 
不 同 的 指令 集 。 一 会 儿 咀 们 会 介绍 具体 的 指令 集 。 








为 什么 说 CISC 复杂 呢 ? 
首先 ， 入 为 
都 是 用 汇编 语言 开发 程 








7 日 .上 电 















































序 ， 他 们 当然 希望 汇 乡 


它 是 最 早 的 指令 集 ， 当 初 都 是 摸 着 石头 过 河 ， 肯 





医术 各 有 特色 ， 水 平 也 不 尽 相 同 ， 这 就 相当 于 








人 人 
人 





有 一 些 瑕 竟 在 里 面 。 其次， 当初 的 程序 
































y 








， 所 以 指令 集中 的 指令 越 来 越 多 ， 


越 来 越 复杂 。 











p 








Intel 公司 











| 的 指令 集 ， 





兼容 性 方面 














使 
以 











| 
至 











于 最 后 的 指令 集 变 得 有 点 “ 奇 








乡 怪 


状 二 二 

















作为 后 起 之 秀 的 RISC, ff 
是 怎么 来 的 呢 ? 





























CISC 不 是 做 得 很 全 很 强 吗 ， 可 是 4 
译 器 有 时 候 为 了 优化 ， 未 必 “ 全 ”将 其 























到 了 ， 编 
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鉴 了 前 辈 CISC 的 经 验 ， 取 其 





做 得 最 好 ， 指 


恨 多 时 候 ， 


有 语言 强大 啦 ， 尺 量 多 一 些 指令 ， 尺 
的 好 处 是 程序 员 同 学 很 爽 。 最 后 ，CISC 是 Intel 


不 过 这 样 


仿 集 








量 一 个 指令 能 多 干 几 件 
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在 发 展 


的 过 程 





， 还 要 兼容 过 去 有 瑕 疯 的 古董 
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糟粕 ， 当 然 要 更 好 更 轻 量 啦 。 它 
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] 到 那些 复杂 的 指令 和 寻 址 方式 ， 即 使 用 












































编译 为 复杂 的 





区 式 。 这 就 导致 CPU 中 的 复杂 的 指令 和 





寻 址 方式 无 用 武之 地 。 根 据 二 八 定律 ， 指 令 集中 20% 的 简单 指令 占 了 程序 的 80%， 而 指令 集中 80% 的 复 
杂 指 令 占 了 程序 的 20%。 根据 这 个 特性 ， 处 理 器 及 指令 集 被 重新 设计 ,保留 了 那些 基本 常用 的 指令 ,减少 
了 硬件 电路 的 复杂 性 。 这样， 大 部 分 指令 都 能 在 一 个 时 钟 周 期 内 完成 , 更 有 利于 提升 流水 线 的 效率 。 而 且 ， 
指令 采用 了 定 长 编码 ， 这 样 译 码 工作 更 容易 了 。 由 于 其 太 优 秀 了 ， 后 来 的 处 理 器 ， 如 MIPS, ARM,， Power 
都 采用 RISC 指令 体系 ， 做 得 最 好 的 就 是 MIPS 处 理 器 ， 它 严格 遵守 RISC 思想 ， 业 界 公 认 其 优雅 。 

我 们 常用 的 CPU 是 Intel 和 AMD 公司 的 产品 ， 它 们 用 的 指令 集 便 是 基于 CISC 思想 的 x86。AMD 的 x86 
指令 架构 是 Intel 授权 给 他 们 的 ， 为 区 别 于 此 ，Intel 在 官方 手册 上 称 自 己 的 指令 集 为 IA32。 

虽然 AMD 采用 的 也 是 x86 指令 集 , 但 Intel 可 没 把 硬件 实现 方法 也 告诉 AMD, 否则 AMD 的 CPU 和 
Intel 的 CPU 不 就 完全 一 样 了 吗 ， 人 家 Intel 也 不 肯 呢 。 指 令 集 是 一 套 约 定 ， 里 面 规定 的 是 有 哪些 指令 、 指 
令 的 二 进 制 编码 、 指 令 格式 等 ， 如 何 实现 这 套 约定 ， 这 是 硬件 自己 的 事 。 打 个 比方 ， 这 就 像 和 朋友 约 好 了 
在 某 餐 厅 吃 饭 ， 咱 是 坐车 去 ， 还 是 走 着 去 ， 这 是 咱们 的 事 ， 与 吃饭 是 无 关 的 。 说 白 了 ， 在 Intel 的 CPU 上 
运行 的 软件 也 能 够 在 AMD 的 CPU 上 运行 ， 原 因 就 是 它们 共用 了 同 用 一 套 指 令 集 ， 也 就 是 对 二 进 制 编码 
达成 了 共识 。 它 们 面 对 相 同 的 需求 , 可 能 采取 了 不 同 的 行动 , 但 都 完成 了 任务 。 比 如 机 器 码 是 bg80000, Intel 
的 CPU 经 过 译 码 ， 知 道 这 是 将 0 赋值 给 寄存 器 ax， 相 当 于 汇编 语言 mov ax，0。AMD 的 CPU 在 译 码 时 ， 
也 得 将 此 机 器 码 认为 是 将 0 赋值 给 寄存 器 ax。 至 于 它们 在 物理 上 是 怎么 将 0 传 入 寄存 器 ax 中 的 ， 这 是 它 
们 各 自 实现 的 方式 ， 与 指令 集 无 关 。 它 们 各 自 实现 的 方式 ， 就 叫 微 架 构 。 

总 结 一 下 ， 指 令 集 是 具体 的 一 套 指令 编码 ， 微 架构 是 指令 集 的 物理 实现 方式 。 

发 展 到 后 来 ，x86 指令 集 越 来 越 复杂 。 它 本 属于 CISC 体系 ， 但 由 于 效率 低下 ， 最 终 在 其 内 部 实现 上 采取 
了 RISC 内 核 ， 即 一 条 CISC 指令 在 译 码 时 ， 分 解 成 多 条 RISC 指令 ， 这 样 其 执行 效率 便 可 与 RISC 媲美 啦 。 

目前 市 面 上 常见 的 指令 集 有 五 种 ， 除 x86 是 CISC 指令 体系 外 ，ARM、MIPS、Power、C6000 都 是 
RISC 指令 体系 的 指令 外 

CPU 与 指令 集 是 对 应 的 ,一 种 CPU 只 能 识别 一 种 指令 集 , 所 以 很 多 CPU 都 以 其 支持 的 指令 集 来 称呼 。 
比如 ARM、MIPS， 它 们 本 身 是 CPU 名 称 ， 又 是 指令 集 名 称 。 

ARM 主要 用 在 手机 中 ， 作 为 手机 的 处 理 器 。Power 是 IBM 用 于 服务 器 上 的 处 理 器 。C6000 是 数字 信号 处 
理 器 ， 广 泛 用 于 视频 处 理 。 而 MIPS 虽然 本 身 很 优秀 ， 但 其 在 各 领域 起 步 都 较 晚 ， 并 没有 广泛 应 用 的 领域 。 
于 MIPS 本 身 的 优越 性 ， 龙 芯 用 的 就 是 mips 指令 集 ， 有 没有 人 问 ， 为 什么 咱们 自主 研发 的 CPU 还 要 
用 人 家 国外 的 指令 集 ? 就 不 能 也 研发 出 一 套 指令 集 吗 ? 能 倒是 能 , 不 过 语言 不 通用 。 就 像 我 自己 可 以 发 明 一 
门 语言 ， 语 言 本 身 没什么 问题 ， 问 题 是 我 用 自己 发 明 的 语言 和 别人 交流 ， 谁 听 得 懂 呢 ， 谁 又 愿意 去 学 这 门 语 
言 呢 ? 大 家 都 很 忙 ,不 通用 的 东西 没 人 愿意 花 精力 去 学 。 如 果 龙 蕊 也 自立 门户 创造 新 的 指令 集 ， 那 有 谁 愿意 
给 它 写 编译 器 呢 ? 即 使 有 了 编译 器 ， 操 作 系 统 也 要 重新 编译 发 布 ， 应 用 程序 也 要 重新 编译 发 布 ， 指 令 集 背后 
不 仅 是 个 计算 机 生态 链 ， 更 重要 的 是 全 球 经 济 链 。 

平时 所 说 的 编程 语言 ， 虽 然 其 上 层 表 现 各 异 ， 归 根 结 底 是 要 在 具体 的 CPU 上 运行 的 ， 所 以 必须 由 编 
译 器 按照 该 CPU 的 指令 集 ， 翻 译 成 符合 该 CPU 的 指令 。 说 到 这 ， 不 得 不 说 一 下 交叉 编译 ， 本 质 上 交叉 编 
译 就 是 用 在 A 平台 上 运行 的 编译 器 , 编译 出 符合 B 平台 CPU 指令 集 的 程序 , 编译 出 的 程序 直接 能 在 B 3 
上 运行 啦 。 这 里 的 平台 指 的 就 是 CPU 指令 体系 结构 。 
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在 讨论 此 问题 之 前 , 我 们 应 该 明白 此 问题 的 始作俑者 是 操作 系统 本 里 。 我 们 用 了 操作 系统 ， 就 理应 遵 
守 它 的 规范 。 任何 操作 系统 都 有 自己 的 一 套 做 事 规则 , 在 其 上 的 所 有 应 用 程序 , 都 按照 它 定 下 的 规矩 做 事 。 

我 们 讨论 的 环境 是 Linux， 所 以 ， 以 下 所 有 的 内 容 都 是 在 Linux 系统 的 规则 之 中 讨论 ， 我 们 所 讨论 的 
内 容 便 是 搞 清楚 这 些 规则 。 
在 Linux 下 C 编 程 时 ,我 们 写 的 程序 通常 是 用 户 级 程序 ,为 了 输出 文本 ,我 们 一 般 会 在 文件 开始 include 
<stdio.h>， 这 样 程序 就 可 以 使 用 printf 这 样 的 函数 完成 打印 输出 。 这 背后 的 原理 是 什么 ? 为 什么 简单 包含 
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stdio.h 后 就 能 够 打印 字符 呢 ? 

揭晓 这 些 答案 必须 要 交待 一 个 事实 ,用 户 程序 不 具备 独立 打印 字符 的 功能 ,， 它 必须 借助 操作 系统 的 力 
量 才 可 以 ， 如 何 借 助 呢 ? 操作 系统 提供 了 一 套 系 统 调用 接口 ， 用 户 进程 直接 调用 这 些 接口 就 行 啦 。 简 单 来 
说 ， 接 口 就 是 某 个 功能 模块 的 入 口 ， 通 过 接口 给 该 模块 一 个 输入 ， 它 就 返回 一 个 输出 ， 模 块 内 部 实现 的 过 
程 就 像 个 黑 盒 子 一 样 ， 咱 们 看 不 到 ， 也 无 需 关 心 。 我 们 能 够 打印 字符 的 原因 就 是 调用 了 系统 调用 ， 但 是 大 
家 确实 没有 亲手 写 下 调用 系统 调用 的 代码 《后面 章节 会 说 )， 这 就 是 库 函 数 的 功劳 ， 它 帮 你 写 下 了 这 些 。 
但 我 们 并 没有 看 到 库 函 数 的 实现 ,我 们 只 是 包含 了 所 需要 的 库 函 数 所 在 的 头 文件 ， 该 头 文件 中 有 这 样 
一 句 函 数 的 声明 。 比 如 printf 函数 所 在 的 头 文件 是 stdio.h, 该 文件 位 于 磁盘 /usr/include/ 目 录 下 , 其 中 第 361 
行 是 对 printf 的 声明 。 
| 


extern int printf ( const char * restrict format,...); 
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意 上 面 括号 中 的 “.…” 不 是 我 人 为 加 上 的 省 略 号 ， 并 不 是 函数 声明 太 长 我 省 略 了 ， 这 是 变 长 参数 的 
语法 。 有 了 这 人 句 声明 ， 咱 们 可 以 直接 把 它 贴 在 调用 printf 的 文件 中 就 可 以 啦 ， 不 用 把 整个 stdio.h 包含 进来 
了 ， 毕 竞 里 面 声明 的 函数 太 多 了 ，stdio.h 文件 共 942 行 ， 无 关 的 内 容 太 多 会 给 我 们 带 来 困扰 。 

头 文件 被 包含 进来 后 ， 其 内 容 也 是 原样 被 展开 到 include 所 在 的 位 置 ， 就 是 把 整个 头 文件 中 的 内 容 挪 
了 过 来 ， 所 以 在 头 文件 中 的 内 容 是 什么 都 可 以 ， 未 必 一 定 要 是 函数 声明 ,你 愿意 的 话 完全 可 以 把 函数 定义 
在 头 文 件 中 ， 而 且 也 可 以 不 用 .h 作为 文件 名 。 来 ， 咱 们 做 个 实验 。 


func_inc.d 


















































































































































































































































1 void myfunc (char* str){ 
2 printf (str); 
3 


您 看 ， 我们 的 测试 文件 名 为 func_inc.d， 它 甚至 都 不 是 以 .c 结尾 的 。 说 明 include 指令 不 关心 所 包含 的 
文件 名 是 喻 ， 只 是 原 方 不 动 地 将 所 包含 的 文件 内 容 在 此 处 展开 。 它 只 包含 这 三 行 代码 。 再 看 函数 main.c。 


main.C 


extern int Printf (_ const char * restrict _ format, ...); 
#include "func inc.d" 


















































下 

2 

3 

4 void main() { 

5 myfunc ("hello world\n"); 
6 1 


main.c 中 第 1 行 声明 了 外 部 函 所 | 数 printf, 平时 我 [work@localhost tmp]$ cat -n func_inc.d 


1 void myfuncCchar* str){ 









































们 include <stdio.h> 就 是 这 个 目的 , 只 不 过 咱们 这 里 2 printfCstr); 
ER 
让 其 精简 下 [work@localhost tmp]$ cat -n main.c 
人 人 了 1 extern int printf (__const char *_restrict __format, ...); 
家 2 行将 func _inc.d 包含 i 进来 ， 之 后 第 4 一 0 行 i 周 #include "func_inc.d" 








2 
3 
4 


用 定义 在 func_inc.d 中 的 myfunc 函数 进行 打印 。 void moinO { 
不 说 别 的 ， 先 看 执行 结果 ， 如 图 0-15 所 示 。 RS 
为 了 证 明 include 指令 确实 与 所 包含 的 文件 名 ten 
无 关 ， 咱 们 看 看 预 处 理 后 的 文件 内 容 。gcc 编译 时 pie | 
加 -E 参数 就 可 以 获取 预 处 理 后 的 文件 内 容 。 4 图 0-15 包含 其 他 文件 运行 结果 


[work@localhost tmp]$ gcc -E main.c 
# 1 "main.c" 
# 1 "<built-in>" 
# 1 "< 命令 行 >" 
# 1 "main.c" 
extern int printf ( const char * restrict format, ...); 
# 1 "func inc.d" 1 
void myfunc (char* str){ 
printf(stre); 
} 


# 3 "main.c" 2 



































































































































void main() { 
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myfunc("hello world\n"); 
} 
[work@localhost tmp]$ 


您 看 到 了 ， 确 实 include 功能 只 是 将 文件 搬运 过 来 。 另 外 说 明 一 下 ， 如 果 main.c 中 添加 了 
include<stdio.h>， 此 处 通过 -E 生成 的 文件 可 老 长 了 ， 所 以 咱们 只 加 了 printf 函数 的 声明 。 

到 现在 为 止 ， 似 乎 还 没有 进入 正题 ， 只 是 想 告诉 大 家 头 文 件 中 可 以 写 任何 内 容 ， 甚 至 是 函数 体 。 

一 下 子 就 进入 正题 了 ， 再 交待 另外 一 个 事实 ， 函 数 一 定 要 有 函数 体 才 能 被 调用 ， 必 须 有 相应 的 函数 实 
现 ， 仅 仅 赁 个 头 文件 中 的 声明 肯定 是 不 行 的 。 

如 果 在 头 文件 中 定义 的 是 printf 函数 的 实现 ， 也 许 就 容易 理解 头 文件 帮 有 我 们 做 了 什么 ， 可 是 事实 不 是 
这 样 的 ， 头 文件 中 一 般 仅 仅 有 函数 声明 ， 这 个 声明 告诉 编译 器 至 少 两 件 事 。 

(1) 函数 返回 值 类 型 、 参 数 类 型 及 个 数 ， 用 来 确定 分 配 的 栈 空间 。 

(2) 该 函数 是 外 部 函数 ， 定 义 在 其 他 文件 ， 现 在 无 法 为 其 分 配 地 址 ， 需 要 在 链接 阶段 将 该 函数 体 所 在 
的 目标 文件 一 同 链接 时 再 安排 地 址 。 

这 第 二 件 事 是 我 们 所 说 的 重点 。 

如 果 预 处 理 后 , 主 调 函 数 所 在 的 文件 中 找 不 到 所 调用 函数 的 函数 体 , 一 定 要 在 链接 阶段 把 该 函数 体 所 
在 的 目标 文件 链接 进来 ， 否 则 程序 在 道理 上 都 讲 不 通 ， 怎 么 能 通过 编译 呢 。 

您 看 到 了 ，main.c 中 我 把 func_inc.d 包含 进来 ，include 后 面 并 不 是 尖 括 号 而 是 双 引 号 “? ” 这 用 的 是 自 定 
义 文件 的 包含 ， 并 不 是 包含 标准 文件 (也 就 是 平时 我 们 所 说 的 标准 库 头 文件 )。 如 果 用 了 尖 括 号 ， 系 统 就 会 到 默 
认 路 径 下 去 搜索 该 头 文件 。 搜索 到 头 文件 后 , 找到 其 中 被 调 函 数 的 声明 , 再 到 另 一 默认 文件 中 找 该 函数 体 的 实现 。 

另 一 默认 文件 ， 按 理 来 说 应 该 是 目标 文件 。 它 到 底 在 哪里 呢 ? 

gcc 编译 时 加 -v 参数 会 将 编译 、 链 接 两 个 过 程 详细 地 打印 出 来 ， 如 图 0-16 所 示 。 

-quiet -v main.c -quiet -dumpbase main.c -mtune= 


generic -march=i686 -auxbase main -version Yo /tmp/ccymR62K.s 
忽略 不 存在 的 目录 “/usr/lib/gcc/i686-redhat-lihux/4.4.6/include-fixed” 
忽略 不 存在 的 目录 “/usr/1ib/gcc/i686-redhat-linux/ 6/../../../../i686-redhat-linux/include” 
#include "...” 搜 索 从 这 里 开始 : 
#include <...> 搜索 从 这 里 开始 
/usrVLocaUVinclude 
/usrVLib/gcc/i686-redhat-lLinuxV4.4.6/include 
/usr/include 
搜索 列表 结束 。 
GNU C (GCC) 版 本 4.4.6 20120305 (Red Hat 4.4.6-4) (i686-redhat-linux) 
由 GNUC 版 本 4.4.6 20120305 (Red Hat 4.4.6-4) 编译 ，GMP 版 本 4.3.1，MPFR 版 本 2.4.1。 
GGC 准则 : --param ggc-min-expand=72 --param ggc-min-heapsize=79701 
Compiler executable checksum: c1037dbb624d1c27b2bd8b15ebffbe8b 
COLLECT_GCC_OPTIONS=" -v' i i 
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GNU rs version 2.20.51.0.2 (1686- TEL linux) using BFD version version 2.20.51.0.2-5. 
34.e16 20100205 
COMPILER_PATH=/usr/libexec/gcc/i686-redhat-linux/4.4.6/:/usr/libexec/gcc/i686-redhat-linux/4.4 
.6/:/usr/libexec/gcc/i686-redhat-linux/:/usr/lib/gcc/i686-redhat-linux/4.4.6/:/usr/lib/gcc/i68 
6-redhat-linux/:/usr/libexec/gcc/i686-redhat-linux/4.4.6/:/usr/libexec/gcc/i686-redhat-linux/: 
/usr/lib/gcc/i686-redhat-linux/4.4.6/:/usr/lib/gcc/i686-redhat-linux/ 
[BAA 

lib/gcc/i686-redhat-linux/4.4.6/.. 1 

COLLECT_GCC_OPTIONS=" -Vv' '-0' "main. ic' '-march=i686" | 

-eh-frame-hdr --build-id|-m elf-i386 --has 
h-style=gnu -dynamic-linker /lib/ld-linux.so.2 /-o main.bin /usrVLib/gcc/i686Jredhat-LinuxV4.4. 
6/../../../crtl.o /usr/lib/gcc/i686-redhat /4.4.6/../../../crti.o /usr/Wib/gcc/i686-redha 
A pt -L/usr/lib/gct/i686-redhat-lin 
UX/4.4.6 -L/usr/lib/gcc/i686-redhat-linux/4.4. . /tmp/ccOyJGmy .0 -lgc¢ --as-needed -lg 
cc_s --no-as-needed -lc -lgcc --as-needed -lgcc- -as-needed at 1 redhat-linu 
x/4.4.6/crtend.o /usr/lib/gcc/i686-redhat- Limov4. 4.6/../../../cntn.o 

[work@localhost tmp]$ ./main,bin | 


hello world 链接 器 collect2， 芮 商 部 调用 


[work@localhost tmp]9 











4 图 0-16 ”gcc 编译 、 链 接 过 程 

gcc 内 部 也 要 将 C 代码 经 过 编译 、 汇 编 、 链 接 三 个 阶段 。 

(1) 编译 阶段 是 将 C 代码 翻译 成 汇编 代码 ， 由 最 上 面 的 框框 中 的 C 语言 编译 器 ccl 来 完成 ， 它 将 C 
代码 文件 main.c 翻译 成 汇编 文件 ccymR62K.s。 

(2) 汇编 阶段 是 将 汇编 代码 编译 成 目标 文件 ， 用 第 二 个 框框 中 的 汇编 语言 编译 器 as 完成 ，as 将 汇编 
文件 ccymR62K.s 编译 成 目标 文件 cc0yJGmy.o。 
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第 0 章 一 些 你 可 能 


正 感到 迷惑 的 问题 
























































































































































































































































































































































(3) 链接 阶段 是 将 所 有 使 用 的 目标 文件 链接 成 可 执行 文件 ， 这 是 用 左边 最 下 面 框框 中 的 链接 器 
collect2 来 完成 的 ， 它 只 是 链接 命令 1d 的 封装 ， 最 终 还 是 由 1d 来 完成 ， 在 这 一 扒 .o 文件 中 ， 有 咱们 上 面 的 
目标 文件 cc0yJGmy.o。 

以 上 我 们 想 展开 说 的 是 第 3 点 : 链接 阶段 。 

大 家 看 到 了 ， 实 际 参与 链接 的 有 多 个 .o 文件 ， 这 些 都 是 目标 文件 ， 也 就 是 函数 体 所 在 的 文件 。printf 
的 函数 体 就 在 这 里 面 其 中 某 个 .o 文件 中 ， 而 且 ，printf 中 也 要 调用 其 他 函数 ， 这 些 被 调用 的 函数 也 分 布 在 
这 些 .o 文件 之 中 。 

这 些 趾 们 不 认识 的 .o 文件 从 哪 来 ? 为 什么 链接 器 要 链接 它们 ? 

大 家 看 中 间 框 框 中 的 LIBRARY PATH， 这 是 个 库 路 径 变 量 ， 里 面 存 储 的 是 库 文 件 所 在 的 所 有 路 径 ， 
这 就 是 编译 器 所 说 的 标准 库 的 位 置 ， 自 动 到 该 变量 所 包含 的 路 径 中 去 找 库 文件 。 以 上 所 说 的 .o 文件 就 是 在 
这 些 路 径 下 找到 的 。 





不 知道 大 家 注意 到 了 没有 


标 文件 cc0yJGmy.o 


什么 是 运行 时 











在 图 -16! 
以 外 ， 还 有 以 下 这 几 个 以 crt 了 




















T 头 的 目 


库 ? 





的 链接 阶段 ， 链 接 器 collect2 的 参数 除了 有 
标 文 
crt 是 什么 ? CRT， 即 C Run-Time library， 是 C 运行 时 库 。 























牛 : crtl.o，crtio，crtbegin.o， 














运行 时 库 是 程 / 














这 在 运行 时 所 需要 的 库 ， 该 库 是 由 众多 可 




















所 以 ，C 运行 时 库 ， 








就 是 C 程序 运行 时 所 需要 














大 家 这 下 应 该 明白 了 ， 我 们 在 程序 中 简单 地 一 句 include < 标准 头 文件 > 之 所 以 有 效 ， 是 
的 C 运行 库 中 己 经 为 我 们 准备 好 了 这 些 标准 函数 的 函数 体 所 在 的 





们 的 main.c 9 














成 的 


crtend.o0， crtn.0。 























复 








的 函数 文件 组 成 的 ， 














| 编译 器 提供 。 
的 库 文件 ， 在 我 们 的 环境 中 ， 它 由 gcc 提供 。 









































顺便 说 一 句 ， 这 些 目 标 文 伯 
查看 它们 时 会 显示 relocatable， 它 们 


今 


统一 分 配 的 。 所 以 











且 往 











标 文件 ， 在 链接 时 默 晶 























村 





都 





重 定位 文件 





元 何 


》 





定位 文件 意 


思 是 文件 中 的 函数 是 没有 地 址 的 














因为 编译 器 提供 
门 链接 上 了 。 


》 | file 命 



































口 








中 的 地 址 是 在 与 用 户 下 














序 的 目标 文 伯 




















C 运行 时 库 中 同样 的 函数 与 不 同 的 用 户 程 








的 地 址 者 
都 有 这 些 库 文件 的 
几 个 字符 ， 最 终 和 


-~ 














pr AT 


字符 








中 ,也 








可 能 是 不 同 的 。 每 
副本 ， 
成 的 文 
还 有 一 点 内 容 要 解释 , 前 
日 到 了 printf 函数 ， 

















个 用 户 程序 都 需要 与 它 


ee 





站 链接 合并 成 一 个 可 执行 文人 





序 链 接 时 ， 其 生成 的 可 执行 文 伯 


链接 成 一 个 可 执行 文件 





TT 














时 由 链接 器 























F, 所 以 每 一 个 可 执行 文 伯 


F 中 分 配给 库 函 数 
中 























这 些 库 文件 相当 于 被 复 千 
件 也 要 几 KB， 就 是 这 个 道理 
掉 说 过 用 户 程序 要 使 | 
照 我 这 么 说 的 话 , 打印 字符 是 





II 

































































内 核 

















函数 时 ， 
我 

用 的 库 函 数 ， 我 们 

否 是 我 们 想 要 的 。 


内 部 一 定 











门 可 以 用 ltrace 








文公 
会 执行 系统 调用 ? 没 错 ! 我 们 来 验 记 
命令 跟踪 
的 printf 孙 数 线 
EE 起， 如 图 0-17 所 示 。 


[work@localhost 1Ltrace-0.7.3]$ ~/ltrace/bin/1 























上 到 每 个 用 户 程序 中 。 所 以 您 清楚 了 ， 即 使 


色 对 是 个 标准 的 库 函 数 ， 让 我 们 多 














们 的 代码 只 有 十 

















的 功能 , 那么 4 


一下。 
一 下 程序 main bin 的 执行 过 程 就 好 啦 。ltrace 命令 用 来 跟踪 程序 运行 时 调 


上 Auer ae 仙 只 





j 系 统 调用 才能 使 用 操作 系统 的 功能 , 我 们 的 func_inc.d 
成 的 main.bin 文件 在 执行 printf 








E 舌 委 钙 


， 看 看 不 加 参数 








trace /tmp/main.bin 


__Libc_start_main(0x80483d7，1，0xbfa6e374，0x8048400 <unfinished ...> 


printf( "hello world\n"hello world 





+H+ exited (status 12) H+ 










































































A 图 0-17 Itrace 跟踪 进程 调用 的 库 函 数 
0-17 中 用 方 框框 出 来 的 printf 就 是 咱们 调用 的 函数 。 大 家 机 器 上 若 没 有 这 个 命令 























/www.ltrace.org/ 下 载 ， 
目录 中 ， 大 家 可 以 执行 这 档 























前 最 新 版 本 是 0.7.3， 下 载 后 的 


的 命令 一 次 性 搞定 。 




















执行 时 的 输 # 


it 
ZE 


可 以 在 http: 


>» 


包 是 ltrace_0.7.3.orig.tar.bz2， 我 把 它 放 在 了 ltrace 





tar jxvf ltrace 0.7.3.orig.tarbz2 && cd ltrace-0.7.3 && ./configure --prefix=/your_path/ltrace && make && 


make install 












































。-S 参数 查看 系统 调用 , 命令 执行 走 起 ， 如 图 























验证 通过 之 后 ， 咱 们 再 看 看 printf 用 了 哪些 系统 调用 
大 家 看 到 了 方 框 中 的 SYS_write 了 吧 ， 这 个 就 是 系统 调 ) 
unistd_32.h 中 ， 大 家 可 以 自行 查看 。 








日 啦 。Linux 的 系统 调 ) 
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0-18 所 示 。 


号 定义 在 /usr/include/asm/ 


[work@localhost 1Ltrace-0.7.3]$ ~/ltrace/bin/ltrace -S /tmp/main.bin 
SYS_brkC@xbfde7c6c) 


中 间 略 

12, "hello world\n", 6794051hello world 
) = 12 
<..。printf resumed> ) 


























4 图 0-18 ltrace 跟踪 进程 系统 调 
如 果 大 家 不 想 安装 ltrace 命令 ， 可 以 用 本 机 自 带 的 strace 命令 代替 ， 它 是 专门 用 来 查看 系统 调用 和 信 
号 的 命令 ， 不 过 它 查 看 的 并 不 是 最 终 的 系统 调用 ， [TITTR 5 7 下 
而 是 系统 调用 的 封装 函数 。 不 解释 啦 ， 大 家 眼见 为 Sr Ap De® 
实 吧 ， 如 图 0-19 所 示 。 
如 图 0-19 所 示 ， 画 框框 的 write 是 系统 调用 。 























































































































中 间 略 



































js Nd i es . [writeK1, "hello world\n", 12hello world 
原本 输出 的 信 息 非常 多 ， 这 里 我 只 截 | 部 分 。 write 7) = 12 




















=? 


A 图 0-19 ”strace 实例 














函数 是 系统 调用 SYS_write 的 封装 ， 所 以 你 懂 了 我 ”de 
更 喜欢 用 ltrace 的 原因 。 
顺便 说 一 句 ， 大 家 可 以 用 -e trace=write 来 限制 只 看 write 系统 调用 ， 免 得 输出 无 关 的 信息 太 多 。 
该 说 的 都 说 啦 ， 现 在 总 结 一 下 。 
(1) 操作 系统 有 自己 支持 、 加 载 用 户 进程 的 规则 ， 而 C 运行 时 库 是 针对 此 操作 系统 的 规则 ， 为 了 让 
用 户 程序 开发 更 加 容易 ， 用 来 支持 用 户 进 程 的 代码 库 。 大 家 要 明白 , 之 所 以 我 们 写 个 程序 又 链接 这 又 链接 
那 的 ， 完 全 是 因为 操作 系统 规定 这 样 做 ， 人 在 屋檐 下 ， 不 得 不 低头 。 
(2) 用 户 进程 要 与 C 运行 时 库 的 诸多 目标 文件 链接 后 合并 成 一 个 可 执行 文件 ， 也 就 是 说 我 们 的 用 户 
进程 被 加 进 了 大 量 的 运行 库 中 的 代码 。 
(3) C 运行 时 库 作用 如 其 名 ， 是 提供 程序 运行 时 所 需要 的 库 文件 ， 而 且 还 做 了 程序 运行 前 的 初始 化 工 
作 ， 所 以 即使 不 包含 标准 库 文件 ， 链 接 阶段 也 要 用 到 c 运行 时 库 。 
(4) 用 户 程序 可 以 不 和 操作 系统 打交道 ， 但 如 果 需 要 操作 系统 的 支持 ， 必 须要 通过 系统 调用 ， 它 是 用 
户 进程 和 操作 系统 之 间 的 “ 钧 子 ” 用 户 进程 顶 多 算是 个 半成品 ， 只 有 通过 钩子 挂 上 了 操作 系统 ， 加 了 上 
所 需要 的 操作 系统 的 那 部 分 代码 ， 用 户 程序 才能 做 完 一 件 事 ， 这 才 算 完整 ， 后 面 章节 会 有 详解 。 
(5) 尽管 系统 调用 封装 在 库 函 数 中 ， 但 用 户 程序 可 以 直接 调用 “系统 调用 ”， 不 过 用 库 函数 会 比较 高 
效 〈 后 面 章节 会 有 详解 )。 


[6% 转 义 字符 与 ii 从 码 


计算 机 世界 中 是 以 二 进 制 来 运行 的 ， 无 论 是 指令 、 数 据 ， 都 是 以 二 进 制 的 形式 提交 给 硬件 处 理 的 ， 字 
符 也 一 样 ， 必 须 转 换 成 二 进 制 才能 被 计算 机 识别 。 所 以 各 种 各 样 的 字符 编码 产生 ， 简 单 来 说 ， 字 符 编码 就 是 用 
唯一 的 一 个 二 进 制 串 表 示 唯 一 的 一 个 字符 。 其 中 最 著名 的 字符 编码 就 是 ASCII 码 。 

ASCII 码 表 中 字符 按 可 见 分 成 两 大 类 ， 一 类 是 不 可 见 字 符 ， 共 33 个 ， 它 们 的 ASCII 码 值 是 0 一 31 和 
127， 属 于 控制 字符 或 通信 专用 字符 。 表 中 其 余 的 字符 是 可 见 字符 ， 它 们 的 ASCII 码 值 是 32 一 126， 属 于 
数字 、 字 母 、 各 种 符号 。 
对 于 计算 机 来 说 ,任何 字符 都 是 用 ASCII 码 表 示 的 ， 人 要 是 与 计算 机 交流 ， 虽 然 可 以 直接 输入 字符 的 
ASCII 码 , 但 这 太 不 人 道 了 ， 计 算 机 的 发 明 是 为 了 给 人 解决 问题 而 并 非 制造 问题 。 人 习惯 用 所 见 即 所 得 的 
方式 使 用 字符 ， 我 要 输入 字符 a 的 时 候 ， 直 接 按 下 键盘 上 的 a 键 就 行 了 ， 不 要 让 我 输入 其 ASCII 码 0x61。 
这 要 求 是 合理 的 ， 我 们 在 键盘 上 键入 的 每 个 按键 ， 都 会 由 输入 系统 根据 ASCI 码 表 转换 成 对 应 的 二 进 制 
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ACSII 码 形式 。 这 对 普通 用 户 来 说 够 用 了 ， 他 们 很 少 写 程序 ， 可 是 作为 程序 员 ， 我 们 经 常 要 输出 字符 串 ， 
子 符 串 中 的 可 见 字符 直接 从 键盘 敲 入 就 行 了 ， 对 于 那些 不 可 见 字符 ， 如 回 车 换行 符 等 ,肯定 不 能 用 键盘 在 
子 符 串 中 直接 裔 下 一 个 回 车 键 。 
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我 们 的 问题 是 不 可 见 字符 如 何 写 出 来, 也 就 是 说 我 们 在 写字 符 串 时 , 如 何在 其 中 加 入 不 可 见 的 控制 符 ， 
这 就 需要 编译 器 或 解释 器 的 支持 了 。 
由 于 可 见 字符 本 身 是 看 得 见 的 ， 所 见 即 所 得 ， 大 家 在 使 用 中 并 不 会 有 陌生 感 。 对 于 那些 不 可 见 的 控制 










































































字符 ， 如 果 想 使 用 它们 时 ， 该 怎样 表示 它们 呢 ? 比如 我 就 是 要 让 程序 输出 一 段 话 ， 在 结束 处 换行 。 控 制 字 
符 看 不 见 摸 不 着 ， 怎 么 写 出 来 ? 所 以 在 使 用 这 些 不 可 见 字符 时 必须 想 办 法 让 其 可 见 ， 但 又 不 能 表示 成 其 他 

































































汪 





























可 见 字符 ， 所 以 ， 只 能 让 可 见 字 符 不 表示 自身 了 ， 喻 哈 ， 有 点 难 是 吗 ? 这 么 艰巨 的 任务 显然 只 用 一 个 可 见 
字符 是 不 可 能 完成 的 ， 















































于 是 编译 器 想 出 了 一 个 办 法 ， 它 引用 了 男 一 个 可 见 字符 \ 来 搭配 其 他 可 见 字 符 ， 用 




















这 种 可 见 字 符 组 合 的 形式 表达 不 可 见 字符 。 表 面 上 看 ， 字 符 \ 是 让 其 他 可 见 字 符 的 意义 变 了 ， 所 以 称 \ 为 
转 义 字符 ， 但 本 质 上 ， 这 两 个 可 见 字 符合 起 来 才 是 完整 的 不 可 见 字 符 ， 比 如 换行 符 \n，N\N 和 mm' 放 到 一 起 才 






































是 换行 符 的 意义 ， 





并 不 是 因为 m 前面 有 个 \，m "就 不 再 是 mn， 而 是 换行 符 ， 一 定 要 清楚 不 是 这 样 的 。 















































ASCII 码 表 中 任何 字符 都 是 1 个 字 节 大 小 ， 在 字符 串 中 不 可 见 字符 虽然 用 “ 转 义 字符 + 可 见 字符 ”两 个 字 
符 来 表示 ， 但 这 只 是 编译 器 为 了 让 人 们 能 写 出 不 可 见 字符 的 方式 ， 目 的 是 让 不 可 见 字 符 变 得 “可 见 ” 针对 的 



































是 人 , 这 样 人 们 写 程 请 


























时 就 能 在 字符 串 中 用 到 不 可 见 字符 。 不 可 见 字符 本 身 在 编译 后 还 是 那 1 个 字 节 的 ASCII 
































码 。 说 白 了 ， 我 们 能 够 将 不 可 见 字符 显示 出 来 ， 原 因 就 是 编译 器 在 给 我 们 做 支持 ， 它 将 “ 转 义 字符 + 可 见 字符 ” 
这 种 形式 的 不 可 见 字符 转换 成 了 该 不 可 见 字符 的 ASCII 码 。 

为 了 说 清楚 ， 咱 们 以 编译 器 为 界限 ， 在 编译 器 左边 的 是 人 ， 这 里 的 字符 串 是 供 人 使 用 的 ， 转 义 字符 是 
存在 于 这 一 边 的 。 编 译 器 右边 的 是 机 器 ， 这 里 的 字符 串 使 用 的 都 是 ASCII 码 。 





在 编译 器 左边 ; 




























































































| char* ptr=”abcNn” 





编译 器 右边 : 




















此 部 分 对 应 的 内 容 是 0x61 0x62 0x63 0x5c 0x6e。 


“abcn” 对 应 的 内 容 是 0x61 0x62 0x63 0xa 
编译 器 的 左边 和 右边 是 不 一 样 的 ， 区 别 是 对 “\n” 的 处 理 。 编 译 器 左边 把 它 当 成 了 两 个 字符 ， 编 译 器 









































右边 把 它 当 成 了 一 个 字符 。 想 想 也 是 ， 毕 竟 代 码 只 是 文本 字符 串 ， 字 符 串 ”abcm” 中 的 \ 和 mm 肯定 是 两 个 
字符 ， 编 译 器 会 把 \ 和 m' 组 合 到 一 起 成 为 \n' 而 解释 成 回 车 换行 。 可 能 您 还 是 觉得 怀疑 ， 那 我 说 一 下 编译 器 

















对 字符 串 的 解释 过 程 。 
编译 器 对 字符 串 的 处 理 一 般 是 逐个 字符 处 理 的 ， 这 样 便于 处 理 转 义 字 符 。 若 发 现 字 符 为 \， 就 意识 到 
这 是 转 义 字符 , 按 第 到 
分 析 这 两 个 字符 的 组 合 是 哪个 控制 字符 后 一 并 处 理 。 






























































































































































EE 说 后 面皮 定 要 跟着 男 一 可 见 字 符 , 于 是 先 不 做 任何 处 理 , 马上 把 后 面 的 字符 读 进 来 ， 



























































咱们 这 里 拿 编 译 器 解释 字符 串 ”abcm ”举例 。 








代码 中 的 \n' 本 身 























两 个 字符 \ 和 m 组成， 是 给 人 看 的 ， 用 于 在 字符 串 中 使 用 ， 其 ASCII 码 是 0xa， 






































是 给 机 器 看 的 。 在 计算 机 中 ， 所 有 的 字符 都 已 经 成 了 ASCII 码 ， 字 符 串 ”abcn” 则 变 成 了 ASCII 码 : 0x61 


0x02 0xX03 OxSc 0xoe 。 



































SI 


译 器 要 未 个 对 比 字符 串 中 每 个 字符 ， 前 几 个 字符 是 a、' 心 、'e， 这 都 是 可 见 字符 ， 没 有 异议 ， 直 接 处 理 。 
山 字 符 是 \， 知 道 这 是 转 义 字符 ， 得 知道 \ 后 面 的 字符 是 什么 才能 确定 是 哪个 不 可 见 字符 ， 于 是 暂停 处 理 \， 



















































































把 后 面 的 字符 读 进 来 ， 








字符 串 ”abcm” 的 ASCII 码 就 变 成 了 0x61 0x62 0x63 0xa。 














发 现 是 mn， 便 知 道 这 是 \n， 表 示 一 个 换行 符 ， 于 是 将 \ 和 m' 用 换行 符 的 ASCII 代 蔡 ， 原 来 


























说 得 足够 多 了 ， 我 也 嫌 自 己 虽 嗪 了 ， 大 家 看 以 下 的 例子 吧 ， 就 在 图 0-20 中 全 部 解释 清楚 了 。 
代码 ASCII.c 过 于 简单 ,纯粹 是 为 演示 。 大 家 可 能 注意 到 了 xxd.sh 这 个 脚本 , 它 就 是 xxd 命令 的 封装 ， 
xxd 命令 可 以 逐 字 节 查 看 文件 ，xxd.sh 脚本 内 容 如 下 。 


#usage: sh xxd.sh 文件 起 始 地 址 长 度 
xxd -u -a -dg 1 -s $2 -1 $3 $1 








# 以 下 为 参数 解释 。 
























































#-u use upper case hex letters. Default is lower case. 


# 
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-a | -autoskip 
toggle autoskip: A single '*' replaces nul-lines. Default off. 


-9 bytes | -groupsize bytes 

separate the output of every <bytes> bytes (two hex characters or eight bit-digits each) 
y a whitespace. Specify -g 0 to 

suppress grouping. <Bytes> defaults to 2 in normal mode and 1 in bits mode. Grouping does 
ot apply to postscript or 

include style. 


-c cols | -cols cols 
format <cols> octets per line. Default 16 (-i: 12, -ps: 30, -b: 6). Max 256 . 


[+] [-] seek 
start at <seek> bytes abs. (or rel.) infile offset. + indicates that the seek is relative 
O the current stdin file position 

(meaningless when not reading from stdin). - indicates that the seek should be that many 
haracters from the end of 
the input (or if combined with +: before the current stdin file position). 
Without -s option, xxd starts at the current file position. 


| 
Un 


非 非 0 关中 非 非 非 非 非 非 砷 邑 非 口 非 非 非 非 非 


[work@localhost tmp]$ cat -n ascii.c 

1 char* ptr="abc\n"; 

2 void mainO{ 

3 3 
[work@localhost tmp]$ gcc -c -9 ascii.o ascii.c 
[work@localhost tmp]$ 1l1 ascii.o ET 
-rw-rw-r--。 1 work work 824 109 月 24 14:37 ascii.o 编译 前 \n 
[work@localhost tmp]$ 11 ascii.c 被 拆 分 成 \ 和 n 
-rw-rw-r--。 1 work work 34 10 月 24 14:34 ascii.c 
[work@localhost tmp]$ sh ~/tool/xxd.sh ascii.c 0 34 
0000000: 63 68 61 72 2A 20 70 74 72 3D 22 char* ptr="abc\n 
0000010: 22 3B OA 76 6F 69 64 20 6D 61 69 6E 28 29 7B OA ";.void mainO{ 
0000020: 7D OA 
[work@localhost tmp]$ 
[work@localhost tmp]$ 11 ascii.o 
-rw-rw-r--。1 work work 824,18 
[work@localhost tmp]S_-elr ~/tool/xxd.sh ascii.o 0 8241grep 61 

:[61 62 63 6A]60 00 47 43 43 3A 20 28 47 4E 55 29 abc...GCC: (GNU) 
: 28 52 65 64 2048 61 74 20 34 2E 34 2E 36 2D 34 (Red Hat 4.4.6-4 

3 79 6D 74 61 62 00 2E 73 74 72 74 )...symtab..strt 
3 4 61 62 00 2E 74 65 ab..shstrtab. .te 
4 1 74 61 00 2E 62 73 xt..rel.data..bs 
F 63 6F 60 60 65 $s..rodata. .comme 
E 2D 73 74 61 nt..note.GNU-sta 
2] 


7 
7 
7 
6| 
6 
0 


ii.c.ptr.main... 





[work@localhost tmp]$ 
4 图 0-20 查看 编译 后 的 转 义 字符 

















希望 对 大 家 理解 转 义 字符 有 帮助 。 


二 -Bik、 人 ak、 宁 Bk 和 大 全 各 是 什么 


这 几 个 概念 主要 是 围绕 计算 机 系统 的 控制 权 交 接 展开 的 , 整个 交接 过 程 就 是 个 接力 赛 , 咱们 从 头 梳理 。 

计算 机 在 接 电 之 后 运行 的 是 基本 输入 输出 系统 BIOS, 大 伙 儿 知道 , BIOS 是 位 于 主板 上 的 一 个 小 程序 ， 
其 所 在 的 空间 有 限 ， 代 码 量 较 少 ， 功 能 受 限 ， 因 此 它 不 可 能 一 人 打 下 所 有 的 任务 需求 ， 也 就 是 肯定 不 能 充 
当 操 作 系 统 的 角色 《比如 说 让 BIOS 运行 QQ 是 不 可 能 的 )， 必 须 采取 控制 权 接 力 的 方式 ， 一 步 步 地 让 处 
里 器 执行 更 为 复杂 强大 的 指令 ,最终 把 处 理 器 的 使 用 权 交 给 操作 系统 ， 这 才 让 计算 机 走 上 了 正轨 ， 从 而 可 
以 完成 各 种 复杂 的 功能 ， 方 便 人 们 的 工作 和 生活 。 采 用 接力 式 控制 权 交 接 ，BIOS 只 完成 一 些 简单 的 检测 
或 初始 化 工作 ， 然 后 找 机 会 把 处 理 器 使 用 权 交 出 去 。 交 给 谁 呢 ? 下 一 个 接力 棒 的 选手 是 MBR， 为 了 方便 
BIOS 找到 MBR，MBR 必须 在 固定 的 位 置 等 待 ， 因 此 MBR 位 于 整个 硬盘 最 开始 的 扇 区 。 

MBR 是 主 引 导 记 录 ，Master 或 Main Boot Record， 它 存在 于 整个 硬盘 最 开始 的 那个 扇 区 ， 即 0 盘 0 
道 1 扇 区 ， 这 个 扇 区 便 称 为 MBR 引导 扇 区 。 注 意 这 里 用 CHS 方式 表示 MBR 引导 扇 区 的 地 址 ， 因 此 扇 区 
地 址 以 1 开始 ， 顺 便 说 一 句 ，LBA 方式 是 以 0 为 起 始 为 扇 区 编 址 的 ， 有 关 CHS 和 LBA 的 内 容 会 在 后 面 
章节 介绍 。 一般 情况 下 扇 区 大 小 是 $12 字 节 , 但 大 伙 儿 不 要 把 这 个 当真 理 , 有 的 硬盘 扇 区 并 不 是 512 字 节 。 
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在 MBR 引导 扇 区 中 的 内 容 是 : 

(1) 446 字 节 的 引导 程序 及 参数 ; 

(2) 64 字 节 的 分 区 表 ; 

(3) 2 字 节 结束 标记 0x55 和 0xaa。 

在 MBR 引导 扇 区 中 存储 引导 程序 , 为 的 是 从 BIOS 手中 接 过 系统 的 控制 权 , 也 就 是 处 理 器 的 使 用 权 。 
任何 一 棒 的 接力 都 是 由 上 一 棒 跳 到 下 一 棒 ， 也 就 是 上 一 棒 得 知道 下 一 棒 在 哪里 才能 跳 过 去 ， 和 否则 权利 还 是 
交 不 出 去 。BIOS 知道 MBR 在 0 盘 0 道 1 扇 区 ,这 是 约定 好 的 ， 因 此 它 会 将 0 盘 0 道 1 扇 区 中 的 MBR 引 
导 程 序 加 载 到 物理 地 址 0x7c00， 然 后 跳 过 去 执行 ， 这 样 BIOS 就 把 处 理 器 使 用 权 移 交 给 MBR 了 。 

既然 MBR 称 为 “ 主 ” 引 导 程 序 ， 有 “ 主 ” 就 得 有 “次 ” MBR 的 作用 相当 于 下 一 棒 的 引导 程序 总 
入 口 ,BIOS 把 控制 权 交 给 MBR 就 行 了 , 由 MBR 从 众多 可 能 的 接力 选手 中 挑 出 合适 的 人 选 并 交 出 系统 控 
制 权 ， 这 个 过 程 就 是 由 “ 主 引 导 程 序 ” 去 找 “ 次 引导 程序 ” 这 么 说 的 意思 是 “次 引导 程序 ”不 止 一 个 。 
也 许 您 会 问 ， 为 什么 BIOS 不 直接 把 控制 权 交 给 “次 引导 程序 ”? 原因 是 BIOS 受 限 于 其 主板 上 的 存储 空 
间 ， 代 码 量 有 限 ， 本 身 的 工作 还 做 不 过 来 呢 ， 因 此 心 有 余 而 力 不 足 。 好 啦 ， 下 面 开 始 下 一 轮 的 系统 控制 权 
接力 。 不 要 忘 了 ，MBR 引导 扇 区 中 除了 引导 程序 外 ， 还 有 64 字 节 大 小 的 分 区 表 ， 里 面 是 分 区 信息 。 分 区 
表 中 每 个 分 区 表 项 占 16 字 节 ， 因 此 MBR 分 区 表 中 可 容纳 4 个 分 区 ， 这 4 个 分 区 就 是 “次 引导 程序 ”的 
候选 人 群 ，MBR 引导 程序 开始 遍历 这 4 个 分 区 ， 想 找到 合适 的 人 选 并 把 系统 控制 权 交 给 他 。 
通常 情况 下 这 个 “次 引导 程序 ”就 是 操作 系统 提供 的 加 载 器 ， 因 此 MBR 引导 程序 的 任务 就 是 把 控 人 
权 交 给 操作 系统 加 载 器 ， 由 该 加 载 器 完成 操作 系统 的 自 举 ， 最 终 使 控制 权 交付 给 操作 系统 内 核 。 但 是 各 分 
区 都 有 可 能 存在 操作 系统 ，MBR 也 不 知道 操作 系统 在 哪里 ， 它 甚至 不 知道 分 区 上 的 二 进 制 01 串 是 指令 ， 
还 是 普通 数据 ， 好 吧 ， 它 根本 分 不 清楚 上 面 的 是 什么 ， 谈 何 权利 交接 呢 。 

为 了 让 MBR 知道 哪里 有 操作 系统 ， 我 们 在 分 区 时 ， 如 果 想 在 某 个 分 区 中 安装 操作 系统 ， 就 用 分 区 

将 该 分 区 设置 为 活动 分 区 , 设置 活动 分 区 的 本 质 就 是 把 分 区 表 中 该 分 区 对 应 的 分 区 表 项 中 的 活动 标记 为 
0x80。MBR 知道 “活动 分 区 ”意味 着 该 分 区 中 存在 操作 系统 ， 这 也 是 约定 好 的 。 活 动 分 区 标记 位 于 分 区 
表 项 中 最 开始 的 1 字 节 (有关 分 区 内 容 ， 后 面 介绍 分 区 的 章节 中 会 细 说 )， 其 值 要 么 为 0x80， 要 么 为 0， 
其 他 值 都 是 非法 的 。0x80 表示 此 分 区 上 有 引导 程序 ，0 表示 没 引 导 程 序 ， 该 分 区 不 可 引导 。MBR 在 分 析 
分 区 表 时 通过 辨识 “活动 分 区 ”的 标记 0x80 开始 找 活动 分 区 ， 如 果 找 到 了 ， 就 将 CPU 使 用 权 交 给 此 分 区 
上 的 引导 程序 ， 此 引导 程序 通常 是 内 核 加 载 器 ， 下 面 就 直接 以 它 为 例 。 
“控制 权 交接 ”是 处 理 器 从 “上 一 棒 选 手 ” 跳 到 “下 一 棒 选 手 ” 来 完成 的 ， 内 核 加 载 器 的 入 口 地 址 是 这 里 所 
说 的 “下 一 棒 选 手 ” 但 是 内 核 加载 器 在 哪里 昵 ? 虽然 分 区 那么 大 ， 但 MBR 最 想 去 看 的 是 内 核 加 载 器 ， 不 想 盲 
目地 看 看 。 因 此 您 想到 了 ， 为 了 MBR 方便 找到 活动 分 区 上 的 内 核 加 载 器 ， 内 核 加 载 器 的 入 口 地 址 也 必须 在 固定 
的 位 置 ， 这 个 位 置 就 是 各 分 区 最 开始 的 扇 区 ， 这 也 是 约定 好 的 。 这 个 “各 分 区 起 始 的 扇 区 ”中 存放 的 是 操作 系统 
引导 程序 一 一 内 核 加 载 器 ， 因 此 该 扇 区 称 为 操作 系统 引导 扇 区 ， 其 中 的 引导 程序 〈 内 核 加 载 器 ) 称 为 操作 系统 
引导 记录 OBR， 即 OS Boot Record， 此 扇 区 也 称 为 OBR 引导 扇 区 。 在 OBR 扇 区 的 前 3 个 字 节 存放 了 跳 转 指令 ， 
这 同样 是 约定 ， 因 此 MBR 找到 活动 分 区 后 ， 就 大 胆 主动 跳 到 活动 分 区 OBR 引导 扇 区 的 起 始 处 ， 该 起 始 处 的 跳 
转 指令 马上 将 处 理 器 带 入 操作 系统 引导 程序 ， 从 此 MBR 完成 了 交接 工作 ， 以 后 便 是 内 核 的 天 下 了 。 

不 过 OBR 中 开头 的 跳 转 指令 跳 往 的 目标 地 址 并 不 国定 , 这 是 由 所 创建 的 文件 系统 决定 的 , 对 于 FAT32 
文件 系统 来 说 ， 此 跳 转 指令 会 跳 转 到 本 扇 区 偏 移 0x5A 字 节 的 操作 系统 引导 程序 处 。 不 管 跳 转 目标 地 址 是 
多 少 ， 总 之 那里 通常 是 操作 系统 的 内 核 加载 器 。 

计算 机 历史 中 癌 来 把 兼容 性 放 在 首位 ， 这 才 是 计算 机 燕 蒸 日 上 的 原因 。OBR 是 从 DBR 遗留 下 来 的 ， 
要 想 了 解 OBR， 还 是 先 从 了 解 DBR 开始 。DBR 是 DOS Boot Record， 也 就 是 DOS 操作 系统 的 引导 记录 
(程序 )，DBR 中 的 内 容 大 概 是 : 

(1) 跳 转 指令 ， 使 MBR 跳 转 到 引导 代码 ; 
(2) 厂商 信息 、DOS 版 本 信息 ; 
(3) BIOS 参数 块 BPB， 即 BIOS Parameter Block; 
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(4) 操作 系统 引导 程序 ; 

(5) 结束 标记 0x55 和 0xaa。 

在 DOS 时 代 只 有 4 个 分 区 ， 不 存在 扩展 分 区 ， 这 4 个 分 区 都 相当 于 主 分 区 ， 所 以 各 主 分 区 最 开始 的 扇 
区 称 为 DBR 引导 扇 区 。 后 来 有 了 扩展 分 区 之 后 ， 无 论 分 区 是 主 分 区 ， 还 是 逻辑 分 区 ， 为 了 兼容 ， 分 区 最 开 
始 的 扇 区 都 作为 DOS 引导 扇 区 。 但 是 其 他 操作 系统 如 UNIX，Linux 等 为 了 兼容 MBR 也 传承 了 这 个 习俗 ， 
都 将 各 分 区 最 开始 的 扇 区 作为 自己 的 引导 扇 区 ,在 里 面 存放 自己 操作 系统 的 引导 程序 。 由 于 现在 这 个 “分 
最 开始 的 扇 区 ”引导 的 操作 系统 类 型 太 多 了 ， 而 且 DOS 还 退出 历史 舞台 了 ， 所 以 DBR 也 称 为 OBR。 

这 里 提 到 了 扩展 分 区 就 不 得 不 提 到 EBR。 当 初 为 了 解决 分 区 数量 限制 的 问题 才 有 了 扩展 分 区 ，EBR 
是 扩展 分 区 中 为 了 兼容 MBR 才 提 出 的 概念 ， 主 要 是 兼容 MBR 中 的 分 区 表 。 分 区 是 用 分 区 表 来 描述 的 ， 
MBR 中 有 分 区 表 ， 扩 展 分 区 中 的 是 一 个 个 的 逻辑 分 区 ， 因 此 扩展 分 区 中 也 要 有 分 区 表 ， 为 扩展 分 区 存储 
分 区 表 的 扇 区 称 为 EBR， 即 Expand Boot Record， 从 名 字 上 看 就 知道 它 是 为 了 “兼容 ”而 “扩展 ”出 来 的 
结构 ， 兼 容 的 内 容 是 分 区 表 ， 因 此 它 与 MBR 结构 相同 ， 只 是 位 置 不 同 ，EBR 位 于 各 子 扩展 分 区 中 最 开始 
的 肩 区 (注意 ， 各 主 分 区 和 各 逻辑 分 区 中 最 开始 的 扇 区 是 操作 系统 引导 扇 区 )， 理 论 上 MBR 只 有 1 个 ， 
EBR 有 无 数 个 。 有 关 扩 展 分 区 的 内 容 还 是 要 参见 后 面 有 关 分 区 的 章节 ， 那 里 介绍 得 更 细致 。 
现 在 总 结 一 下 。 

EBR 与 MBR 结构 相同 ， 但 位 置 和 数量 都 不 同 ， 整 个 硬盘 只 有 1 个 MBR， 其 位 于 整个 硬盘 最 开始 的 
扇 区 一 一 0 道 0 道 1 扇 区 。 而 EBR 可 有 无 数 个 ， 具体 位 置 取决 于 扩展 分 区 的 分 配 情况 ， 总 之 是 位 于 各 子 扩 
展 分 区 最 开始 的 扇 区 ， 如 果 此 处 不 明白 子 扩展 分 区 是 什么 , 到 了 以 后 跟踪 分 区 的 章节 中 大 伙 儿 就 会 明白 。 OBR 
其 实 就 是 DBR， 指 的 都 是 操作 系统 引导 程序 ， 位 于 各 分 区 〈 主 分 区 或 逻辑 分 区 〉 最 开始 的 扇 区 ， 访 扇 区 称 为 
操作 系统 引导 扇 区 ， 即 OBR 引导 扇 区 。OBR 的 数量 与 分 区 数 有 关 ， 等 于 主 分 区 数 加 逻辑 分 区 数 之 和 ， 友 情 提 
示 : 一 个 子 扩展 分 区 中 只 包含 1 个 逻辑 分 区 。 

MBR 和 EBR 是 分 区 工具 创建 维护 的 , 不 属于 操作 系统 管理 的 范围 ， 因 此 操作 系统 不 可 以 往 里 面 写 东 
西 ， 注 意 这 里 所 说 的 是 “不 可 以 ”， 其 实 操作 系统 是 有 能 力 读 写 任何 地 址 的 ， 只 是 如 果 这 样 做 的 话 会 破坏 
“系统 控制 权 接 力 赛 ”所 使 用 的 数据 ， 下 次 开机 后 就 无 法 启动 了 。OBR 是 各 分 区 〈 主 分 区 或 逻辑 分 区 ) 最 
开始 的 扇 区 ， 因 此 属于 操作 系统 管理 。 

DBR、OBR、MBR、EBR 都 包含 引导 程序 ， 因 此 它们 都 称 为 引导 扇 区 ， 只 要 该 扇 区 中 存在 可 执行 的 
程序 ， 该 扇 区 就 是 可 引导 扇 区 。 若 该 扇 区 位 于 整个 硬盘 最 开始 的 扇 区 ， 并 且 以 0x55 和 0xaa 结束 ，BIOS 
就 认为 该 扇 区 中 存在 MBR, 该 扇 区 就 是 MBR 引导 扇 区 。 若 该 扇 区 位 于 各 分 区 最 开始 的 扇 区 , 并 且 以 0x55 
和 0xaa 结束 ，MBR 就 认为 该 扇 区 中 有 操作 系统 引导 程序 OBR， 该 扇 区 就 是 OBR 引导 扇 区 。 

DBR、OBR、MBR、EBR 结构 中 都 有 引导 代码 和 结束 标记 0x55 和 0xaa， 因 此 很 多 同学 都 容易 把 它 
们 搞 混 。 不 过 它们 最 大 的 区 别 是 分 区 表 只 在 MBR 和 EBR 中 存在 , DBR 或 OBR 中 绝对 没有 分 区 表 。 MBR、 
EBR、OBR 的 位 置 关 系 如 图 0-21 所 示 。 
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YH 









































































































































































































































主 分 区 1 主 分 区 2 逻辑 分 区 1 逻辑 分 区 2 
Ns ~ J ~、 ~ J 
0 地 址 一 一 一 一 一 一 高 子 扩展 分 区 1 子 扩展 分 区 2 
2 ~ J 
总 扩展 分 区 





A 图 0-21 MBR、EBR、0BR 位 置 关 系 

您 看 ，MBR 位 于 整个 硬盘 最 开始 的 块 ，EBR 位 于 每 个 子 扩展 分 区 ， 各 子 扩展 分 区 中 只 有 一 个 逻辑 分 
区 。MBR 和 EBR 位 于 分 区 之 外 的 扇 区 ， 而 OBR 则 属于 主 分 区 和 逻辑 分 区 最 开始 的 扇 区 ， 每 个 主 分 区 和 好 
辑 分 区 中 都 有 OBR 引导 扇 区 。 有 关 分 区 更 详细 的 内 容 请 参阅 后 面 跟踪 分 区 表 的 章节 。 
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3 工 欲 善 其 事 ， 必 先 利 其 器 


无 法 
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导 操作 系统 已 




















加 可 





导语 言 去 构建 〈GCC 是 | 














用 4 


事 的 方法 就 











徒 ， 我 要 当 
过 郝 力 还 是 值得 饮 




















j 伪 头 拜 














西 来 构建 ， 现 在 可 以 的 
首先 ， 操 作 系统 是 软件 。 软 件 是 由 编程 


< 站 








属于 很 底层 的 东 








西 
































言 来 实现 的 ， 





， 我 双手 赞成 。 但 是 如 果 您 像 我 之 前 一 样 ， 觉 得 底层 的 东西 
大 眼睛 好 好 看 看 下 面 


Ee 
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RA 
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人 
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1 部 署 工 作 环 境 















































要 介绍 的 东 


即使 是 纺 


西 了 。 
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译 器 本 身 ， 它 的 开发 人 员 都 不 愿意 用 
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不 要 自 找 麻烦 ， 妇 





j C 语言 完成 的 )， 只 有 到 万 不 得 已 的 时 候 才 会 





























] 汇 编 语言 来 写 。 我 们 也 是 一 样 ， 能 



































0 果 某 位 大 神 能 直接 写 机 器 码 ， 小 弟 真心 寻求 与 您 见 上 一 





看 ， 希 望 您 收 我 





























写 汇 





让 CPU 到 

















解 自 己 ， 能 够 直接 同 CPU 对 


i。 不 过 话 又 说 回 











来 了 ， 直 接 写 机 器 码 也 并 不 是 

















填 么 明智 的 做 法 ， 毕 竞 费力 不 讨好 


兄 














好 的 。 同 学 们 不 要 被 我 虔诚 的 态度 误解 为 直接 写 机 器 码 是 不 可 能 的 事 ， 这 个 能 ， 必 
译 器 的 同学 做 的 就 是 这 样 的 事 ， 原 则 上 只 要 按照 IA-32 指令 格式 往 二 进 制 文件 ! 














须 和 














Ps 
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C 语音 重 


现代 操作 系 








然 不 是 为 设计 大 型 软件 
统 基本 上 



























































话 了 …… 停 ， 赶 紧 回来 ， 虹 
































而 生 的 ， 但 其 却 被 用 来 开发 大 型 软件 。 























是 用 C 语言 再 结合 ; 











[ 编 











语言 开发 的 ， 所 以 C 语言 
汇编 语言 编译 器 ， 我 们 选择 的 是 nasm。 为 什么 选择 这 两 个 ， 首 


们 是 来 写 操作 系统 的 ， 赶 紧 进 


入 主题 。 











日 译 器 ， 我 们 选择 的 是 gcc。 而 
为 它们 都 是 开源 软件 ， 其 次 其 强大 的 
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功能 不 亚 于 同类 的 商业 软件 。 
1.2.1 世界 顶级 编译 器 GCC 

秉 着 简单 至 上 的 原则 ， 我 们 在 开发 过 程 中 ， 能 用 简单 的 工具 就 不 用 复杂 的 。 所 以 我 们 的 系统 ， 绝 大 部 
分 是 C 语言 实现 的 ， 而 且 并 不 需要 多 么 高 深 的 算法 及 数据 结构 功底 。 

另外 我 们 在 Linux 下 开发 ， 所 以 首先 的 编译 器 就 是 GCC， 基 本 上 没有 人 不 了 解 这 个 大 名 易 易 的 开源 
编译 器 了 。 出 于 对 这 个 编译 器 的 膜拜 ， 我 还 是 引用 wiki 上 的 介绍 : 

GNU 编译 器 套装 (GNU Compiler Collection，GCC)， 是 一 套 由 GNU 开发 的 编程 语言 编译 器 。 它 是 


一 套 以 GPL 及 LGPL 许可 证 所 发 行 的 
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由 软体 ， 也 是 GNU 
































计划 的 关键 部 分 ， 亦 是 自由 的 类 Unix 及 苹果 






































脑 Mac OS X 操作 系统 的 标准 编译 器 。GCC (特别 是 其 











的 C 语言 编译 器 ) 也 常 被 认为 是 跨 平台 编译 

























































































































































































器 的 标准 。 

GCC 是 由 理 查 德 。 马 修 。 斯 托 曼 在 1985 年 开始 的 。 他 首先 扩展 一 个 旧 有 的 编译 器 ， 使 它 能 编译 C， 
这 个 编译 器 一 开始 是 以 Pastel 语言 所 写 的 。Pastel 是 一 个 不 可 移植 的 Pascal 语言 特殊 版 ， 这 个 编译 器 也 只 能 编 
译 Pastel 语言 。 为 了 让 自由 软件 有 一 个 编译 器 ， 后 来 此 编译 器 由 斯 托 曼 和 Len Tower 在 1987 年 以 C 语言 重 写 
并 成 为 GNU 专案 的 编译 器 。GCC 的 建立 者 由 自由 软件 基金 会 直接 管理 。 

GCC 原名 为 GNU C 语言 编译 器 (GNU C Compiler)， 因 为 它 原 本 只 能 处 理 C 语言 。GCC 很 快 扩 展 ， 
以 2011 年 10 月 26 日 释 出 的 4.6.2 版 为 准 ， 可 处 理 的 编程 语言 有 : 


1.Ada (GNAT) 
2.C(GCC) 
3.C++ (G++) 


4.Fortran (Fortran 77: 





G77,Fortran 90: 





GFORTRAN) 


5.dava (编译 器 :GCJ; 解释 器 :GIJ) 
6.0bjective-C (GOBJC) 
7.0bjective-Ct++ 


8. Go 


好 啦 ， 


他 的 评价 : 





介绍 结束 ， 看 上 
曼 (Richard Matthew Stallman) 之 手 ， 











云 GCC 1 











很 厉害 ， 居然 可 以 支持 这 么 多 语言 吾 。 























不 愧 是 出 自理 碍 德 。 马 修 。 斯 托 
































只 要 学 过 计 


算 机 的 读者 便 了 解 此 人 ， 他 到 底 有 多 厉害 呢 ， 看 网 友 对 



































“ 曾 独 上 








人 与 








众 lisp 





达 了 此 人 深厚 的 计算 机 功力 。 


回 到 正 





1.2.2 汇 

















功能 
请 用 一 句 话 


正题 ，Linux 系统 会 


编 语 言 编 1 














已 ! 











£4 

















译 器 新 贵 NASM 


新 是 相对 于 旧 来 说 的 
必然 有 所 超越 才 
降 括 NASM 





， 旧 
会 被 大 家 接受 。 
优势 在 哪里 。 


























理由 


都 是 














他 同类 


产品 不 











带 GCC， 如 果 您 





DG [=] ,十 4 二 
黑客 高 手 进 行 





的 汇编 器 MASM 和 TASM 





免费 + 语法 简洁 使 人 舒适 + 支持 Linux 平台 。 

















比赛 ……” 好 了 ， 多 说 已 无 益 ， 简 单 的 半 句 话 便 彻底 表 








的 发 行 版 中 没有 ， 可 以 到 网 站 http: /gcc.gnu.org/ 下 载 。 
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经 过 时 了 ,从 名 称 上 可 以 看 出 字母 n 是 在 m 之 


























这 里 所 说 的 任何 一 























备 的 ， 敏 锐 的 同学 是 不 是 察觉 到 了 什么 …… 











哈哈 ， 怎 么 给 人 的 感觉 是 : 其 他 











译 





器 不 是 花 钱 ， 就 是 语法 怪 











、 
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自 答 了 ， 反 正 NASM 




















生 了 ， 
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NASM 是 一 个 为 可 移植 





生 | 
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| 文件 。 
3DNow!', 


大 家 若 感 兴趣 还 是 
样 是 为 了 抒发 一 下 对 


'SSE' 和 'SSE2' 指 








自行 查阅 吧 。 





异 让 人 不 殉 ， 要 么 就 不 文 持 Linux， 看 上 去 选择 nasm 是 没 
语法 很 接近 咱们 当初 学 的 Intel 语法 ， 我 是 用 























性 与 模块 化 而 


令 集 ， 


文 位 新 贵 的 “ 爱 共 2 





先 了 ? 我 就 


得 可 i 
这 里 就 不 再 比较 其 优 
































得 很 爽 呢 。 














情 ”， 2 


绍 还 是 很 有 必要 的 。 





简要 介 





设计 的 一 个 80x86 的 汇 乡 
括 Linux 和 'NetBSD/FreeBSD'，'a.out，ELE'，'COFF'， 微 软 16 位 


它 的 语法 设计 得 相当 的 简洁 易 懂 ， 和 Intel 语法 相似 但 更 简单 。 



































家 器 。 它 文 持 相当 多 的 目标 文件 格式 , 包 
的 'OBJ 和 "Win32'。 它 还 可 以 输出 纯 二 进 
它 支持 Pentium'，'P6'，'MMX"， 






































介绍 完了 
也 避免 不 了 用 汇编 语言 ， 尤 其 是 ] 





YE 


后 ， 




















3 们 讨论 下 为 什么 要 | 

















汇编 语言 开发 系统 呢 ? 








就 目前 来 看 ,无 论 再 怎么 要 求 开 发 过 程 简单 ， 




















求 在 语言 
这 类 偏 底 








屋面 上 给 
层 的 语言 都 不 支持 修改 寄存 器 ， 
包括 我 在 内 的 很 多 同学 一 听 要 用 汇编 了 ， 都 有 


于 发 操作 系统 这 类 底 























层 软 件 。 越 底层 的 软件 就 越 要 与 硬件 直接 打交道 ， 这 就 


FS 
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村 
妆 
吾 








开发 人 员 提供 访问 端口 寄存 器 的 方法 。 显 然 ， 目 前 





的 高 级 语言 都 做 不 到 这 一 点 ， 像 C 语言 

















汇编 语言 则 








没有 称 


有 厅 烦 ， 要 考虑 


“搞定 ”。 


熟悉 的 过 程 后 都 会 变 得 
语言 和 CPU 直接 对 话 ， 想 想 就 有 点 小 兴 

不 过 好 在 我 们 需要 
)， 我 们 可 以 写 出 一 些 通用 





去 好 多 
语言 屈服 。 


操作 系统 的 宿主 环境 


操作 系统 虽然 是 软件 般 的 软件 。 我 们 平时 写 出 来 的 程序 都 是 基于 操作 系统 之 上 的 ， 


为 语言 而 是 称 % 
对 的 东西 太 多 了 ， 代码 逻辑 写 起 来 不 
我 个 人 的 感觉 是 当 我 熟悉 了 汇编 语言 后 ， 
有 亲切 感 ， 关 键 是 
奋 呢 。 
[L 编 的 地 方 只 是 一 些 硬件 访问 、 中 断 调 用 、 端 口 读 写 、 
的 代码 来 减少 ; 


















































为 东 








.A 











是 不 可 避免 的 事 了 。 
一 种 小 小 的 念 惧 感 ， 认 为 这 是 一 种 不 好 掌握 的 东西 〈 我 
道 汇编 是 什么 )， 而 且 程 序 编写 起 来 特别 























是 因为 曾经 有 个 女 同 学 都 不 知 











够 直接 ， 似 乎 总 是 在 迁 以 至 于 我 们 经 常 被 汇编 语言 
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序 本 身 是 











操作 支持 的 ， 











用 ; 








， 但 














其 可 不 是 














至 觉得 有 一 点 亲切 呢 。 当 然 了 ， 任 何 陌生 的 事物 经 过 
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们 得 捞 到 对 它 熟 悉 为 止 ， 不 外 





























1 
Do 


> 一 觉 估 WD、 
EB 让 心里 的 情 惧 战胜 自己 。 用 汇编 


























线程 切换 之 类 (怎么 看 上 
不 用 时 我 们 才 会 向 汇编 























[多 














员 的 枯燥 。 总 之 ， 





























程 

















开发 人 员 只 要 专注 





ET 














员 考 虑 的 。 而 操作 系统 这 个 软件 靠 谁 来 支持 呢 ? 


什么 Linux 之 父 
板 ， 要 多 锻炼 身体 才能 熬 得 住 

















丝 的 话 ， 刀 











Linus 那么 强壮 了 吧 ， 不 是 谁 
EF， 看 完 这 章 赶 紧 H 











> 





操作 系统 得 





相当 





于 龙 上 











都 入 








鲍鱼 ， 这 可 是 硬 菜 ， 不 出 去 跑 个 几 公 里 都 哺 不 下 来 呢 。 


去 跑步 吧 ， 玩 笑 玩笑 。 如 果 一 般 应 用 软件 能 称 得 上 旬 





己 这 块 业务 逻辑 就 好 了 , 很 多 复杂 的 问题 是 不 需要 开发 人 
是 靠 你 自己 一 身 老 骨头 打出 来 的 , 现在 明白 为 
E 随 随便 便 成 功 的 ， 所 以 ， 写 操作 系统 那 可 是 要 有 个 好 身 
肉 
也 没 


















































哈哈 ， 其 实 
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那么 夸张 ， 现在 有 很 多 计算 机 大 牛 写 了 好 多 

















也 用 不 着 

















虚拟 机 











挥 出 来 ， 造 成 了 极 大 的 ; 
































开源 软件 帮助 我 们 调试 操作 系统 。 话 说 ， 自 从 有 了 虚拟 机 ， 我 






































锻炼 身体 了 ， 每 次 出 现 bug 时 不 需要 重启 真 机 了 ， 只 需要 重启 虚拟 机 就 好 。 
1.3.1 什么 是 虚拟 机 








在 当今 已 经 不 是 陌 4 
得 ， 要 解释 一 个 东西 是 什么 ， 
了 它 是 什么 。 





拟 机 的 时 候 ， 


























一 台 机 器 只 有 交 给 























的 概念 了 ， 要 是 在 儿 年 前 ， 我 还 得 搬出 个 概念 放 在 这 给 大 家 看 看 。 个 人 和 觉 
不 如 直接 解释 这 个 东西 解决 了 哪些 问题 ， 这 样 大 家 自然 就 从 本 质 上 真正 理解 


































































































它 自 身 ， 不 会 




















节省 了 大 笔 开 销 ， 还 让 更 多 的 人 同时 使 用 了 计算 机 资源 。 
现在 很 多 厂商 都 在 搞 虚 拟 化 ， 如 ] 









































完全 发 
费 不 算 ， 还 有 很 多 人 正 等 着 用 呢 。 于 是 出 现 了 虚拟 机 的 需求 : 将 一 台 物理 机 通过 
软件 逻辑 分 割 成 几 个 虚拟 的 计算 机 ， 每 个 计算 机 之 间 互 不 干涉 ， 即 使 一 台 虚 拟 计算 机 期 溃 了 也 只 是 影响 了 














个 用 户 使 用 , 而 且 一 个 人 根本 无 法 将 这 台 机 器 的 性 能 
理 









































让 整个 物理 机 次 疾 ， 安 全 可 靠 ， 

















可 以 自由 测试 而 不 必 担 心 损伤 物理 机 。 这 不 仅 在 硬件 投入 上 





















































成 名 的 虚拟 空间 ， 还 有 如 火 如 茶 的 阿里 云 ， 这 是 虚拟 机 的 应 用 。 虚 拟 机 

















就 是 用 软件 来 模拟 硬件 。 虚 拟 机 只 是 一 个 普通 的 进程 ， 该 进程 模拟 了 硬件 资源 ， 在 虚拟 机 中 运行 的 程序 其 所 





做 出 的 任何 行为 都 9 











E 被 虚拟 机 检查 ， 




















虚拟 机 分 析 后 ， 代 为 向 操作 系统 申请 。 






































上 面 对 虚 拟 机 的 解释 是 主观 上 的 理解 ， 我 可 不 愿意 说 概念 了 ， 因 为 概念 是 对 事物 的 抽象 。 抽 象 就 意味 
































着 不 易 理 解 
段 设 V 
地 放 在 磁盘 
是 此 进程 中 















































， 容 易 把 简单 的 事 复杂 化 。 我 举 个 简单 的 例子 来 说 明 什 么 是 虚拟 机 。 
是 虚拟 机 进程 ，U 是 普通 的 用 户 程序 。 程 序 运行 起 来 才 叫 进程 ， 进 程 是 要 有 pcb 的 ,程序 老实 










































































上 不 动 ， 那 可 不 叫 进 程 。 虚 拟 机 跑 起 来 后 ， 就 形成 了 进程 V， 在 它 被 调度 期 间 ，CPU 执行 的 





























的 指令 。 让 虚拟 机 执行 U 程序 ， 
参数 传 给 了 V 程序 ，U 程序 就 像 文 章 一 样 由 

















有 如 解释 器 进程 在 解析 脚本 文件 一 样 ， 此 时 的 U 程序 被 当 作 
V 进程 阅读 。 还 是 拿 解 释 型 语 言 举例 了 ， 比如 python 语言 ， 

































































其 脚本 从 来 就 没有 直接 作用 于 CPU 上 ， 而 是 将 其 字 节 码 交 给 了 python 解释 器 ， 这 个 解释 器 将 通过 python 


虚拟 机 来 代为 完成 python 脚本 中 的 代码 行为 。 





让 我 们 


码 : fh=open (“hello.txt”，'w')， 这 是 在 用 可 























说 得 再 具体 


点 ， 比 如 在 Linux 


























件 句柄 印 便 操 作 了 文件 hello.txt。python 





脚本 file.py 
为 它们 而 生 






































内 容 以 后 中 





们 在 后 











工作 。 
选择 虚 








的 系统 中 细 说 )， 通 





F 台 上 ， 写 了 一 个 python 脚本 文件 血 e.py， 其 中 有 这 样 一 句 代 









































写 的 方式 打开 hello.txt 文件 ， 将 其 句柄 返回 给 加。 自 此 操作 文 
虚拟 机 是 一 个 进程 , 它 是 直接 作用 在 硬件 之 上 的 。 当 它 分 析 python 
中 上 面 的 那 句 代 码 时 ， 发 现 有 关键 字 open (当然 关键 字 得 是 python 解释 器 支持 的 ， 此 解释 器 






























































拟 机 的 原因 如 下 。 








1. 运行 方便 











它 己 在 宿主 系统 上 只 是 

















程 咱们 都 可 以 随意 启动 ， 虚 拟 机 也 是 一 样 的 ， 
2. 保护 计算 机 














如 果 您 


有 一 般 的 软 伯 























个 进程 ， 在 宿主 系统 如 Linux 眼 里 ， 它 与 一 般 的 用 户 进程 是 没 任何 区 别 的 。 进 


























em ee i ln sd 其 内 部 是 封装 的 系统 调用 (系统 调用 这 方面 
过 系统 调用 ，python 虚拟 机 蔡 python 脚本 完成 了 打开 hello.txt 的 




























































































在 这 一 点 保证 了 使 用 上 的 方便 性 。 














F 开 发 经 验 ， 就 会 了 解 ， 很 少 有 程序 能 一 下 就 编译 通过 。 当 然 ， 如 果 您 的 编程 经 验 
































无 比 丰富 ， 代 码 无 比 规范 ,无比 了 解 编译 器 ， 确 实 不 需要 庶 拟 机 来 调试 了 ， 编 写 完成 后 直接 就 能 运行 。 以 
上 我 用 了 三 个 “无 比 ”, 打造 了 似乎 没有 人 能 达到 这 种 水 平 的 假象 ,其实 是 有 的 ,不 知道 大 家 听 说 过 Jon Skeet 
谷歌 软件 工程 师 , 《C# Im Depth》 




















没有 ， 他 是 
知道 我 说 的 


“他 并 不 需要 调试 器 ， 只 要 他 有 盯 着 代码 看 








并 不 夸张 了 。 






























































就 是 他 的 作品 。 看 看 别人 对 他 是 怎样 评价 的 ， 看 完 之 后 您 就 

















几 眼 ，Bug 自己 就 跑 出 来 了 ”。 





“他 根本 不 需要 什么 编程 规范 ， 他 的 代码 束 是 规范 ”。 





“如 果 人 

















也 的 代码 没有 通过 编译 ， 编 译 器 | 

















如 果 
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们 都 不 能 保 订 




















商 就 会 道歉 ”。 




















FE 写 出 这 样 质量 出 色 的 代码 ， 咀 们 还 是 老 老 实 实地 装 虚拟 机 吧 。 因 为 如 果 要 把 操作 




















系统 装 在 真 机 器 


























虚拟 机 必 装 不 可 。 不 知道 你 们 心疼 电脑 吗 ， 
性 格 和 水 瓶 座 有 没有 关系 。 




















说 了 虚拟 机 的 好 处 ， 那 咀 们 有 哪些 虚拟 机 可 
亡 ， 能 有 了 时 间 拿 起 书 不 容易 

















大 家 都 这 么 中 








上 ， 每 次 调试 的 时 候 ， 无 论 代 码 是 否 衣 泪 ， 都 是 要 重启 计算 机 的 。 为 了 保护 只 








反正 我 要 是 一 天 开 





























啊 ， 为 了 不 

















机 了 ， 种 类 再 多 ， 也 只 是 选 一 个 。 我 们 要 





的 就 是 bochs。 选 








(1) 开源 ， 有 感 于 作者 的 奉献 精神 ， 我 们 要 支持 作者 〈 当 
周 试 ， 还 支持 gdb 远程 

















(2) 支持 调试 ， 不 仅 原生 支持 i 
(3) 我 只 会 这 个 。 








对 于 虚拟 机 的 选择 ， 能 工作 能 调试 够 用 锅 











后 面 的 写 操作 系统 ， 学 太 多 的 虚拟 机 也 没 " 
































ii 行 了 ， 遇 到 
合用 。 


问 





介绍 一 下 bochs 吧 ， 怎 


么 也 得 让 大 家 有 个 初步 的 印象 。 下 画 











4 








就 是 从 繁体 中 文 翻译 成 了 


简体 中 文 ， 而 且 只 有 

















Bochs (发 音 : box) 是 一 个 以 LGPL i 




















和 
常见 硬件 外 设 的 
许多 客 











仿真 。 























BSD、Linux、MorphOS、Xenix 和 Rhapsody (Mac OS X 的 前 身 )。Bochs 能 在 许多 主机 操作 系统 








所 





可 | 

















电脑 三 次 以 上 ， 











们 的 爱 机 ， 
我 就 会 很 自 责 ， 不 知道 这 种 














等 


j 呢 。 一般 的 有 qemu、bochs、virtualBox、xen 和 vmware 等 。 


恨 费 您 宝贵 的 时 间 ， 我 就 不 说 和 本 书 不 相关 的 虚拟 

















择 bochs 的 理由 




















题 时 再 寻求 新 方案 也 不 迟 ， 毕 苋 咱 




















如 Windows、Windows Mobile、Linux、Mac OS X、iOS 和 PlayStation 2。 








Bochs 主要 用 














仿真 操作 系统 ) 和 在 主机 操作 系统 运行 其 他 来 宾 操 作 系 统 。 它 也 可 以 




















脑 游戏 )。 








它 的 优点 在 于 能 够 模拟 跟 主 机 不 同 的 机 种 ， 例 如 在 Sparc 系统 里 模拟 x86， 但 缺点 是 它 的 速度 却 慢 











如 下 。 


然 qemu 也 是 )。 
周 试 (当然 gemu 也 是 )。 











们 的 重点 是 

















的 内 容 是 我 从 维基 百科 翻译 过 来 的 ， 其 实 
几 个 繁体 字 ， 哈 哈 。 
J 证 发 放 的 开放 源 代码 的 x86、x86-64IBM PC 兼容 机 模拟 器 
周斌 工具 。 它 支持 处 理 器 (包括 保护 模式 )、 内 存 、 人 硬盘、 显示器、 以 太 网 、BIOS、IBM PC 兼容 机 的 








户 操 作 系 统 能 通过 该 仿真 器 运行 ， 包 括 DOS、Microsoft Windows 的 一 些 版 本 、AmigaOS 4、 


a 


运行 ， 


例 


于 操作 系统 开发 〈 当 一 个 模拟 操作 系统 月 恋 ， 它 不 崩溃 主机 操作 系统 ， 所 以 可 以 调试 





























介绍 完了 ， 不 知道 您 看 了 吗 ， 不 看 也 行 ， 反 1 


间 般 的 开发 环境 ， 虚 拟 机 中 再 装 一 个 虚拟 机 


的 系统 都 是 Windows, 个 别 的 是 Mac OS, 还 有 的 
台 下 。 那 对 于 其 他 系统 的 


次 林 空 


1.3.2 次 欧 空 
很 多 同学 电 有 有 














ll: 





粉丝 ， 我 的 开发 环境 必然 建立 在 Linux 平 






























































的 开发 环境 ， 用 的 工具 都 是 一 样 的 ， 无 非 是 换个 相应 平台 的 版 本 。 
样 那样 和 

面 精彩 的 内 容 没 有 观众 该 怎么 办 。 为 了 减少 学 习 的 困 

在 睡觉 的 时 候 想 到 一 个 好 办 法 ， 能 让 大 家 的 开发 环境 极 大 限度 
一 个 虚拟 机 。 






































E 以 后 1 











们 实际 应 








] 时 还 会 























j 户 ， 




















> 





首先 虚拟 机 是 个 软件 





不 会 伤害 ! 








们 的 爱 机 。 























是 给 像 我 这 样 的 穷人 最 好 的 礼物 ， 当 初学 习 思 科 








ss 
口 





第 一 全 


计算 机 ， 和 否则 还 真 买 不 起 第 二 台 
们 的 方案 是 这 个 虚拟 机 就 用 virtualBox 吧 ， 



































难 ， 也 为 了 


我 一 度 认为 虚 拒 
网 络 、 路 由 器 等 方面 知识 ) 时 ， 








医 

















结 











pA 





(1) 个 人 觉 
(2) virtualBox 是 免费 的 ， 不 需 








要 




















(3) 因为 我 不 想 改 成 别 的 了 ， 嫌 奔 烦 ， 请 大 家 原谅 。 
交待 过 了 之 后 ， 大 家 还 是 根据 自己 喜好 选择 虚拟 机 ， 大 家 觉得 




















方案 再 多 也 总 该 选择 一 个 , 我 选择 的 方 








所 以 选 的 是 与 redhat 很 接近 的 CentOS， 我 


导 virtualBox 比 vmware 更 轻 上 





























， 配 














尾 加 了 个 “ 吧 ” 但 
哈哈 ， 抱 歉 ， 我 这 也 绝对 不 是 强硬 。 让 小 弟 我 给 大 家 个 交待 。 
置 起 来 更 简单 。 
破解 ， 这 一 点 很 重要 。 





电脑 ， 所 以 大 家 一 定 要 好 好 学 习 ， 不 要 像 我 当初 天 


得 到 统一 ， 就 是 我 们 加 


机 是 一 项 非常 伟大 的 发 明 ， 其 





行 不 兼容 的 旧 的 软件 (如 电 




















四 说 的 。 


同学 用 的 是 Linux。 作 为 一 名 Linux 
你 们 可 以 
不 过 我 担心 由 于 平台 不 同 而 造成 这 
的 问题 ， 会 减退 大 家 学 习 的 积极 性 ， 妆 力 不 足 的 同学 还 没 开 始 写 操作 系统 就 急流 勇 退 了 ， 我 后 
让 大 家 继续 为 我 后 面 的 内 容 捧 场 ， 我 





要 


己 部 署 相 应 平台 





















































安装 





一 
云 ， 


至 认为 它 
亏 有 虚拟 机 来 模拟 多 
Pp 样 率 负 了 虚拟 机 。 我 





i 


Ee 





























我 丝毫 没有 征求 大 家 意见 的 意思 ， 

















案 是 






























































著 个 方便 就 用 哪个 。 
在 virtualBox 中 安装 个 操作 系统 。 
的 版 本 是 6.3， 本 书 








大 








为 要 在 Linux 下 开发 ， 





以 后 便 以 virtualBox+CentOS 6.3 为 例 。 
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1 于 我 后 续 的 环境 部 署 都 是 在 此 版 本 上 进行 的 ， 没 遇 到 什么 大 问题 ， 确 实感 觉 很 稳定 ， 简 单 可 依赖 。 
在 CentOS 中 再 装 个 bochs， 最 终 我 们 的 代码 运行 在 bochs 中 。 

想 当 初 莱 欧 纳 多 的 电影 《 盗 梦 空间 》 上 了 映 时 ,很 多 朋友 都 被 故事 的 新 颖 所 吸引 ， 大 概 意思 
的 梦 中 去 窃取 机 密 ， 如 果 第 一 层 梦 境 窃 取 不 到 ， 还 可 以 在 梦 中 继续 睡觉 ， 再 进入 第 二 层 ， 也 就 
是 标题 中 所 说 的 ， 虚 拟 机 中 再 装 个 虚拟 机 ， 您 看 ， 描 述 还 是 有 些 形象 的 。 


1.3.3 virtualBox 下 载 ， 安 装 


virtualBox 官方 下 载 地 址 是 http: //download.virtualbox.org/virtualbox， 大 家 选择 一 个 适合 自己 系统 平 
台 的 版 本 , 我 安装 的 是 4.2.12 mac 版 本 ， 有 具体 下 载 地 址 是 http: //download.virtualbox.org/virtualbox/4.2.12/， 
大 家 可 以 自行 选择 。 

MacOS 和 Windows 基本 上 virtualBox 的 安装 是 一 路 回 车 ， 没 什么 可 说 的 。 如 果 您 用 的 系统 是 Linux， 
我 更 觉得 说 什么 都 显得 多 余 ， 因 为 能 用 Linux 办 公 ， 说 明 您 完全 有 能 力 安装 成 功 。 


1.3.4 Linux 发 行 版 下 载 


可 以 在 mirrors.163.com 这 个 国内 的 镜像 源 去 下 载 自己 喜欢 的 版 本 。 
1 于 CentOS 官方 的 告示 ， 目 前 6 系列 的 版 本 只 有 6.5 可 用 ， 其 他 低 版 本 不 再 支持 。 喜 欢 CentOS 的 
朋友 可 以 趁机 装 个 新 版 本 。 如 果 您 像 我 一 样 执 掏 非 6.3 版 本 不 装 ， 我 也 给 出 了 官方 的 链接 地 址 ， 大 家 其 
http: //vault.centos.org/6.3/isos/i1386/CentOS-6.3-1386-bin-DVD1.iso 
大 家 根据 自己 虚拟 机 的 种 类 开始 安装 Linux 吧 , 由 于 版 本 和 宿主 系统 种 类 较 多 我 不 便 将 安装 步骤 一 一 
给 出 ， 大 家 若 有 不 懂 的 问题 请 自行 查阅 ， 百 度 经 验 上 有 很 多 方法 ， 若 第 一 次 用 虚拟 机 ， 大 家 可 以 参考 下 面 
链接 的 方法 。 
http: Wjingyan.baidu.comyarticle/414eccf61dl12ccob431foae7.html。 


1.3.5 “Bochs 下 载 安 装 


在 完成 了 Linux 发 行 版 的 安装 后 ， 现 在 到 了 安装 bochs 的 环节 ， 这 是 我 们 的 操作 系统 最 终 的 宿主 机 。 
由 于 我 的 工作 是 运 维 ， 所 以 练 就 了 任何 软件 包 都 要 从 源码 安装 的 “陋习 ” 从 来 不 信任 任何 软件 包 。 
因为 只 有 从 源码 安装 的 版 本 才 会 在 其 配置 和 编译 过 程 中 根据 所 在 的 平台 的 特性 去 优化 , 这 些 是 其 他 形式 的 
软件 包 不 可 比拟 的 。 举 个 例子 , 将 别人 的 Windows 系统 直接 ghost 到 自己 的 机 器 上 和 从 光盘 安装 Windows 
比 ， 哪 个 装 的 Windows 系统 用 得 更 稳定 ， 哪 个 安装 方法 能 让 Windows 坚持 到 半年 才 重 装 一 次 …… 我 不 能 
再 说 了 ， 我 作为 Linux 粉丝 的 事实 已 表 圳 无遗。 虽然 我 个 人 偏爱 Linux， 但 绝对 不 能 否认 ， 是 Windows 把 我 
带 入 计算 机 世界 的 。 这 个 开 世界 若 没有 Windows 将 暗淡 70% 的 光芒 。 其 实 原先 我 写 的 是 90%, 我 伯 有 人 问 
我 这 个 数 是 怎么 来 的 , 这 是 我 一 拍 脑 门 随口 说 出 来 的 , 所 以 我 稳妥 起 见 改 为 了 70% , 总 之 , 不 能 无 视 Windows 
的 伟大 功绩 。 

bochs 的 安装 相对 要 麻烦 一 些 ， 不 光 是 装 上 去 就 行 了 ， 还 需要 配置 一 下 。 

软件 包 得 传 到 虚拟 机 上 才能 安装 到 虚拟 机 里 ， 如 何 传 上 去 呢 。 下 面 建议 了 3 个 方案 。 

(1) 给 虚拟 机 装 个 ftp， 通 过 ftp 上传 。 

(2) 让 虚拟 机 连 网 ， 直 接 下载。 

(3) 虚拟 机 支持 USB， 通 过 如 盘 上 传 软件 包 。 
第 1 个 方案 需要 配置 ftp 服务 器 ,我 用 的 是 proftpd， 相 对 来 说 有 点 麻烦 ， 也 是 需要 单独 配置 的 。 而 且 
默认 Linux 的 iptables 会 有 一 些 规则 ， 需 要 手动 将 其 关闭 。 
第 2 个 方案 较 简单 ， 在 您 的 宿主 系统 可 以 连 网 的 情况 下 ， 需 要 您 自己 配置 一 下 virtualBox 的 网 卡 ， 将 网 卡 部 
分 改 为 NAT 可 以 通过 宿主 系统 连 网 ， 将 网 卡 改 为 桥接 可 以 直接 连 网 。 由 于 大 家 的 版 本 不 统一 ， 虽 然 不 知道 界 阳 
是 否 接近 ， 但 菜单 名 称 总 该 是 一 样 的 。 我 用 的 是 mac 版 virtual Box， 给 大 家 截 个 图 看 看 ， 如 图 1-1 所 示 。 




















































































































通过 潜入 别人 
了 2 
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昌国 加 贸 多 


General System Display Storage Audio 


可 


Network 








站 国 


Ports Shared Folders 





[Adapter1 | Adapter 2 Adapter 3 


[Vi Enable Network Adapter 





Attached to: | NAT + 
Name: 
BD Advanced 











A 图 1-1 virtual Box 





将 网 卡 模式 改 为 NAT 后 ， 虚 拟 机 就 可 以 连 网 了 。 












































第 3 个 方案 最 方便 了 ， 大 家 自己 试 一 下 吧 。 





Adapter 4 | 


好 了 ， 下 面 就 假设 大 家 能 够 把 安装 包 上 传 到 虚拟 机 中 ， 安 装 走 起 。 











1. 下 载 bochs 





bochs-2.6.2.tar.gz。 
2. 解压 压缩 包 tar zxvf bochs-2.6.2.ta 
3. 编译 


先进 入 到 目录 cd bochs-2.6.2， 开 始 configure、make、make install 三 步 曲 。 


./configure \ 
——prefix=/your path/bochs \ 
—--enable-debugger\ 
—--enable-disasm \ 
—-enable-iodebug \ 
—-enable-x86-debugger \ 
——with-x \ 

一 -with 一 XI11 





r.gZ 












































-prefix=/your path/bochs 是 用 来 指定 bochs 的 安装 目 
































--enable-dqebugger 打开 bochs 自己 的 调试 器 。 














--enable-disasm 使 bochs 支持 反 汇编 。 
--enable-iodebug 启用 io 接口 调试 器 。 


























--enable-x86-debugger 支持 x86 调试 器 。 




















--with-x 使 用 x windowso 
--with-x11l 使 用 x11 图 形 接口 。 



























































上 面 的 编译 参数 是 不 支持 gdb 远程 调试 的 ， 如 果 想 





--enable-gdb-stub。 

















--enable-gdb-stub 用 来 打开 对 gdb 的 支持 ， 这 档 


























pes 








官方 地 址 是 http: //sourceforge.net/projects/bochs/files/bochs/， 我 安装 的 版 本 是 2.6.2， 下 载 后 的 文件 是 

















注意 各 行 结尾 的 \ 字 符 前 面 有 个 空格 。 下 面 简要 说 明 一 下 configure 的 参数 。 
录 , 根 据 个 人 实际 情况 将 your_path 替换 为 自己 待 安装 的 路 径 。 





























|] gdb 调试 ， 就 要 将 参数 --enable-debugger 蔡 换 为 




















TT 











不 过 ,需要 注意 的 是 不 能 同时 打开 这 两 个 玫 





and --enable-gdb-stub are mutually exclusive。 


也 就 是 说 ，bochs 本 身 是 支持 调试 





能 掌 在 一 人 台 模 拟 嚣 上 不 可 兼 得 。 我 说 的 是 一 人 台 模 拟 嚣 上 不 可 兼 得 ， 所 以 ， 如 果 您 愿意 的 话 ， 可 以 用 

















的 ， 要 么 用 本 身 的 调 























我 们 就 可 以 用 gdb 来 远程 调试 了 。 
F 关 , 否则 bochs 会 报错 , 即 configure: error: --enable-debugger 








试 功能 ， 要 么 用 gdb 的 调试 功能 ， 鱼 和 
































这 两 个 参数 各 编译 一 版 ， 只 要 --prefix 指向 不 同 的 路 径 就 行 了 ， 想 用 哪个 就 启用 哪个 。 

















不 过 我 在 开发 过 程 中 ， 只 用 过 不 超过 5 次 的 gdb j 








更 强大 ， 调 试 粒度 更 细微 ， 反 而 更 灵 沪 
--enable-gdb-stub。 





9。 个 人 建议 ， 直 接 月 








configure 之 后 ， 会 生成 Makefile， 可 以 开始 编译 了 。 


| make 














周 试 ， 还 是 习惯 bochs 自己 的 调试 功能 ， 个 人 觉得 它 














有 给 出 的 configure 参数 就 行 ， 不 要 打开 
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1 部 署 工作 环境 

若 编译 时 没有 问题 ， 就 直接 执行 下 面 这 句 。 
| make install 

补充 一 下 ， 在 编译 用 bochs 调试 功能 的 版 本 时 (用 --enable-debugger)， 曾 经 安装 失败 过 ， 如 果 您 也 在 
安装 过 程 中 失败 了 ， 恰 好 出 现 类 似 下 面 的 报错 : 
和 

您 可 以 按照 下 面 的 方法 解决 。 如 果 不 是 这 个 报错 ， 亲 ， 您 可 能 要 辛苦 一 下 自行 解决 啦 。 

上 面 报错 的 原因 : 

pthread 库 不 是 Linux 系统 默认 的 库 ， 连 接 时 需要 使 用 静态 库 libpthread.a， 所 以 在 使 用 pthread_createO 
创建 线程 ， 以 及 调用 pthread_atforkO 函 数 建立 fork 处 理 程序 时 ， 需 要 链接 该 库 。 

解决 方案 : 

在 编译 中 要 加 -lpthread 参数 。 用 vim 编译 makefile, vim 是 Linux 下 功能 最 为 强大 的 文本 编辑 器 。vim 
Makefile 回 车 : 

编辑 第 92 行 ， 将 thread 库 加 入 ， 将 其 放 在 行 末尾 就 行 了 。 











村 





-1.0 -1Lcairo -lpango-1. 


新 编译 ，make 回 





在 


om 











配置 CDi 


安装 完成 后 该 配置 bochs 了 ， 它 是 通过 配置 文件 
它 有 点 类 似 BIOS。 我 们 在 开机 时 按 下 的 del、esc， 或 者 F2 键 ， 各 个 机 型 
硬件 的 信息 ， 还 有 


要 说 这 个 配置 文件 ， 
式 有 所 不 同 ， 但 差不多 就 那 几 种 方式 。BIOS 中 会 显示 各 利 
模拟 的 计算 机 是 什么 样 的 ， 换 名 话说 ， 石 














件 的 ， 它 就 得 知道 ， 
































Sg 


您 需要 它 


/处 














完成 的 。 








车 


I 











广 o 




















局 动 顺 ) 





IBS =-lm -lgtk-x11-2.0 -lgdk-x11-2.0 -latk-1.0 -lgio-2.0 -LIPangoft2-1.0 -lgdk pixbuf-2.0 -lpangocairo 
0 -lfreetype -lfontconfig -lgobject-2.0 -lgmodul 


看 问题 是 否 解决 ， 成 功 解决 后 直接 make install 


e-2.0 -lglib-2.0 -lpthread 

















J 进入 BIOS 方 


序 等 。Bochs 既然 是 模拟 硬 

































































E 这 个 虚拟 机 中 有 





哪些 便 





件 ， 启 动 顺序 是 什 


























































































































么 ， 是 从 软盘 开始 ， 还 是 从 硬盘 开始 ? 人 家 也 得 像 模 像样 地 跟 BIOS 差不多 才 行 。 给 bochs 配置 硬件 的 方法 ， 就 
是 写 一 个 配置 文件 给 它 ，bochs 启动 时 会 找到 此 文件 ， 根 据 文件 内 容 创 建 自己 ， 这 样 咱们 的 虚拟 机 就 健全 了 。 

在 安装 目录 下 有 样本 文件 share/doc/bochs/bochsrc-sample.txt。 由 于 此 文件 有 1130 行 ， 确 实 有 些 长 ， 
就 不 贴 出 来 了 ， 摘 点 重点 内 容 ， 关 于 启动 顺序 ， 可 参见 该 文件 的 以 下 几 行 ( 左 列 的 数字 是 行 号 )。 

531 t 

32 BOOT: 

533 # This defines the boot sequence. Now you can specify up to 3 boot drives, 

534 # which can be '‘'floppy', ‘disk', 'cdrom' or "network' (boot ROM). 

535 # Legacy 'a' and 'c' are also supported. 

536 # Examples: 

537 boot: floppy 

538 # boot: cdrom, disk 

539 # boot: network, disk 

540 boot: cdrom, floppy, disk 

541 # 

542 #boot: floppy 

543 boot: disk 

下 面 是 能 够 支持 gdb 的 bochs 配置 文件 ， 给 大 家 当 作 参考 。 




















[work@localhost bochs]$ cat bochsrc.disk 























cat 全 


非 # 井 提 # 井 捍 井 井 音 提 非 提 提 埋 提 提 捍 提 井 持 提 井 捍 提 井 音 提 井 砷 提 埋 提 提 埋 提 提 持 提 井 捍 井 井 间 提 非 太 
# Configuration file for Bochs 
非 # 井 非 # 井 提 井 井 提 提 # 提 提 埋 提 提 捍 提 井 持 提 井 捍 提 井 提 提 井 六 提 埋 提 提 埋 提 井 持 提 井 捍 井 井 间 提 非 太 
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令 显 示 bochsrc.disk 



































# 第 一 步 ， 首 先 设置 Bochs 在 运行 过 程 中 能 够 使 用 的 内 存 ， 本 例 为 32MB。 


























消 ， 
# 关键 字 为 : megs 
megs: 32 


# 第 二 步 ， 设 置 对 应 真实 机 器 的 BIOS 和 VGA BIOS。 
# 对 应 两 个 关键 字 为 : romimage 和 vgaromimage 





romimage: file=/ 实 际 路 径 /bochs/share/bochs/BIOS-bochs-1Latest 
vgaromimage: file=/ 实 际 路 径 /bochs/share/bochs/VGABIOS-lgpl-latest 























# 第 三 步 ， 设置 Bochs 所 使 用 的 磁盘 ， 软 盘 的 关键 字 为 floppy。 


由 





























# 若 只 有 一 个 软盘 ， 则 使 用 floppya 即 可 ， 若 有 多 个 ， 则 为 floppya， floppyb… 


#floppya: 1 44=a.img, status=inserted 







































































# 第 四 步 ， 选 择 启动 盘 符 。 

#boot : floppy  ”# 默 认 从 软盘 启动 ， 将 其 注释 

boot: disk # 改 为 从 硬盘 启动 。 我 们 的 任何 代码 都 将 直接 写 在 硬盘 上 ， 所 以 不 会 再 有 读 写 软盘 的 操作 。 
# 第 五 步 ， 设 志文 件 的 输出 。 




















l165: bocshs,.out 














# 第 六 步 ， 开 启 或 关闭 某 些 功 能 。 

# 下 面 是 关闭 鼠标 ， 并 打开 键盘 。 
mouse: enabled=0 

keyboard mapping: enabled=1, 


map=/ 实 际 路 径 /bochs/share/bochs/keymaps/xll-pc-us 





















































# 硬盘 设置 


.map 


ata0: enabled=1, ioaddr1l=0xlf0, ioaddr2=0x3f0, irq=14 














# 下 


























非 莫 间 间 井 井 井 井 井 井 划 并 井 井 井 ## 井 #。 配置 文件 结束 非 间 # 非 间 非 提 捍 提 提 提 提 提 提 提 

















的 是 增加 的 bochs 对 gdb 的 支持 ， 这 样 gdb 便 可 以 远程 连接 到 此 机 器 的 1234 端口 调试 了 
gdbstub: enabled=1, port=1234, text base=0, data 





base=0, bss base=0 


非 ###### 砷 























好 了 ， 现 在 将 上 面 的 配置 文件 存 为 bochsrc.disk 放 在 bochs 安装 目录 下 。(bochs 配置 文件 位 置 不 固定 ， 
名 字 也 不 要 求 固定 ), 后 级 .disk 是 我 人 为 加 的 , 为 了 表示 此 配置 文件 配置 的 内 容 是 从 硬盘 启动 ， 这 样 较 明确 。 





























运行 G8; 把 





















































终于 安装 完成 了 ， 虽 然 这 过 程 中 有 可 能 会 出 现 各 种 各 样 的 问题 ， 但 还 是 值得 庆祝 的 ， 对 Linux 不 熟 的 朋友 第 
一 次 就 搞定 了 这 人 么 个 硬 货 ， 我 理解 您 此 时 的 喜 大 普 奔 之 情 ， 哈 哈 ， 给 大 家 点 赞 。 顺便 说 一 句 ， 其 实 平时 我 们 的 运 






























































维和 人 员 为 开发 环境 付出 了 远 比 这 更 多 的 努力 ， 所 有 奋战 在 

不 过 好 奇 心 让 我 们 按 探 不 住 想 一 探 bochs 容貌 , 说 
实在 的 ， 我 现在 就 想 先 运行 一 下 看 看 ， 失 败 又 能 怎样 ， 
无 非 是 报错 退出 呐 , 又 不 会 造成 实质 性 的 损失 。 我 非常 
理解 大 家 的 心情 , 虽然 现在 还 差点 东西 没完 成 , 但 作为 
求知 欲 强 的 技术 人 必须 得 获得 理解 和 支持 , 那 现 在 咱们 
先 运行 一 下 bochs 试 试 ， 至 少 检测 下 是 不 是 安装 正确 
了 ,反正 不 会 破坏 咱们 的 电脑 ， 缺 什么 的 时 候 咱 们 再 创 
怕 被 读者 埋怨 我 太 呢 味 , 赶紧 在 bochs 安装 路 径 下 键 
入 bin/bochs 并 赶紧 按 下 了 回 车 , 运行 效果 如 图 1-2 所 示 。 
看 ，bochs 界面 中 给 出 的 提示 符 默 认 选 项 是 [2]， 
Read options from...， 这 是 bochs 要 读 取 选项 的 节奏 啊 ， 
也 就 是 说 要 读 取 配 置 文件 , 直接 按 回 车 键 。 运行 结果 如 
图 1-3 所 示 。 
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线 的 系统 工程 师 和 运 维 工 程 师 ， 您 们 辛苦 了 。 

















Bochs x86 Emulator 2.6.2 
Built from SVN snapshot on May 26, 2013 
Compiled on Jul 22 2014 at 16:23:42 





This is the Bochs Configuration Interface, where you can describe the 
machine that you want to simulate. Bochs has already searched for a 
configuration file (typically called bochsrc.txt) and loaded it if it 
could be found. When you are satisfied with the configuration, go 
ahead and start the simulation. 


You can also start bochs with the -q option to skip these menus. 


. Restore factory default configuration 
. Read options from,.. 

. Edit options 

. Save options to... 

。Restore the Bochs state from... 

. Begin simulation 

. Quit now 


| 











Pp 
/六 


1-2 ”bochs 启动 界面 1 


























49 


Please choose one: [2] 


What is the configuration file name? 

To cancel, type 'none'. tnone] [oochsre Ais] 

00000000000i[ ] reading configuration from bochsrc.disk 

00000000000e[ ] bochsrc.disk:30: "keyboard_mapping' will be replaced by new 'keyboard' option 


Bochs Configuration: Main Menu 


This is the Bochs Configuration Interface, where you can describe the 
machine that you want to simulate. Bochs has already searched for a 
configuration file (typically called bochsrc.txt) and loaded it if it 
could be found. When you are satisfied with the configuration, go 
[0 


You can also start bochs with the -q option to skip these menus. 


. Restore factory default configuration 
. Read options from... 

. Edit options 

。Save options to... 

. Restore the Bochs state from... 

. Begin simulation 

. Quit now 





Please choose one: [6] 








六 | 
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我 们 键入 的 是 上 面 长 方形 框框 中 的 部 分 : bochsrc.disk。 由 于 我 们 刚刚 把 此 文件 放 到 了 bochs 的 安装 路 
径 下 ，bochs 找到 了 它 并 加 载 成 功 。 紧 接着 下 面 给 出 的 默认 选项 变 成 了 [6]， 也 就 是 Begin simulation 选项 ， 
开始 模拟 x86 硬件 平台 。 
再 多 说 一 多，bochs 如 果 加 载 不 到 配置 ， 它 是 不 会 向 下 运行 的 ， 所 以 在 图 1-3 中 ， 白 色 方 框 中 知 不 键入 配置 
文件 名 而 直接 回 车 ， 还 是 会 回 到 图 1-2 所 示 的 界面 ， 必 须 给 出 配置 让 bochs 知道 您 想 模拟 的 硬件 是 什么 才 行 。 
继续 回 车 ， 马 上 就 有 效果 了 ， 不 过 是 报错 了 ， 如 图 1-4 所 示 。 
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Device: [BI0S ] 
Message: No bootable device。 


[work@localhost bochs]$ bin/bximage --help 
Usage: bximage [options] [fiLename] 
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11545 5 SDate: 2012-11-11 09:11:17 +*0100 (So，11. Now 2912) $ 
mbios pcibios pnpbios eltorito rombios32 


Supported options: 
-fd create fLoppy image 
-hd create hard disk image 
-mode=. .. image mode (hard disks only) 
-Size=... image size in megabytes 
-9q quiet mode (don't prompt for user ;input) 
--help display this help and exit 


Press F12 for boot menu. 


Booting from Hard Disk... 
oot failed: could not read the boot disk 


ATAL: No bootable device. 





[work@localhost bochs]$ 
A 图 1-4 ”bochs 启动 时 找 不 到 启动 盘 4 图 1-5 bximage 工具 


















































哎哟 ， 不 错 哦 ， 果 然 没 白 测试 ， 报 的 这 是 个 PANIC 级 别 的 错误 ，BIOS 说 :“ 没 有 启动 设备 ” 

缺 什 么 我 们 就 创建 什么 ， 提 示 没 有 的 这 个 “bootable device” 就 是 启动 盘 ， 现 在 就 创建 启动 盘 吧 。 

bochs 先生 说 :“ 作 为 一 个 负责 任 的 模拟 器 ， 既 然 干 的 就 是 模拟 硬件 的 工作 ， 那 就 要 把 硬件 都 模拟 全 
了 2” 所 以 bochs 给 咱们 提供 了 创建 虚拟 硬盘 的 工具 bin/bximage。 我 们 先 看 下 这 个 命令 的 帮助 ， 如 图 1-5 
所 示 。 

-fd 创建 软盘 。 

-hd 创建 硬盘 。 

-mode 创建 硬盘 的 类 型 ， 有 flat、sparse、growing 三 种 。 

-size 指 创建 多 大 的 硬盘 ， 以 MB 为 单位 。 

-q 以 静默 模式 创建 ， 创 建 过 程 中 不 会 和 用 户 交 互 。 

按照 上 面 的 帮助 ， 那 咱们 就 开工 啦 ， 如 图 1-6 所 示 。 


| bin/bximage -hd -mode="flat" -size=60 -qd hd60M.img 


这 个 命令 串 中 最 后 一 个 hd60M.img 是 咱们 创建 的 虚拟 硬盘 的 名 称 。 
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[work@localhost bochs]$ bin/bximage -hd -mode="flat" -size=60 -q hd60M,img 





bximage 
Disk Image Creation Tool for Bochs 
$Id: bximage.c 11315 2012-08-05 18:13:38Z vruppert $ 





I will create a 'flat' hard disk image with 
cyl=121 
heads=16 
sectors per track=63 
total sectors=121968 
total size=59.55 megabytes 


Writing: 口 Done. 
I wrote 62447616 bytes to hd60M.img. 


he following line should appear in your bochsrc: 
ata0-master: type=disk, path="hd606M.img", mode=flat, cylinders=121, heads=16, spt=63 

















A 图 1-6 bximage 创建 虚拟 硬盘 


如 果 大 家 觉得 以 上 键入 命令 繁琐 ， 不 想 用 命令 行 的 话 ， 可 以 直接 键入 bin/bximage 
很 清楚 ， 很 容易 帮助 大 家 创建 硬盘 。 
硬盘 创建 好 了 ， 该 如 何 安装 到 虚拟 机 中 呢 ? 
看 图 1-6 下 面 的 白色 方 框 中 的 内 容 ，bochs 说 :“The following line should appear in your bochsrc: 下 面 的 内 
容 应 该 出 现在 你 的 配置 文件 中 ” 可 见 bochs 的 良 苦 用 心 ， 连 硬盘 的 配置 都 给 我 们 写 好 了 ， 我 们 要 做 的 就 是 
复制 这 些 到 我 们 的 bochsrc.disk 中 。 可 见 ， 在 bochs 中 有 哪些 硬件 ， 就 是 通过 配置 文件 来 反映 出 来 的 。 
不宜 迟 ， 赶 紧 更 新 bochsrc.disk， 找 到 第 33 行 注释 部 分 ， 将 内 容 添 加 到 35 行 ， 保 存 ， 如 图 1-7 所 示 。 
3 es ee ioaddr1-@x1f0, ioaddr2-@x3f0，irq=14 


35 ata0-master: type=disk, path="hd60M.img", mode=flat, cylinders=121, heads=16, spt=63 
36 
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车 ， 后 面 的 提示 
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4 图 1-7 在 bochs 配置 文件 中 增加 硬盘 


此 刻 的 我 已 经 迫不及待 地 想 看 看 bochs 现在 的 运行 情况 ， 不 过 如 果 每 次 启动 bochs 后 都 要 通过 Read 
options from 选项 读 取 配置 文件 ， 这 就 太 有 麻烦 了 ， 其 实 启动 bochs 的 时 候 ， 有 个 更 简便 的 方法 ， 我 们 用 -f 
来 指定 其 配置 文件 便 可 。 

bin/bochs -fbochsrc.disk 回 车 ， 观 察 效 果 ， 如 图 1-8 所 示 。 


USER Spy 


河中 





















































































































































Device: [BI0S ] 
Hessage: No bootable device, 
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3 : 2012-11-11 09:11:17 +0100 (So, 11. Nov 2012) $ 
apmbios pcibios pnpbios eltorito rombios32 


ter: Generic 1234 ATA-6 Hard-Disk ( 59 MButes) 
Press F12 for boot menu. 


Booting from Hard Disk... 
Boot failed: not a bootable disk 


"ATAL: No bootable device._ 














4 图 1-8 效果 区 
看 上 去 和 图 1-4 报错 一 样 ， 都 是 提示 没有 启动 盘 。 这 是 怎么 回 事 呢 ? 仔细 看 过 之 后 ， 发 现 这 里 的 报错 
和 图 1-4 还 是 有 些 不 同 的 ， 虽 然 结 果 是 一 样 的 错误 ， 但 原因 是 不 同 的 。 图 1-4 中 的 报错 原因 是 boot failed: 
could not read the boot disk， 这 是 无 法 读 取 局 动 盘 。 而 现在 这 里 的 报错 是 boot failed: not abootable disk， 这 
不 是 一 个 启动 盘 。 这 两 个 原因 明显 不 是 一 码 事 ， 就 像 某 件 衣服 穿着 不 合适 一 样 ， 原 因 是 一 个 人 是 太 胖 了 ， 
男 一 个 人 是 太 瘦 了 。 

不 要 灰心 ， 这 正 是 我 们 在 下 一 章 要 讲 的 内 容 ， 什 么 才 算 启动 盘 ， 真正 的 启动 盘 上 有 什么 。 本 章 到 此 结 
束 ， 下 章 我 们 再 见 。 
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第 2 章 编写 MBR 主 引 时 记录 ， 让 我 们 开始 掌权 


计算 机 的 启动 过 程 


不 知道 大 家 对 “ 载 入 内 存 ” 这 4 个 字 的 
序 要 载 入 内 存 。 第 二 ， 





先 回答 第 一 个 




















CPU 的 硬件 电路 被 设计 成 只 能 运行 处 于 内 存 中 的 程序 ， 这 是 硬件 基因 的 问题 ， 这 样 做 的 原因 ， 























什么 是 载 入 内 存 。 
















































































肯定 是 内 存 比较 快 ， 且 容量 大 。 
其 次 ， 操 作 系 统 可 以 存储 在 软盘 上 ， 也 可 以 存储 在 硬盘 上 ， 
但 由 于 各 个 硬件 特性 不 同 ， 操 作 系统 要 分 别 考虑 每 种 硬件 的 特性 才 和 
和 硬件 设计 都 省 事 了 ， 这 可 能 也 是 为 了 方式 的 统一 吧 ， 否 则 总 不 能 
付出 额外 努力 去 支持 。 当 然 ， 有 具体 原因 只 有 硬件 工程 师 才 知道 ，n 
马上 回答 第 二 个 。 
老 听 说 “程序 载 入 内 存 ”， 我 不 知道 有 多 少 同学 对 这 个 词 仅仅 是 感性 认识 。 
我 隐约 觉得 很 多 同学 都 会 将 “ 载 入 内 存 ” 和 “程序 执行 ” 画 等 号 。 所 谓 的 载 入 内 存 ， 大 松 j 





里 解 是 怎样 的 。 以 下 这 两 点 是 我 曾经 的 疑问 : 第 一 ， 为 什么 程 
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下 | 
























































Er 




















们 在 此 先 打住 ， 继 续 咱们 的 内 容 。 


























(1) 程序 被 加 载 器 〈 软 件 或 硬件 ) 加 载 到 内 存 某 个 区 域 。 
(2) CPU 的 cs: ip 寄存 器 被 指向 这 个 程序 的 起 始 地 址 。 
操作 系统 在 加 载 程序 时 ， 是 需要 某 个 加 载 器 来 将 用 户 程序 存储 到 内 存 中 的 。 其 实 “ 加 载 器 ”这 只 是 人 





















































为 起 的 名 字 ， 突 显 
的 东西 而 感到 上 其 惧 。 















































从 按 下 主机 上 的 power 键 后 ， 第 一 个 运行 的 软件 是 BIOS。 于 是 产生 了 三 个 问题 。 
(1) 它 是 由 谁 加载 的 。 
(2) 它 被 加 载 到 哪里 。 
(3) 它 的 cs: ip 是 谁 来 更 改 的 。 


软件 接力 第 一 棒 ，-Hek 


BIOS 全 称 叫 Base Input & Output System， 即 基本 输入 输出 系统 。 
人 们 给 任何 事物 起 名 字 ， 肯 定 都 不 是 乱 起 的 ， 必 然 是 根据 该 事物 的 特点 ， 通 过 总 结 ， 精 练 出 一 些 文字 
来 标识 此 事物 ， 这 个 便 是 对 一 般 事 物 取 名 的 方法 。 通 过 名 字 ， 就 能 够 反应 出 该 事物 的 特性 。 最 符合 特性 的 























名 字 就 是 昵称 和 外 号 了 ， 比 如 抽 油 机 是 用 来 开采 石油 的 一 种 机 器 ， 

































































以 大 家 给 其 起 了 更 形象 的 名 字 一 一 “人 克 头 机 ”。 








回 到 BIOS 上 ， 输 入 输出 我 理解 ， 命 名 中 加 上 系统 二 字 也 明 
不 知道 您 是 不 是 和 我 一 















































， 可 为 什么 还 要 用 “基本 ”来 修 包 

















样 喜 欢 咬文嚼字 ， 我 们 必须 得 把 它 搞 清楚 。 
2.2.1 实 模式 下 的 1MB 内 存 布 局 


先 来 点 背景 知识 ， 很 久 很 久 以 前 : 
Intel 8086 有 20 条 地 址 线 ， 故 其 可 以 访问 1MB 的 内 存 空间 ， 即 2 的 20 次 方 =1048576=1MB， 地 址 范 








先 








至 U 盘 ， 当 然 还 有 很 多 存储 介质 都 可 以 。 
了 。 所 以 ， 都 在 内 存 中 运行 程序 ， 操 作 系统 
上 现 茶 种 存储 介质 后 ， 操 作 系统 和 硬件 就 要 


上 分 两 部 分 。 





其 功能 ， 并 不 是 多 么 神秘 的 东西 ， 本 质 上 它 就 是 一 堆 函 数组 成 的 模块 ， 不 要 因为 未 知 





为 为 其 工作 时 ， 就 像 “ 矿 头 ”一 样 ， 所 





F 呢 ? 






































六 进 制 来 表示 ， 是 0x00000 到 0xFFFFF。 不 知道 硬件 工程 师 当 时 设计 的 初 袁 是 什 












































由 ， 这 1MB 的 内 存 空 间 被 分 成 多 个 部 分 。 



































， 总 之 人 家 有 
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为 了 让 大 家 先 有 个 印象 ， 免 得 太 抽 象 不 容易 理解 ， 先 把 实 模式 下 1MB 内 存 给 大 家 梳理 一 下 ， 很 辛苦 的 ， 各 
位 看 官 要 仔细 看 哈 ， 所 以 感 兴趣 或 有 强迫 症 的 同学 一 定 要 背 下 来 〈 玩 笑 )， 见 表 2-1。 
表 2-1 实 模式 下 的 内 存 布局 
起 始 结 束 大 小 用 途 
5 属于 码 ， 同 样 属 于 项 部 芝 字 节 。 只 是 为 

reero | FE | 168 强 册 其 入 地 二 间 站 出 来。 由 处 16 字 节 的 内 容 是 加 人 jmpDOO，e05b 
C8000 EFFFF 160KB 决 射 硬件 适配器 的 ROM 或 内 存 映射 式 IO 
C0000 C7FFF 32KB 显示 适配器 BIOS 
B8000 BFFFF 32KB 于 文本 模式 显示 适配器 
B0000 B7FFF 32KB ~ 黑白 显示 适配器 
A0000 AFFFF 64KB 于 彩色 显示 适配器 
9FC00 9FFFF 1KB EBDA (Extended BIOS Data Area) 扩展 BIOS 数据 区 
7E00 9FBFF 622080B 约 608KB J 用 区 域 
7C00 7DFF 512B MBR 被 BIOS 加 载 到 此 处 ， 共 512 字 节 
500 7BFF 30464B 约 30KB 可 用 区 域 
400 4FF 256B BIOS Data Area (BIOS 数据 区 ) 
000 3FF 1KB Interrupt Vector Table 〈 中 断 向 量 表 ) 

先 从 低地 址 看 ， 地 址 0 一 0x9FFFF 处 是 DRAM (Dynamic Random Access Memory)， 即 动态 随机 访问 


内 存 ， 我 们 所 装 的 物 到 
动态 指 此 种 存储 介质 由 
单条 内 存 ] 


组 成 的 ， 


你 相 
INN 








够 拼凑 


HH 4GB 的 内 存 容量 ， 




















明显 的 ， 














很 快 ， 所 以 漏电 了 就 





























于 本 身 
岗 在 都 到 

















电气 元 从 


的 性 质 ， 需 要 定 





4GB， 内 存 条 
不 包括 相关 电路 元 件 ， 也 得 是 4GBx8 个 电容 了 。 如 此 小 的 


i 要 及 时 于 去 ， 这 样 数据 才 不 至 于 丢失 。 这 个 补充 


内 存 就 是 DRAM， 如 DDR、DDR2 等 。 又 要 开始 咬文嚼字 了 ， 动 态 是 什么 














划 田 ? 


EN 全 














严 电 补 充 上 














为 刷新 。 








的 体积 




















楚 ， 








导 














基地 刷新 。 内 存 中 的 每 一 位 都 是 由 电容 和 晶体 管 来 
小 您 也 清 














p 么 小 的 面积 得 集成 多 少 电 容 才能 


已 合 ， 其 缺点 也 是 



























































其 实 不 仅 是 电容 需要 刷新 , 就 连 








有 信号 也 是 一 样 的, 不 知道 您 注意 了 没有 , 我 

















也 是 需要 在 每 
减 就 特别 严重 ， 只 好 通过 这 种 “ 扩 
搞定 的 词 是 BIOS 中 的 “基本 ” 所 以 

见 表 2-1， 内 存 地 址 0 一 0x9FFFEF 的 空间 范围 
上 的 内 存 条 。 有 没有 人 开始 小 声 咬 吐 了 : 为 什么 
DRAM 吗 ? 难道 我 的 内 存 条 不 是 全 部 














三» 
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将 看 。 
是 640KB， 这 片 地 址 对 
是 对 应 到 了 DRAM, x 


是 啊 是 啊 之 外 ， 还 是 很 欣慰 的 ， 终 于 有 人 和 我 之 前 想 的 一 样 了 。 


一 会 再 解释 


存 是 RO 














的 、 保 记 


就 可 以 通过 “int : 
入 输出 , 但 由 于 就 64KB 大 小 的 空间 
毕竟 是 在 实 模式 之 下 ， 对 硬件 支持 人 
行 的 那些 硬 伯 


这 个 ， 和 否则 

































































E 计 算 机 能 运 

















供 了 一 些 初 始 化 的 功能 调用 ，BIOS 直接 调 














断 号 ”来 实现 相关 的 硬件 调用 














， 不 可 能 





们 离 “ 基 本 ” 越 来 越 远 了 。 表 2-1， 看 顶部 上 
面 存 的 就 是 BIOS 的 代码 。BIOS 的 主要 工作 是 检测 、 初 始 化 硬件 ， 怎 么 初始 化 的 ? 硬件 自己 提 
F 伟 大 的 事情 ， 建 立 了 中 断 向 量 表 ， 这 样 
能 就 是 对 硬 


就 好 了 。BIOS 还 做 了 一 从 
， 当 然 BIOS 建立 的 这 些 功 





所 有 硬件 
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F 富 也 











F 的 基本 IO 操 





湛 
合 ， 
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让 





F 的 IO 操作 实现 得 面 
精彩 的 世界 是 在 i 











现在 开始 解释 另 一 个 问题 ， 在 CPU 眼 里 ， 为 什么 我 们 插 在 主板 
地 址 总 线 宽度 决定 了 可 以 访问 的 内 存 空间 大 小 ， 如 16 位 机 的 地 址 总 线 为 20 位 ， 其 地 址 范围 是 1MB， 











局 一 定 长 度 距离 时 接 个 中 继 放 大 器 ， 这 个 就 是 来 放大 电信 和 号 的 ， 
的 方式 来 保持 稳定 了 。 终 于 
们 还 得 





巴 动 态 这 一 i 











的 过 程 就 称 
门 平时 使 用 的 网 线 ， 
为 物理 链 路 一 长 ， 信 号 衰 
搞定 了 ， 不 过 我 们 最 终 要 
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应 到 了 DRAM， 也 就 是 插 在 主板 
































E 道 不 是 直接 访问 到 我 的 物理 


内 存 























的 内 存 ? 还 可 以 访问 到 别处 吗 ? 如 果 您 有 这 样 的 疑问 ， 我 除 ] 
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可 从 











的 0xF0000~OxFFFFF， 这 64KB 的 内 























牛 的 IO 操作 ， 也 就 是 输 

















砷 入 保 所 











面 俱 到 ,而 且 也 没 必要 实现 那么 多 ， 
模式 以 后 才 开始 ， 所 以 挑 一 些 重 要 























i 行 了 。 这 就 是 BIOS 称 为 基本 输入 输出 系统 的 原因 。 




















上 的 物理 























内 存 不 是 它 眼 里 “全 部 的 内 存 ”。 
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32 位 地 址 总 线 宽度 是 32 位 ， 其 地 址 范围 是 4GB。 但 以 上 的 地 址 范围 是 指 地 址 总 线 可 以 触及 到 的 边界 ， 是 
指 计算 机 在 寻 址 上 可 以 到 达 的 疆域 。 可 是 人 家 并 没有 说 要 寻 哪 里 ,就 拿 16 位 机 来 说 ， 并 没有 说 这 1MB 的 
寻 址 范围 必须 得 是 物理 内 存 ( 内 存 条 )， 难 道人 家 20 位 的 地 址 总 线 就 认得 这 一 亩 三 分 地 ? 完全 不 是 。 










































































归根 结 底 的 所 






































因 是 这 样 的 : 在 计算 机 中 , 并 不 是 只 有 咀 们 插 在 主板 上 的 内 存 条 需要 通过 地 址 总 线 访问 ， 
是 需要 通过 地 址 总 线 来 访问 的 ,这 类 设备 还 很 多 呢 。 若 把 全 部 的 地 址 总 线 都 指向 物理 内 












































还 有 一 些 外 设 同村 
























































存 ,， 那 其 他 设备 该 如 何 访问 呢 ? 由 于 这 个 原因 ， 只 好 在 地 址 总 线 上 提前 预 留 出 来 一 些 地 址 空间 给 这 些 外 设 
用 ,这 片 连续 的 地 址 给 显存 ， 这 片 连续 的 地 址 给 硬盘 控制 器 等 。 留 够 了 以 后 ， 地 址 总 线 上 其 余 的 可 用 地 址 
再 指向 DRAM， 也 就 是 指 揪 在 主板 上 的 内 存 条 、 我 们 眼中 的 物理 内 存 。 示 意 如 图 2-1 所 示 。 






















































































根据 所 提交 的 
地 址 所 在 范围 ， 
将 地 址 映射 到 
不 同 的 存储 设备 










到 2-1 地 址 映射 





Pp 




















物理 内 存 多 大 都 没 用 ， 主 要 是 看 地 线 总 线 的 宽度 。 还 要 看 地 址 总 线 的 设计 ， 是 不 是 全 部 用 于 访问 


‘HH 





DRAM。 所 以 说 ， 
般 是 32 位 ， 上 面 






































地 址 总 线 是 决定 我 们 访问 哪里 、 访 问 什 么 ， 以 及 访问 范围 的 关键 。 我 们 平时 用 的 机 器 一 
的 内 存 条 并 不 是 全 部 都 用 到 了 ， 按 理 说 内 存 条 大 小 超过 4GB 就 没 意 义 了 ， 超 过 了 地 址 总 




































































线 的 势力 就 是 浪费 。 不 过 通过 前 面 的 介绍 ， 即 使 内 存 条 大 小 没有 超过 地 址 总 线 的 范围 ， 也 不 会 全 都 能 被 访 
问 到 ， 毕 竞 要 预 留 一 些 地 址 用 来 访问 其 他 外 设 ,， 所 以 最 终 还 得 看 地 址 总 线 把 地 址 指向 哪 块 内 存 了 。 这 就 是 






























































安装 了 4GB 内 存 
总 之 ， 表 示 























， 电 脑 中 只 显示 3.8GB 左右 的 原因 。 
岂 址 的 那 串 数字 是 地 址 总 线 的 输入 ， 相 当 于 其 参数 ， 和 内 存 条 没关系 。CPU 能 够 访问 一 


























个 地 址 , 这 是 地 址 总 线 给 做 的 映射 , 相当 于 给 该 地 址 分 配 了 一 个 存储 单元 , 而 该 存储 单元 要 么 落 在 某 个 rom 
中 ， 要 么 落 到 了 某 个 外 设 的 内 存 中 ， 要 么 落 到 了 物理 内 存 条 上 。 可 以 想像 成 ，CPU 给 地 址 总 线 提交 一 个 
数字 ， 在 地 址 总 线 看 来 ， 这 串 数 字 就 是 地 址 。 地 址 分 配 电路 根据 此 地 址 的 范围 ， 决 定 在 哪个 存储 介质 中 分 





































































































配 一 个 存储 单元 ， 


























妆 闻 地 溃 











最 后 将 此 地 址 与 此 存储 单元 对 应 起 来 。 当 然 事 实 上 未 必 是 这 样 ， 我 刚才 说 了 ， 可 以 想像 














成 这 样 。 我 们 学 习 新 的 知识 ， 很 多 时 候 都 是 建立 在 原 有 的 知识 上 ， 用 原 有 的 知识 帮助 学 习 新 的 知识 ， 就 像 
一 次 听 说 电动 车 的 时 候 , 我 们 潜意识 里 是 用 车 和 蔓 电 池 的 概念 在 联想 电动 车 的 形象 。 如 果 要 学 的 是 一 种 
新 的 知识 ， 并 且 无 从 用 旧 的 知识 来 辅助 学 习 时 ， 试 图 靠 想像 力 是 非常 有 效 的 。 对 于 知识 的 掌握 ， 这 并 没 
什么 标准 ， 每 个 人 对 知识 的 理解 都 是 不 同 的 ， 即 使 两 个 人 都 考 了 满分 ， 其 思考 过 程 也 是 不 同 的 。 所 以 ， 
于 一 个 新 知识 的 掌握 ， 本 质 上 是 给 了 一 个 能 够 说 服 自己 的 理由 ， 能 够 自圆其说 ， 这 就 够 了 。 


















































































































































2.2.2 ”BIOS 是 如 何 苏醒 的 





直 睡 在 某 个 地 方 ， 直 到 被 唤醒 …… 





BIOS 其 实 
































前 面 热 火 朝 天 地 说 了 BIOS 的 功能 和 内 存 布局 ， 似 乎 还 没 说 到 正题 上 ，BIOS 是 如 何 启 动 的 呢 ? 因 为 
BIOS 是 计算 机 上 第 一 个 运行 的 软件 ， 所 以 它 不 可 能 自己 加 载 自己 ， 由 此 可 以 知道 ， 它 是 由 硬件 加 载 的 。 




















有 后 ， 里 面 的 数 扩 
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那 这 个 硬件 是 谁 呢 
大 家 知道 ， 只 读 存 储 器 中 的 内 容 是 不 可 的 除 的 ， 也 就 是 它 不 像 动态 随机 访问 存储 器 DRAM 那样 ， 掉 
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其 实 前 面 已 经 提 到 过 了 ， 相 当 于 是 只 读 存 储 器 ROM， 因 为 它 一 直 就 睡 在 那里 不 动 。 












































就 会 丢失 。 这 种 存储 介质 是 用 来 存储 一 成 不 变 的 数据 的 ， 当 数据 写 进 去 后 ， 便 与 日 月 同 








辉 ， 庭 前 坐 看 花 开 花 落 ， 不 朽 于 天 地 万 物 之 间 ， 哈 哈 ， 有 点 夸张 了 。 


BIOS 代码 所 做 的 工作 也 是 一 成 不 变 的 ， 而 且 在 正常 情况 下 ， 其 本 身 是 不 需要 
板 坏 了 要 刷 BIOS 的 情况 属于 例外 。 于 是 BIOS 顺理成章 地 便 被 写 进 此 ROM。ROM 也 是 块 内 存 ， 内 存 就 需要 
被 访问 。 此 ROM 被 映射 在 低 端 1MB 内 存 的 顶部 , 即 地 址 0xF0000~0OxFEFFEFF 处 ， 
































































































































部 分 。 只 要 访问 此 处 的 地 址 便 是 访问 了 BIOS， 这 个 映射 是 由 硬件 完成 的 。 


BIOS 本 身 是 个 程序 ， 程 序 要 执行 ， 就 要 有 个 入 口 地 址 才 行 ， 
最 重要 的 一 点 来 了 ， 知 道 了 BIOS 在 哪里 后 ，CPU 如 何 去 执 行 
成 0xFFFF0 的 。 








医改 的 ， 





平时 听 说 的 那些 主 



























































此 入 
它 ， 即 CPU : 


























如 果 大 家 不 了 解 内 存 的 分 段 访 问 机 制 ， 可 以 参考 第 0 章 ， 里 本 
正事 ，CPU 访问 内 存 是 用 段 地 址 + 偏 移 地 址 来 实现 的 ， 由 于 在 实 模式 之 下 ， 段 
偏 移 地 址 相 加 ， 求 出 的 和 便 是 物理 地 址 ，CPU 便 拿 此 地 址 直接 用 了 。 这 个 “ 段 基 址 : 
组 合 是 0xffff: 0 吗 ? 或 者 是 0xF000: 0xFFF0? 或 者 是 更 奇 划一 点 的 组 合 : 0xFEEE: 0x1110? 或 者 您 想 出 
的 组 合 比 我 的 还 奇 范 ,好 啦 , 不 折磨 大 家 了 , 还 是 说 正事 要 紧 。 既然 作为 第 一 个 运行 的 程序 都 没 开始 执行 ， 
软件 搞定 这 件 事 了 ， 还 是 得 靠 硬 件 支 持 才 行 。 
在 开机 的 一 瞬间 ， 也 就 是 接 电 的 一 瞬间 ，CPU 的 cs: ip 寄存 器 被 强制 
F 实 模式 , 再 重复 一 遍 加 深 印象 ,在 实 模式 下 的 段 基 址 要 乘 以 




































































































































































然 就 没 办 法 















































开机 的 时 候 处 了 




























































































可 以 参考 表 2-1 顶部 的 BIOS 


地 址 便 是 0xFFFF0。 
的 cs: ip 值 是 如 何 组 合 


解 CPU 为 什么 分 段 方式 内 存 。 说 
地 址 需要 乘 以 16 后 才能 与 















































段 内 偏 移 地 址 ”的 























初始 化 为 0xF000: 0xFFF0。 
16, 也 就 是 左 移 4 位 ,于 是 0xF000: 

















于 












































0xFFF0 的 等 效 地 址 将 是 0xXFFFF0。 上 面 说 过 了 ， 此 地 址 便 是 BIOS 的 入 口 地 址 。 

当 我 给 出 这 个 地 址 后 ， 不 知道 大 家 意识 到 什么 没有 。 了 BIOS 是 在 实 模式 下 运行 的 ， 而 实 模式 只 能 访问 
1MB 空间 〈20 位 地 址 线 ，2 的 20 次 方 是 1IMB )。 而 地 址 0xFFFF0 距 1MB 只 有 16 个 字 节 了 ( 见 表 2-1 除 
标题 外 的 第 一 行 )， 这 么 小 的 空间 够 干吗 ? BIOS 又 要 检测 硬件 ， 做 各 种 初始 化 工作 ， 还 要 建立 中 断 向 量 
表 ……16 字 节 的 机 器 指令 肯定 于 不 了 这 么 多 事 。 也 许 有 的 同学 会 问 ， 超 过 寄存 器 宽度 会 怎么 样 呢 ? 比如 
0xFFFF0+16， 这 样 就 溢出 了 ， 由 于 实 模 式 下 的 寄存 器 宽度 是 16 位 ，0xFFFF0+16 已 经 超过 了 其 最 大 值 





























0xFFFFF。 溢 出 的 部 分 就 会 回 卷 到 0， 又 会 重新 开始 ， 即 0xFFFF0+16 等 于 0，0xFFFF0+17 等 于 1。 








既然 此 处 只 有 16 字 节 的 空 
指令 才能 解释 得 通 了 。 好 ， 既 然 心里 有 了 推断 ， 那 咱们 就 来 证 明 这 个 推断 正确 
图 2-2 是 我 在 bochs 中 抓 的 图 ， 下 面 给 大 家 分 析 一 下 这 图 中 的 信息 都 代表 




















bootable disk， 而 我 们 还 没有 MBR， 还 没有 写 主 引导 记录 。 先 不 管 这 张 医 













































































PLease choose one: [6] 


00000000000i[ ] installing x module as the Bochs GUI 


00000000000i[ UE 1 
[3,4. 0 


[09x0000fffffff0] |f000: fffO| (unk. ctxt)1 jmp far f000:e05b 
ip 下 执行 的 指令 
<bochs:1> sreg 物理 地 址 0xfe05b 


es:0x0000，dh=0x600009300，dL=09x09000ffTff， 


Data Segment ，base=0x00000000，Limit=9x9000ffff， 
5s:0xf000| dh=Qxff0093ff, dl=0x0Q000ffff, valid=7 
Data segment, base=Qxffff0000, limit=OQx0O000ffff, 


ss:0x0000, dh=0x00009309, dl=0x90000ffff, valid=7 


Data segment, base=Qx00000000, limit=0x0000ffff, 


ds:Qx0000, dh=0x00009300, dl=0x0000ffff, valid=7 


Data segment，base=0x00000000，Limit=0x0000ffff， 


fs:Qx0000, dh=0Qx00009300, dl=0Qx0000ffff, valid=7 


Data segment，base=0x000000600，Limit=0x0000ffff， 


9gs:0x0000，dh=0x00009300，dL=9x0000ffff，VvaLid=7 


Data segment，base=0x000000006，Limit=0x0000ffff， 


Ldtr:9x9000，dh=0x000082006，dL=0x0000ffff，vaLid=1 
tr:0x9000，dh=0x90008b6909，dL=0x0000ffff，vaLid=1 
gdtr:base=Qx00000000, limit=Qxffff 
idtr:base=Qx00000000, limit=Qxffff 

















A 图 2-2 ”bochs 开机 界 因 






































首先 得 承认 ， 这 张 图 有 点 超前 了 ， 这 是 在 有 了 MBR 后 才能 抓 到 世 


























与 否 。 














什么 。 


令 是 jmp 0xf000: Oxe05b 





F 间 了 ， 这 只 能 说 明 BIOS 真正 的 代码 不 在 这 ， 那 此 处 的 代码 只 能 是 个 跳 转 


Read/Write，Accessed 


Read/Write， 


Read/Write， 


Read/Write, 


Read/Write, 


Read/Write, 


芯 
汪 
2 











Accessed 


Accessed 


Accessed 


Accessed 


Accessed 






































会 提示 boot failed: not a 
朱 ， 反正 大 家 立即 就 


























能 够 在 自己 的 虚拟 机 里 看 到 这 张 图 了 。 大 家 先 注意 框框 中 的 内 容 。 





ip 的 那个 框 ，cs 寄存 器 




















= 
人 A、 中 


























， 取 上 


左边 第 1 个 标 有 cs: 


























的 值 是 0xf000，ip 寄存 器 的 值 是 0xfff0， 也 就 是 段 基 址 0xf000， 段 内 偏 移 地 址 0xfff0， 
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这 个 组 合 出 来 的 地 址 便 是 0xffff0， 这 是 处 理 器 下 一 条 待 执 行 指令 的 地 址 。 这 与 上 面 所 说 的 BIOS 入 
为 cs 和 ip 寄存 器 中 存储 的 是 下 一 条 要 执行 的 
执行 BIOS， 这 是 机 器 
一 刻 ， 何 况 我 们 让 这 一 刻 停 了 下 来 ， 成 为 永 

按理 说 ， 既 然 让 CPU 去 执行 0xFFFF0 处 的 内 容 〈 目 前 还 不 知道 
令 才 行 ， 否 则 这 地 址 处 的 内 容 若是 数 


合 的 。 男 外 ， 医 






























































刚 开机 的 那 一 刻 。 这 

















百 


地 址 是 吻 
间 令 ， 目 前 还 没有 执行 ， 也 就 是 说 ， 当 前 还 没有 
刻 还 是 值得 庆祝 的 ， 因 为 即使 是 计算 机 行业 的 同学 都 很 少 看 到 这 









































链 成 大 错 。 现 在 





们 又 有 了 新 的 推断 ， 物 理 # 














继续 看 第 二 个 框框 ， 里 面 有 条 指令 jmp far f000: e05b， 这 是 条 跳 转 指令 ， 也 就 是 证 明了 在 内 存 物 理 


地 址 0xFFFF0 处 的 b CPU 的 执行 流 是 跳 到 哪里 了 呢 ? 段 基 


址 0xf000 左 移 4 














是 吻合 的 ， JE 





傅 。 








第 三 个 框框 cs: f000， 


bh 二 OxFFFF0 处 

















内 容 是 一 条 跳 转 指令 ， 我 们 的 判断 是 了 
+0xe05Sb， 即 跳 向 了 0xfe05b 处 ， 这 是 BIOS 代码 真正 开始 的 地 方 。 





























其 意义 是 cs 寄存 器 的 值 是 f000， 与 我 们 刚刚 所 说 的 加 





E 确 的 。 和 于 


























是 指令 ， 还 是 数据 )， 此 内 容 应 该 是 指 
局 ， 而 不 是 指令 ，CPU 硬是 把 它 当成 指令 来 译 码 的 话 ， 一 定 会 弄巧成拙 
应 该 是 指令 ， 继 续 探索 。 












































和 时 强制 将 cs 置 为 f000 














接 下 来 BIOS 便 马 不 停 蹄 地 检测 内 存 、 显 卡 等 外 设 信息 ， 当 检测 通过 ， 并 初始 化 好 硬件 后 ， 开 始 在 内 
存 中 0x000 一 0x3FF 处 建立 数据 结构 ， 中 断 


好 了 ， 终 于 到 了 接力 的 时 刻 ， 这 是 这 场 接 力 赛 的 第 一 棒 ， 它 将 交 给 谁 呢 ? 虽 们 下 回 再 


























向 量 表 IVT 并 填写 中 断 例 程 。 








2.2.3 为 什么 是 0x7c00 


计算 机 执行 到 这 份 
中 不 免 一 丝 忧伤 ， 甚 至 有 些许 挽留 它 的 想法 。 可 是 ， 这 就 是 它 的 命 ， 它 9 














生 中 已 经 为 后 人 创造 了 足够 的 精彩 。 何 况 ， 在 下 一 次 必 
好 了 ， 让 伤感 停止 ， 让 梦想 
先 说 重点 ，BIOS 最 后 一 


上 ，BIOS 也 即将 完成 自 











己 的 历史 使 命 了 ， 完 成 之 后 ， 它 又 将 旧 
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有 人 条。 





在 此 插 ] 








对 一 段 小 告示 : 






































无 论 是 机 器 眼 里 和 程序 员 眼 里 ， 


4 “相对” 



























































0 
党 。 





< 

















去 。 想 到 这 里 ， 心 





来 被 设计 成 这 样 ， 在 它 短 暂 的 一 





F 机 时 ，BIOS 还 会 重复 这 段 轮 


项 工作 校 验 启 动 盘 中 位 于 0 盘 0 道 1 扇 区 的 内 容 。 





站- 个 
[a 





F 没 有 消失 。 


名， 





















































操作 数 都 是 





] 偏 移 量 表示 的 。0 盘 0 道 1 





2 

















头 Header 局 
两 个 盘面 
指 的 是 所 有 盘面 
之 后 




















三 | 
全 
ls} 
A 














的 , 一 个 盘 


Ee 


个 立体 的 








又 本 质 上 就 相 















































盘 记 区 的 表示 法 有 两 种 ， 我 们 描述 0 盘 0 道 1 局 区 | 




















的 便 是 


















































看 上 对 应 一 个 磁头 , 所 以 















































百 
贝 





道 是 





的 ,确切 地 说 是 





吾 
风 














重点 来 了 , 在 CH 








S 方式 中 局 区 的 乡 









































区 乡 





到 























以 0 盘 0 道 1 扇 
家 号 是 从 0 开始 的 。 关 于 








区 其 实 就 相当 了 
























































区 末 





| 











行 的 程序 (在 此 
后 


























环 ， 这 些 被 划分 出 来 的 小 
号 是 从 1 开始 的 , 不 是 0, 不 是 0， 原 谅 我 说 了 两 次 ， 
0 盘 0 道 0 扇 区 ， 它 就 是 磁盘 上 最 开始 的 那个 扇 区 。 而 LBA 方式 中 ， 
章节 专门 来 讲 ， 这 里 我 车 没 表达 
区 就 行 了 。 
尾 的 两 个 字 节 分 别 是 魔 数 0x55 和 0xaa，BIOS 便 认 为 此 扇 区 中 确 


硬盘 的 知识 我 会 在 以 后 
急 ， 只 要 知道 MBR 所 在 的 位 置 是 磁盘 上 最 开始 的 那个 扇 




















磁头 Header 来 表示 盘面 “0 道 ” 是 指 0 柱 面 





在 计算 机 中 是 习惯 以 0 作为 起 始 索引 的 ， 因 为 人 们 已 经 习惯 了 偏 移 量 的 概念 ， 
的 概念 ， 即 偏 移 量 来 表示 位 置 显得 很 直观 ， 所 以 很 多 指令 中 的 
当 于 0 盘 0 道 0 扇 区 。 为 什么 称 为 1 呢 ， 
的 一 种 :CHS 方法 ， 即 柱 
区 Sector〔 男 外 一 种 是 LBA 方式 ， 暂 不 关心 ),，“0 盘 ” 说 的 是 0 磁头 ， 














因为 硬 
面 Cylinder 磁 





























因为 一 张 盘 是 有 上 下 
, 柱 面 Cylinder 


























将 磁道 等 距 划分 成 一 段 段 的 小 

















区 间 便 是 扇 


号 相同 的 磁道 的 集合 ， 形 象 一 点 描述 就 是 把 很 多 环 登 摆 在 一 起 的 样子 ,组 合 在 一 起 
管状 。“1 扇 区 ” 才 是 我 们 要 解释 的 部 分 ， 





]， 由 于 磁 

















， 所 以 称 为 
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区 。 好 了 ,， 背 


区 间 
景 交 待 完 了 》 
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民 古 用 

















心 你 懂 的 » 














楚 ， 大 家 先 不 要 着 









































实 存在 可 执 




















E 剧 透 一 下 ， 此 程序 便 是 久 闻 大 名 的 主 引 导 记 录 MBR)， 便 加 载 到 物理 地 址 0x7c00， 随 








kt 转 到 此 地 址 ， 继 续 执行 。 




















如 果 此 扇 





这 里 有 个 小 细 ? 
用 法 ， 段 寄存 器 cs 会 被 















































译 呢 。 











不 过 ， 这 就 又 抛 出 两 个 问题 。 
(1) 为 什么 是 0 盘 0 道 1 扇 区 的 内 容 ? 
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> 前 的 0xf000 变 成 了 0。 





























有 








方 ，BIOS 跳 转 到 0x7c00 是 用 jmp 0: 0x7c00 实现 的 ， 这 是 jmp 指令 的 直接 绝对 远 转 移 
等 换 ， 这 里 的 段 基 址 是 0， 即 cs 
区 的 最 后 2 个 不 是 0x55 和 0xaa， 即 使 里 本 
许 还 认为 此 扇 区 是 没 格 





可 执行 代码 也 无 济 于 事 了 ，BIOS 不 认 ， 它 也 


(2) 为 什么 是 物理 地 址 0x7c00， 而 不 是 个 好 记 或 好 看 的 其 他 地 址 ? 

先 回 答 第 1 个 , 我 想 这 个 问题 不 用 官方 解释 了 , 因为 官方 确实 没什么 好 说 的 , 不 过 他 们 出 于 尊重 客户 ， 
还 是 会 像 我 一 样 说 出 类 似 下 面 的 话 。 

我 就 个 人 观点 给 大 家 一 个 理由 ， 未 经 核实 ， 仪 是 自己 一 面 之 词 ， 请 大 家 提高 敖 惕 ， 小 心 谨慎 ^ 一 人 ^。 
在 计算 机 中 处 处 充满 了 协议 、 约定， 所以, 将 0 租 0 道 1 扇 区 作为 mbr 的 栖身 之 地 ,我 完全 可 以 理解 
为 规定 。 我 们 反 证 一 下 ， 如 果 不 存在 这 个 “规定 ” 会 发 生 什么 。 当 然 ， 此 扇 区 最 初 是 给 BIOS 使 用 的 ， 
咱们 设想 一 下 BIOS 的 工作 将 变 成 怎样 。 

主 引 导 记 mbr 是 段 程序 ， 无 论 位 于 软盘 、 硬 盘 或 者 其 他 介质 ， 总 该 有 个 地 方 保存 它 。Ok， 现 在 不 告 
诉 BIOS 它 存储 在 哪个 位 置 了 。BIOS 只 好 将 所 有 检测 到 的 存储 设备 上 的 每 一 个 存储 单位 都 翻 一 遍 ， 挨 个 
对 比 ， 如 果 发 现 该 存储 单位 最 后 的 两 个 字 节 是 0x55 和 0xaa， 就 认为 它 是 mbr。 这 就 好 比 查 字典 一 样 ， 不 
用 偏旁 部 首 和 拼音 检索 的 方法 ， 只 能 一 页 一 页 翻 了 。 

几经 花 开花 落 ， 找 到 mbr 的 那 一 刻 ，BIOS 满 脸 疲惫 地 说 :“ 你 是 我 找 了 好 久 好 久 的 那个 人 ” mbr 抬 
起 经 不 起 岁月 等 待 的 脸 :“ 难 得 你 还 认得 我 ， 我 等 你 等 到 花 儿 都 谢 了 ”。 其 实 BIOS 的 心声 是 :“ 看 我 手 忙 
脚 乱 的 样子 ， 你 们 这 是 要 闸 哪样 啊 。 就 那么 512 字 节 的 内 容 ， 害 我 找 遍 全 世界 ， 我 们 是 在 跑 接 力 赛 啊 ， 下 
一 棒 的 选手 我 都 不 知道 在 哪里 …… 以 后 让 它 站 在 固定 的 位 置 等 我 !” 

由 于 0 盘 0 道 1 扇 区 是 磁盘 的 第 一 个 扇 区 ，mbr 选择 了 离 BIOS 最 近 的 位 置 站 好 了 ， 从 此 以 后 再 也 不 
担心 被 BIOS 器 了 。 

计算 机 中 处 处 有 固定 写 死 的 东西 , 还 
个 魔 数 0x7c00 登场 。 

至 于 0x7c00， 很 久之 前 ， 比 我 好 奇 心 大 的 人 查 遍 了 Intel 开发 手册 都 没 找到 相关 的 说 明 。 要 想 知道 事 
情 的 来 龙 去 脉 ， 还 是 要 从 个 人 计算 机 的 初始 说 起 ， 同 样 是 很 久 很 久 以 前 …… 

1981 年 8 月 , IBM 公司 生产 了 世界 上 第 一 台 个 人 计算 机 PC 5150, 所 以 它 就 是 现代 x86 个 人 计算 机 兼 
容 机 的 祖先 。 说 到 有 关 历 史 的 东西 ， 不 给 来 点 真相 就 感觉 气 
场 不 足 ， 图 2-3 所 示 便 是 IBM PC 5150， 有 没有 感受 到 计算 
机 文化 底蕴 呢 ? 

既然 Intel 开发 手册 中 没有 相关 说 明 , 那 咱 们 就 朝 其 他 方 
向 找 答 案 ， 换 名 话说， 既然 不 是 CPU 的 硬性 规定 ， 那 很 可 ii 一 一 
























































































































































































































































































































































] 举 个 例子 吗 ? 不 用 了 吧 ? 因为 任何 一 个 魔 数 都 是 啊 , 有 请 下 一 














As 



























































































































能 就 是 代码 中 写 死 的 。 为 了 搞 清 楚 0x7c00 是 哪里 来 的 ， 咱 a 

们 先 探 索 下 “IBM PC 5150” 的 BIOS 的 秘密 。 请 先 深 深 呼 es- RN 区 
豚 一 大 口气 , “0x7C00” 最 早出 现在 IBM 公司 出 产 的 个 电 ”< 旗 
脑 PC5150 的 ROM BIOS 的 INT19H 中 断 处 理 程序 中 , 说 了 < 


这 么 多 定语 ， 感 觉 气 都 器 不 上 来 了 。 

通电 开机 之 后 ，BIOS 处 理 程序 开始 自 检 ， 随 后 ， 调 用 
BIOS 中 断 0xl9h， 即 call int 19h。 在 此 中 断 处 理 函 数 中 ，BIOS 要 检测 这 台 计 算 机 有 多 少 硬盘 或 软盘 ， 如 
果 检 测 到 了 任何 可 用 的 磁盘 ，BIOS 就 把 它 的 第 一 个 扇 区 加 载 到 0x7c00。 

现在 应 该 搞 清楚 了 为 什么 在 x86 手册 里 找 不 到 它 的 说 明了 ， 它 是 属于 BIOS 中 的 规范 。 似 乎 这 下 好 办 
了 ， 既 然 是 BIOS 中 的 规范 ， 那 肯定 是 IBM PC 5150 BIOS 开发 团队 规定 的 这 个 数 。 

个 人 计算 机 肯定 要 运行 操作 系统 ， 在 这 台 计 算 机 上 ， 运 行 的 操作 系统 是 DOS 1.0， 不 清楚 此 系统 要 求 
的 最 小 内 存 是 16KB, 还 是 32KB, 反正 PC 5150 BIOS 研发 工程 师 就 假定 其 是 32KB 的 , 所 以 此 版 本 BIOS 
是 按 最 小 内 存 32KB 研发 的 。 

MBR 不 是 随便 放 在 哪里 都 行 的 ， 首 先 不 能 覆盖 已 有 的 数据 ， 其 次 ， 不 能 过 早 地 被 其 他 数据 覆盖 。 不 
履 盖 已 有 数据 ， 这 个 好 理解 。 说 一 下 后 面 这 个 “其 次 ”。 通常 ，MBR 的 任务 是 加 载 某 个 程序 (这 个 程序 一 
般 是 内 核 加 载 器 ， 很 少 有 直接 加 载 内 核 的 ) 到 指定 位 置 ， 并 将 控制 权 交 给 它 。 所 谓 的 交 控 制 权 就 是 jmp 过 
去 而 已 。 之 后 MBR 就 没 用 了 ， 被 覆盖 也 没关系 。 我 说 的 过 早 被 覆盖 ， 是 指 不 能 让 mbr 破坏 自己 ， 比 如 被 加 
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4 图 2-3 |BM PC 5150 
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载 的 程序 ， 如 内 核 加 载 器 ， 其 放置 的 内 存 位 置 若是 MBR 自己 所 在 的 范围 ， 这 不 就 是 破坏 自己 了 吗 ， 这 就 是 
我 所 说 的 “过 早 ” 了 ， 怎 么 也 得 等 MBR 执行 完 才 行 。 











8086CPU 
按 DOS 1 
































重 现 一 下 当时 的 内 存 使 用 情况 。 









































要 求 物 理 地 址 0x0~~0x3FF 存放 中 断 向 量 表 ， 所 以 此 处 不 能 动 了 ， 再 选 新 的 地 方 看 看 。 

















.0 要 求 的 最 小 内 存 32KB 来 说 ，MBR 








希望 给 人 家 尽 可 能 多 的 预 留 空间 ， 这 样 也 是 保全 自己 




















的 作法 ， 免 得 过 早 被 覆盖 。 所 以 MBR 只 能 放 在 32KB 的 末尾 。 





MBR 本 身 也 是 程序 ， 是 程序 就 要 用 到 栈 ， 栈 也 是 在 内 存 中 的 ，MBR 虽然 本 身 只 有 512 字 节 ， 但 还 要 为 其 






































所 用 的 栈 分 配点 空间 ， 所 以 其 实际 所 用 的 内 存 空 间 要 大 于 512 字 节 ， 估 计 1KB 内 存 够 用 了 。 























结合 以 上 三 点 ,选择 32KB 中 的 最 后 1KB 最 为 合适 , 那 此 地 址 是 多 少 昵 ? 32KB 换算 为 十 六 进 制 为 0x8000， 














减 去 1KB(0x400) 的 话 ， 等 于 0x7c00。 这 就 是 倍 受 质疑 的 0x7c00 的 由 来 ， 这 下 清楚 了 。 


可 见 ， 加 载 MBR 的 位 置 取 决 于 1 

















操作 系统 本 身 所 占 内 存 大 小 和 内 存 布局 。 





我 想 大 家 现在 都 心 痒痒 了 吧 ， 说 了 这 么 久 ，CPU 中 运行 的 都 是 BIOS 的 代码 ， 连 自己 一 句 代码 都 没 跑 





起 来 呢 。 事 不 宜 




















让 大 hk 先 飞 一 会 儿 


虽说 主 引导 记录 mbr 是 咱们 能 够 掌控 的 第 一 个 程序 ， 但 这 并 不 是 让 我 们 为 之 激动 的 理由 。 我 们 平时 所 写 的 
程序 都 要 依赖 于 操作 系统 ， 而 我 们 即将 实现 的 这 个 程序 是 独立 于 操作 系统 的 ， 能 够 直接 在 裸 机 上 运行 ， 这 才 是 让 




















迟 ， 马 上 写 一 个 MBR， 先 让 它 跑 起 来 再 说 。 






































我 们 激动 的 理 











1， 对 咱们 来 说 这 无 疑 是 历史 性 的 一 刻 。 








兴 呀 。 























好 了 ,不 























魔 数 恰好 出 现 
1 于 我 们 的 bo 



















































































还 记得 当初 我 的 MBR 跑 起 来 时 ， 那 可 真是 发 自 内 心 的 高 





抒情 了 ， 说 正事 要 紧 。MBR 的 大 小 必须 是 512 字 节 ， 这 是 为 了 保证 0x55 和 0xaa 这 两 个 




















字 节 处 和 第 511 字 节 处 , 这 是 按 起 始 偏 移 为 0 算 起 的 。 






































似乎 有 点 不 认 i 








2.3.1 神奇 好 用 的 $ 和 $$， 令 人 迷惑 的 section 


chs 模拟 的 是 x86 平台 ， 所 以 是 小 端 字 节 序 ， 故 其 最 后 两 个 字 节 内 容 是 0xaa55， 写 到 一 起 后 
只 了 ， 不 要 怕 ， 拆 开 就 是 0x55 和 0xaa。 


















































$ 和 $$ 是 编译 器 NASM 预 留 的 关键 字 ， 用 来 表示 当前 行 和 本 section 的 地 址 ， 起 到 了 标号 的 作用 ， 它 


是 NASM 提供 的 ， 并 不 是 CPU 原生 支持 的 ， 相 当 科 


























F 伪 指令 一 样 ， 对 CPU 来 说 是 假 的 。 














此 令 本 来 没有 真 伪 之 别 ， 就 像 酒 一 样 ， 因 为 有 了 假 洒 ， 所 以 才 有 了 真 酒 之 说 。 伪 指令 是 相对 于 CPU 










































































可 识别 的 指令 来 说 的 ， 它 “〈 伪 指令 ) 只 是 编译 器 定义 的 ，CPU 中 并 不 存在 这 个 指令 ， 避 让 CPU 执行 这 些 


伪 指 令 ，CPU 会 抛 出 “UD (未 定义 
一 些 符号 ， 这 些 符号 在 编 









































汇编 语言 


code start 








mov ax, 0 
































的 操作 码 )” 异 常 。 伪 指令 是 编译 器 为 了 开发 人 员 写 代码 方便 而 提供 的 
译 时 ， 会 由 编译 器 转换 成 CPU 可 识别 的 东西 ， 如 指令 或 地 址 等 。 
的 标号 是 程序 员 “ 显 式 地 ” 写 在 明 处 的 ， 如 : 








code_start 这 个 标号 被 nasm 认为 是 一 个 地 址 ， 此 地 址 便 是 “mov ax，0” 这 条 指令 所 在 的 地 址 ， 即 其 
指令 机 器 码 存放 的 内 存 位 置 是 code_start。code_start 只 是 个 标记 ，CPU 并 不 认识 ， 和 伪 指 令 类 似 ， 它 是 假 


的 ，CPU 不 认 



































。 所 以 nasm 会 用 为 其 安排 的 地 址 来 奉 换 标号 code_start， 到 了 CPU 手中 ， 已 经 被 替换 为 有 
意义 的 数字 形式 的 地 址 了 。 
$ 属 于 “ 隐 式 地 ” 藏 在 本 行 代码 前 的 标号 ， 也 就 是 编译 器 给 当前 行 安排 的 地 址 ， 看 不 到 却 又 无 处 不 在 ， 









































$ 在 每 行 都 有 。 或 者 这 种 说 法 并 不 是 很 正确 ， 只 有 “显示 地 ”用 了 $ 的 地 方 ，nasm 编译 器 才 会 将 此 行 的 地 
址 公布 出 来 。 如 果 上 面 的 例子 改 为 : 





























jmp $ 


这 就 和 jmp code_start 是 等 效 的 。$ 和 code_start 是 同一 个 值 。 

$$ 指 代 本 section 的 起 始 地 址 ， 此 地 址 同样 是 编译 器 给 安排 的 。 

对 于 $ 和 $$ 的 意义 ， 我 强调 过 了 ， 是 编译 器 给 安排 的 地 址 ， 默 认 情 况 下 ， 它 们 的 值 是 相对 于 本 文件 开 
头 的 偏 移 量 。 至 于 实际 安排 的 是 多 少 ， 还 要 看 程序 员 同 学 是 否 在 section 中 添加 了 vstart。 这 个 关键 字 可 以 
影响 编译 器 安排 地 址 的 行为 ， 如 果 该 section 用 了 vstart=xxxx 修饰 ，$$ 的 值 则 是 此 section 的 虚拟 起 始 地 址 
xxxx。$ 的 值 是 以 xxxx 为 起 始 地 址 的 顺延 。 如 果 用 了 vstart 关键 字 ， 想 获得 本 section 在 文件 中 的 真实 偏 移 
量 (真实 地 址 ) 该 怎么 做 ? nasm 编译 器 提供 了 这 个 方法 。 

section. 节 名 .start。 

如 果 没 有 定义 section，nasm 默认 全 部 代码 同 为 一 个 section， 起 始 地 址 为 0。 

稍 带 说 一 下 section。 很 多 东西 从 名 字 上 就 能 理解 它 的 功能 ， 毕 竟 名 字 不 是 乱 起 的 。section 也 称 为 节 、 
段 ， 故 名 思 义 ， 是 程序 中 的 一 小 块 ， 形 象 一 点 地 说 ， 就 是 用 section 这 个 关键 字 在 程序 中 圈 出 一 块 地 ， 并 
向 编译 器 宣称 ， 这 块 地 我 要 做 些 规 划 ， 至 于 我 用 来 干什么 您 就 不 用 操心 了 ， 编 译 时 请 您 合理 安排 。 

为 什么 说 合理 安排 呢 ， 因 为 section 是 伪 指 令 ， 是 nasm 提供 的 ， 有 具体 解释 权 还 是 人 家 nasm 说 了 算 。 
比如 以 下 代码 : 


section data 
var dd 0 

section code 
jmp start 





























































































































































































































































































































编译 器 一 看 这 两 个 section，data 中 定义 的 是 变量 ，code 中 是 代码 ， 于 是 把 这 两 个 section 的 内 容 分 别 
己 入 最 终 的 数据 段 和 代码 段 。 
有 时 候 nasm 并 不 会 完全 听 您 的 ， 如 改 为 下 面 的 例子 : 


section data a 
Var dd 0 

section code 
jmp start 

section data b 
var dd.1 


虽然 人 为 定义 了 三 个 section， 但 nasm 发 现 data a 和 data b 这 两 个 section 完全 能 够 合并 到 一 起 ， 于 
是 在 编译 阶段 会 被 “合理 ”地 安排 到 一 起 。 
在 第 0 章 中 有 说 明 section 和 segment 的 区 别 。section 是 伪 指 令 ，CPU 运行 程序 是 不 需要 这 个 东西 的 ， 这 
个 只 是 用 来 给 程序 员 规划 程序 用 的 ， 有 了 section， 就 可 以 将 自己 的 代码 分 成 一 段 一 段 的 ， 当 然 这 只 是 在 逻辑 
上 的 段 , 实际 上 编译 出 来 的 程序 还 是 完整 的 一 体 。 逻辑 上 划分 成 段 的 好 处 是 方便 开发 人 员 梳 理 代码 , 方便 管理 。 
想像 一 下 ,把 一 大 片 农田 按 亩 来 划分 成 一 个 个 的 小 段 , 一 眼 望 去 ， 是 不 是 显得 井然 有 序 呢 ? 单 是 简短 的 几 行 汇 
编 代 码 是 无 法 体现 出 这 一 优势 的 ， 就 像 如 果农 田 本 来 就 不 大 ， 还 要 划分 成 多 个 段 ， 那 自然 是 得 不 偿 失 的 。 当 代 
码 量 上 去 的 时 候 , 会 发 现 如 果 不 在 逻辑 上 将 其 拆 分 成 几 块 ， 对 一 锅 粥 似 的 代码 进行 维护 ， 代 价 还 是 很 大 的 ， 可 
能 一 会 儿 脑子 也 像 一 锅 粥 了 呢 。 

划分 成 section 后 ， 编 译 器 便 根据 您 的 意图 ， 将 这 些 section 中 的 内 容 安排 位 置 ， 它 被 安排 到 哪里 咱们 
是 不 需要 关心 的 ， 咱 们 也 不 必 管 ， 因 为 程序 内 部 的 关联 是 通过 地 址 实现 的 。 想 想 看 ， 无 非 是 section 被 安 
排 到 A 位 置 ， 其 他 用 到 此 section 中 内 容 的 相关 指令 ， 其 操作 数 为 A 地 址 ， 大 section 被 安排 到 B 位 置 ， 
操作 数 便 是 B 地 址 ， 这 些 都 是 编译 器 安排 的 ， 它 会 帮 您 圆 上 的 。 

关于 section 地 址 更 详细 的 说 明 ， 大 家 可 以 参照 第 3 章 ， 这 里 只 是 抛砖引玉 。 

总 之 ，section 是 给 开发 人 员 逻 辑 上 规划 代码 用 的 ， 只 起 到 思路 清晰 的 作用 ， 最 终 还 是 在 编译 阶段 由 
nasm 在 物理 上 的 规划 说 了 算 。 
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主 引 导 记录 ， 让 我 们 开始 掌权 








第 2 章 编写 MBR 








2.3.2 NASM 简单 用 法 














在 咱们 的 实际 工程 中 
却 先 要 为 学 习 其 他 的 东西 





















































只 用 到 了 nasm 的 一 些 简 单 功 能 ,所 以 不 必 担心 连 操作 系统 的 一 名 代码 都 没 写 呢 ， 
i 付出 额外 的 精力 。 


























| nasm -f <format><filename> [-o <output>] 






































咱们 用 不 着 。 甚 至 ， 大 多 




















以 上 是 nasm 的 基本 用 法 ， 对 咀 们 来 说 ， 够 用 了 。 注 意 我 说 的 是 “基本 ”还 有 好 多 其 他 参数 呢 ， 不 过 








数 时 候 连 -f 都 不 用 呢 。 





























= 长 .生生 世 二 二 蕊 





-0 就 是 指定 输出 可 执行 文件 的 名 称 。 
查看 一 下 nasm 的 帮助 ，ok， 执 行 man nasm 回 车 ， 输 出 的 信息 太 多 了 ， 我 们 只 看 -f 的 说 明 就 行 了 。 





























Specifies the output file format. 
To see a list of valid output formats, use the -hf option. 





















































瞻 ， 人 家 说 啦 ，-f 是 用 来 指定 输出 文件 的 格式 。 要 想 知 道 有 多 少 种 有 效 的 输出 格式 ， 用 -hf 选项 。 那 
咱们 还 是 用 nasm -hf 来 查看 一 下 吧 ， 见 表 2-2。 










































































表 2-2 nasm 编译 输出 的 格式 
格 式 描 述 

bin flat-form binary files (e.g. DOS .COM, .SYS)， 此 项 为 默认 
ith JIntel hex 
srec Motorola S-records 
aout Linux a.out object files 
aoutb NetBSD/FreeBSD a.out object files 
coff COFF (1386) object files (e.g. DJGPP for DOS) 
elf32 ELF32 (1386) object files (e.g. Linux) 
elf64 ELF64 (x86 64) object files (e.g. Linux) 
elfx32 ELFX32 (x86_64) object files (e.g. Linux) 
as86 Linux as86 (bin86 version 0.3) object files 
obj MS-DOS 16-bit/32-bit OMF object files 
win32 Microsoft Win32 (1386) object files 
win64 Microsoft Win64 (x86-64) object files 
rdf Relocatable Dynamic Object File Format v2.0 
ieee IEEE-695 (LADsoft variant) object file format 
macho32 NeXTstep/OpenStep/Rhapsody/Darwin/MacOS X (1386) object files 
macho64 NeXTstep/OpenStep/Rhapsody/Darwin/MacOS X (x86_64) object files 
dbg Trace of all info passed to output stage 
elf ELF (short name for ELF32) 
macho MACHO (short name for MACHO32) 
win WIN (short name for WIN32) 

















一 共 列 出 了 21 个 ， 不 过 大 部 分 格式 和 咱们 关系 不 大 ， 咱 们 只 关注 bn 和 elf 格式 就 好 啦 。 
既然 bin 是 默认 输出 格式 ， 也 就 是 不 用 -fbin 来 明确 指定 了 ， 所 以 以 后 咱们 只 在 输出 elf 格式 时 才 用 -指定 。 






































































































































bin 是 指 纯 二 进 制 。 











进 制 就 二 进 制 吧 ， 还 有 不 纯 的 ? 就 像 前 面 的 拿 酒 举例 一 样 ， 本 来 没有 真 酒 之 说 ， 










































































是 可 执行 文件 中 什么 样 ， 





1 于 有 了 假 酒 的 出 现 ， 才 有 了 真 的 说 法 。 纯 二 进 制 就 是 不 掺 杂 其 他 的 东西 ， 直 接 给 CPU 后 就 能 用 ， 也 就 





































































































内 存 中 就 什么 样 。 我 们 平时 所 说 的 elf 或 pe 格式 的 二 进 制 可 执行 文件 ， 那 里 面 有 

































































好 多 和 指令 无 关 的 东西 , 里 面 迭 杂 了 程序 的 内 存 布 局 \ 位 置 等 信息 , 这 是 给 操作 系统 中 的 程序 加 载 器 用 的 ， 
是 属于 操作 系统 规划 的 范畴 了 。 











2.3.3 请 下 一 位 选 手 MBR 同 学 做 准 El 
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有 点 不 好 意思 了 ， 说 了 好 和 久 ， 才 说 到 实质 性 的 东西 ， 好 了 ， 赶 紧 说 正题 。 




















































































































































































































































































































































































































































































































2.3 让 MBR 先 飞 
代码 2-1 ( c2/a/boot/mbr.S ) 
1 7 主 引 导 程 序 
2 
3 SECTION MBR vstart=0x7c00 
4 mov ax,cs 
a mov ds,ax 
6 mov es,ax 
2 mov ss,ax 
8 mov fs,ax 
9 mov sp, Ox7c00 
10 
11 ; ; 清 利用 0x06 号 功能 , 上 卷 全 部 行 , 则 可 清 屏 。 
Te 荆 斌 2 
13 ;INT 0x10 ”功能 号 :0x06 ”功能 描述 :上 卷 窗 
:eS 
15 ;输入 : 
16 ;AH 功能 号 = 0x06 
17 ;AL = 上 卷 的 行 数 (如 果 为 0, 表示 全 部 ) 
18 ;BH = 上 卷 行 属性 
19 ; (CL, CH) = 窗口 左上 角 的 (x, Y) 位 置 
20 ; (DL, DH) = 窗口 右 的 (X,Y) 位 置 
21 ;无 返回 值 : 
22 mov ax Ox600 
2.3 mov bx, Ox700 
24 mov Cx 0 ; 左上 tO 0 
25 mov dx, Ox184f ; 右 下 角 : (80,25)， 
26 ; VGA 文本 模式 中 ,一 行 只 能 容纳 80 个 字符 , 共 25 行 。 
27 ; 下 标 从 0 开始 ,所 以 0x18=24, 0x4f=79 
28 int 0x10 2 bnt "URLO 
29 
30 TEE 下 面 这 三 行 代 码 获取 光标 位 人 
31 ; .get_cursor 获取 当前 光标 位 置 , 在 光标 位 置 处 打印 字符 。 
32 mov ah, 3 ; 输入: 3 号 子 功能 是 获取 光标 位 置 , 需要 存 入 ah 寄存 器 
33 mov bh, 0 ; bh 寄存 器 存储 的 是 待 获取 光标 的 页 号 
34 
35 int 0x10 ; 输出 : ch= 光 标 开始 行 , c1= 光 标 结束 行 
36 ; dh= 光 标 所 在 行 号 , qL= 光 标 所 在 列 号 
37 
3 获取 光标 位 置 结 RT 
39 
Ove en 打印 字符 出， .0 
41 ;还 是 用 10h 中 断 , 不 过 这 次 调用 13 号 子 功能 打印 字符 串 
42 mov ax, message 
43 mov bp, ax ; es :bp 为 串 首 地 址 ,es 此 时 同 cs 一 致 ， 
44 ; 开头 时 已 经 为 sreg 初始 化 
45 
46 ; 光标 位 到 dx 寄存 器 中 内 容 , cx 中 的 光标 位 置 可 忽略 
47 mov cx, 5 ; cx 为 串 长 度 ， 不 包括 结束 符 0 的 字符 个 数 
48 mov ax 0x1301 ; 子 功能 号 13 显示 字符 及 属性 , 要 存 入 ah 寄存 器 ， 
49 ; al 设置 写字 符 方式 ah=01: 显示 字符 串 , 光标 跟随 移动 
50 mov bx, 0x2 ; bh 存储 要 显示 的 页 号 , 此 处 是 第 0 页， 
51 ; bl 中 是 字符 属性 , 属性 黑 底 绿 字 (bl = 02h) 
52 int 0x10 ; 执行 BIOS 0x10 号 中 断 
DBT 打字 字符 串 结束 上 
54 
55 jmp $ ; 使 程序 悬 停 在 此 
56 
57 message db "1 MBR" 
58 times 510-($-$$) db 0 
59 db 0x55, 0xaa 
简短 说 一 下 代码 功能 ， 在 屏幕 上 打印 字符 串 “1 MBR”， 背景 色 为 黑色 ， 前 景色 为 绿色 。 

















由 于 还 没有 给 大 家 讲解 显卡 的 使 月 






























































EY 好 的 例 程 就 好 了 ， 这 和 











In 

















0x10 中 断 是 最 为 强大 的 BIOS 中 断 了 ， 调 用 的 方法 是 把 ] 
册 的 要 求 放 在 适当 的 寄存 器 中 ， 随 后 执行 nt 0x10 即 可 。 




















上 | 








功能 号 送 入 ah 寄存 器 ， 其 他 参数 按照 BIOS ! 








方法 ， 故 本 段 代码 中 关于 “打印 显示 ”的 操作 都 利用 BIOS 给 我 们 
第 0x10 号 中 断 便 是 负责 有 关 打 印 的 例 程 。 


断 手 














代码 中 的 注释 了 解 下 即 可 ， 









































我 们 不 用 太 细 致 琢磨 BIOS 功能 调用 了 ， 大 家 可 以 参数 
用 BIOS 中 断 只 是 临时 的 ， 以 后 也 用 不 到 了 。 


























毕竟 咱们 这 号 




















61 












































清楚 我 们 在 MBR 中 的 














9 己 的 就 行 ， 老 老实 实 + 








第 3 行 的 “vstart=0x7c00” 表 示 本 程序 在 编 


第 9 行 是 初始 化 栈 指针 ， 在 CPU 
栈 。 目 前 0x7c00 以 下 暂时 是 安全 的 区 域 ， 就 提 
第 11 一 28 行 是 清 屏 。 因 为 在 BIOS 工作 : 

















































































































译 时 ， 告 诉 编译 器 ， 把 我 的 起 始 地 址 编译 为 0x7c00。 
第 4~8 行 是 用 cs 寄存 器 的 值 去 初始 化 其 他 寄存 器 。 由 于 BIOS 是 通过 jmp 0: 0x7c00 跳 转 到 MBR 的 ， 故 
cs 此 时 为 0。 对 于 ds、es、fs、gs 这 类 sreg，CPU 中 不 能 直接 给 它们 赋值 ， 没 有 从 立即 数 到 段 寄存 器 的 电路 实现 ， 
只 有 通过 其 他 寄存 器 来 中 转 ， 这 里 我 们 用 的 是 通用 寄存 器 ax 来 中 转 。 例 如 mov ds: 0x7c00， 这 样 就 错 了 。 
上 运行 的 程序 得 遵从 CPU 的 规则 ，mbr 也 是 程序 ， 是 程序 就 要 用 到 
巴 它 当 作 栈 来 用 。 
， 会 有 一 些 输出 ， 如 检测 硬件 的 结果 信息 。 为 了 让 大 家 看 



































输出 字符 串 ， 故 先 把 BIOS 的 输出 清 掉 ， 这 里 演示 的 是 BIOS 中 断 int 0x10 的 用 法 。 














第 30~35 行 是 做 打印 前 的 工作 ， 先 获取 光标 位 置 
君子 不 防 小 人 的 做 法 ， 万 一 别人 不 在 光标 处 打印 ， 自 
































符 的 位 置 只 和 显存 中 的 
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岂 址 有 关 ， 和 光标 是 没关系 的 ， 





， 目 的 是 避免 打印 字符 混乱 ， 履 羡 别 











人 的 输出 。 其 实 这 是 防 


己 打 印 的 内 容 同样 也 会 被 别人 歼 盖 。 不 管 别 人 了 ， 虽 们 做 好 











也 只 在 光标 处 打印 。 不 知道 这 是 否 能 提醒 大 家 ， 字 符 打印 的 位 置 ， 不 一 定 要 在 光标 处 ， 字 




















A 








这 里 还 用 到 了 页 的 概念 ， 您 看 第 33 行 ， 往 bh 











0 页 当前 的 光标 。 什 么 








是 页 呢 ? 


显示 器 有 很 多 种 模式 ， 如 图 形 模式 、 文 本 模式 











< 


示 方 式 ， 默 认 情 况 下 ， 
































一 屏 可 以 显示 25 行 、 每 行 80 列 的 字符 ， 也 就 是 2000 个 字符 。 但 由 于 一 个 字符 要 | 
































这 只 是 人 为 地 加 个 约束 ， 毕 竞 光标 在 视觉 上 告诉 了 我 们 当 
前 字符 写 到 哪里 了 ， 完 全 是 为 了 好 看 ， 不 要 以 为 光标 就 是 新 打印 字符 的 位 置 。 更 多 细节 ， 以 后 讲 显卡 时 会 提 到 。 





寄存 器 中 写 入 了 0， 这 是 告诉 BIOS 例 程 ， 我 要 获取 第 














等 ， 在 文本 模式 中 ， 又 可 以 工作 于 80*25 和 40*25 等 显 
所 有 个 人 计算 机 上 的 显卡 在 加 电 后 都 将 自己 置 为 80*25 这 利 
































显示 方式 。80*25 是 指 
































两 字 节 来 表示 ， 低 字 













































































符 是 字符 的 ASCII 编码 ， 高 字 节 是 字符 属性 ， 故 显示 一 屏 字 符 需 要 用 4000 字 节 (实际 上 ， 分 配给 一 屏 的 
容量 是 4KB )， 这 一 屏 就 称 为 一 页 ，0 页 是 默认 页 。 

















三 | 
第 38 一 52 行 是 往 光 标 处 打印 字符 。 说 一 下 第 48 行 的 mov ax，0x1301，13 对 应 的 是 ah 寄存 器 ， 这 是 调用 


























0x13 号 子 功能 。01 对 应 的 是 al 寄存器， 表示 的 是 写字 符 方 式 ， 其 低 2 位 才 有 意义 ， 各 


(1) al=0， 显 示 字 符 串 ， 并 且 光 标 返 回 起 始 位 置 。 
(2) al=1， 显 示 字 符 串 ， 并 且 光 标 跟 随 到 新 位 置 。 
(3) al=2， 显 示 字 符 串 及 ] 












































(4) al=3， 显 示 字 符 串 及 其 属性 ， 光 标 跟 随 到 











第 55 行 执行 了 个 死 循环 ，$ 是 本 行 指令 的 地 址 ， 
编译 出 来 的 程序 中 ，$ 会 被 蔡 换 为 指令 实际 所 在 行 的 地 二 























其 属性 ， 并 且 光 标 返 回 起 始 位 置 。 























新 位 置 。 








位 功能 描述 如 下 。 


















































这 属于 伪 指 令 ， 是 汇编 器 在 编译 期 间 分 配 的 地 址 。 在 最 终 




















止 。jmp 是 个 近 跳 转 ，$ 是 jmp 自己 的 地 址 ， 于 是 跳 到 自 
























































己 所 在 的 地 址 再 执行 E 
了 ， 它 只 会 埋头 做 事 ， 






































己 ， 又 是 跳 到 自己 所 在 的 地 址 再 继续 执行 跳 转 ， 这 样 便 实现 了 死 循 环 。 可 见 CPU 可 乖 














并 不 会 觉得 有 什么 不 受 ， 靠 谱 ， 值 得 依赖 。 








总 





yn 











的 偏 移 量 。 由 于 MBR 


第 57 行 是 定义 打印 的 字符 串 。 
第 58 行 的 $$ 是 指 本 section 的 起 始 地 址 ， 上 面 说 过 了 $ 是 本 行 所 在 的 地 址 ， 故 $-$$ 是 本 行 到 本 section 


























的 最 后 两 个 字 节 是 固定 的 内 容 ， 分 别 是 0x55 和 0xaa， 要 预 留 出 这 2 个 字 节 ， 故 本 





































































































得 到 的 偏 移 量 ， 其 结果 便 是 本 局 区 内 
































($-$$) db0” 是 在 


1 0 将 本 扇 区 剩余 空间 填充 。 











代码 说 完了 ， 可 还 有 两 件 大 事 要 做 ，1 是 编译 ， 


的 剩余 量 ， 也 就 是 要 填充 的 字 节 数 。 由 此 可 见 多 














扇 区 内 前 512-2=510 字 节 要 填 满 ， 那 到 底 要 用 多 少 字 节 才能 填 满 此 扇 区 呢 。 用 510 字 节 减 去 上 面 通过 $-$$ 



































50 行 的 “times 510- 


























为 MBR， 以 供 BIOS 大 神 加 载 之 用 。 
的 用 法 ， 咱 们 马上 来 编译 汇编 代码 。 


前 面 介绍 了 nasm 


nasm -0 mbr.bin mbr.S 回 车 ， 您 看 ， 这 样 就 
512 字 节 ， 咱 们 用 ls 命令 验 训 










































































2 是 如 何 将 编译 后 的 文件 存储 到 























有 译 成 功 了 ， 我 连 -f 都 没有 指定 吧 。 
FE 一 下 : ls -lb mbrbin 回 车 ， 以 下 是 1s 的 输出 。 











| -rw-rw-r--. 1 work work 512 7 月 26 21:10 mbr.bin 


用 过 Linux 的 同学 对 这 个 输出 还 是 很 熟悉 的 ， 若 头 一 次 用 
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0 盘 0 道 1 扇 区 中 成 




















按理 说 此 文件 大 小 是 








Linux 的 同学 也 不 要 慌张 ， 这 里 面 好 多 的 信 




















息 并 不 重要 ， 只 要 看 看 中 间 部 分 就 好 了 ，512， 果 然 是 512 字 节 ， 这 下 心里 踏实 了 ， 下 一 步 是 考虑 如 何 将 
此 文件 写 入 0 盘 0 道 1 局 区 。 






































这 里 再 给 大 家 介绍 另 一 个 Linux 命令 : dd。dd 是 用 于 磁盘 操作 的 命令 ， 功 能 太 强 大 了 ， 有 如 穿甲弹 一 样 ， 






































可 以 深入 磁盘 的 任何 一 个 扇 区 ， 无 坚 不 摧 。 所 以 ， 它 也 可 以 删除 Linux 操作 系统 自己 的 文件 ， 是 把 双 刃 剑 。 












































还 是 先 看 帮助 文件 ， man dd 回 车 ， 为 了 节约 大 家 的 时 间 ， 我 只 把 咀 们 今后 用 到 的 几 个 选项 摘 了 出 来 ， 




















还 是 


























那 句 话 ， 够 用 就 行 了 ， 需 要 时 再 学 。 


if=FILE 
read from FILE instead of stdin 


此 项 是 指定 要 读 取 的 文件 。 


of=FILE 
write to FILE instead of stdout 


此 项 是 指定 把 数据 输出 到 哪个 文件 。 


bs=BYTES 
read and write BYTES bytes at a time (also see ibs=,obs=) 


此 项 指定 块 的 大 小 ，dd 是 以 块 为 单位 来 进行 IO 操作 的 ， 得 告诉 人 家 块 是 多 大 字 节 。 此 项 是 统计 配置 



































了 输入 块 大 小 ibs 和 输出 块 大 小 obs。 这 两 个 可 以 单独 配置 。 


Count=BLOCKS 
copy only BLOCKS input blocks 


此 项 是 指定 拷贝 的 块 数 。 


seek=BLOCKS 
Skip BLOCKS obs-sized blocks at start of output 


此 项 是 指定 当 我 们 把 块 输出 到 文件 时 想 要 跳 过 多 少 个 块 。 





Conv=CONVS 
convert the file as Per the comma separated Symbol list 


此 项 是 指定 如 何 转换 文件 。 


append append mode (makes sense only for output; conv=notrunc suggested) 

这 句 话 建议 在 追加 数据 时 ，conv 最 好 用 notrunc 方式 ， 也 就 是 不 打 断 文件 。 

齐 了 ，dd 的 介绍 就 到 这 了 ， 赶 紧 试 验 一 下 这 个 神奇 的 工具 吧 。 
dd if=/your path/mbr.bin of=/your path/bochs/hd60M.img bs=512 count=1 conv=notrunc 

各 位 看 官 ， 请 将 上 面 命 令 行 中 的 your_path 替换 为 您 自己 的 实际 路 径 。 

输入 文件 是 刚刚 编译 出 来 的 mbrbin， 答 出 是 我 们 虚拟 出来 的 熏 盘 hd60M.img， 撩 大 小 指定 为 512 字 他 ， 

































































































































































只 操作 1 块 ， 即 总 共 1*S$12=512 字 节 。 由 于 想 写 入 第 0 块 ， 所 以 没 用 seek 指定 跳 过 的 块 数 。 


























执行 上 面 的 命令 后 ， 会 有 如 下 输出 。 
记录 了 1+0 的 读 入 
记录 了 1+0 的 写 出 
512 字 节 (512 B) 已 复制 ，0.313312 秒 ，1.6 KB/ 秒 

这 就 说 明 命令 执行 成 功 了 ，mbrbin 已 经 写 进 hd60M.img 的 第 0 块 了 。 借 鉴 美国 宇航 员 阿 姆 斯 特 朗 的 

























































































一 名 话 : 虽然 这 只 是 简单 的 一 小 步 ， 但 却 是 实现 我 们 自己 系统 的 一 大 步 。 记 得 当初 我 可 是 非常 激动 呢 。 


示 如 图 2-4 所 示 的 界面 。 


仅 


是 电脑 的 显示 器 。 后 面 的 界面 是 bochs 的 控制 台 ， 咱 们 控制 bochs 运行 就 要 在 这 里 输入 命令 。 现 在 激活 后 面 






































启动 bochs 测试 一 下 ， 我 习惯 到 bochs 安装 目录 下 启动 它 ，bin/bochs -f bochsrc.disk 回 车 ， 接 着 会 显 



































默认 是 [6]， 开 始 模拟 啦 。 回 车 。 
于 咱们 编译 的 是 可 调试 的 版 本 ， 所 以 会 停 下 来 ，bochs 等 待 昨 们 键入 下 一 步 的 命令 ， 如 图 2-5 所 示 。 
大 家 看 到 ， 这 一 下 弹出 了 两 个 界面 ， 前 面 的 那个 是 bochs 所 模拟 的 机 器 ， 可 以 认为 它 就 是 台电 脑 了 ， 不 仅 
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的 bochs 控制 台 ， 输 入 字符 c 后 ， 回 车 。bochs 所 模拟 的 机 器 就 开始 运行 了 。 这 里 键入 的 c 是 continue， 调 试 方 
法 同 gdb 类 似 ， 详 细 的 bochs 操作 方法 咱们 会 在 下 一 章 中 介绍 。 
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File Edit View Search Terminal Help 


00000000000i[ ] reading configuration from bochsrc.disk 
00000000000e[ ] bochsrc.disk:30: 'keyboard mapping' will be replaced by new 
"keyboard' option. 


Bochs Configuration: Main Menu 


This is the Bochs Configuration Interface，where you can describe the 
machine that you want to simulate. Bochs has already searched for a 
configuration file (typically called bochsrc.txt) and Loaded it if it 
could be found. When you are satisfied with the configuration, go 


-q option to skip these menus 


。Restore factory default configuration 
. Read options from... 
Edit options 
. Save options to... 
: Restore the Bochs state from... 
。 Begin simulation 
. Quit now 


[| | | 








和 图 2-4 ”bochs 启动 











Bochs x86 emulator, http://bochs.sourceforge.net/ 


an describe the 
‘searched for a 
loaded it if it 
guration, go 


e0000000000i[ ] using log file bochs.out 
Next at t=0 
[9x09000fffffff9] f66090:fffg (unk. ctxt): jmp far f000:e95b ; ea5be000 








加 


2-5 ”bochs 运行 








A 



































MBR 运行 起 来 后 ， 就 会 出 现下 面 的 效果 ， 如 图 2-6 所 示 。 


加 TI TEST 


Resetsuspeno power 


Ta 

















TD nd hattan anahlae mvea | | | | | | | | 


和 图 2-6 ”bochs 运行 mbr 











开讲 细 节 部 分 。 


第 3 鞋 











上 一 章 我 们 完成 了 MBR 的 雏形 ， 虽 然 有 些 简 陋 ， 但 那 可 是 我 们 的 一 大 步 ， 

















完善 MBR 


我 们 已 经 完全 占领 了 计算 














机 ， 可 以 在 自己 的 空间 里 自由 驰 鸡 ， 想 干 嘛 都 行 了 。 也 许 某 些 同学 还 沉浸 在 喜悦 之 中 ， 














以 一 展 身手 了 。 不 过 有 的 同学 还 是 有 些小 冰心 ， 心 说 ， 虽 然 给 了 我 一 片 “性 士 
连 骑马 还 不 会 呢 ， 叫 我 如 何在 这 片 土地 






































心 想 ， 这 下 终于 可 


”， 但 我 能 拿 它 们 干吗 ， 我 









































MBR 中 的 几 个 细节 ， 说 到 做 到 ， 闲 话 少 说 ， 开 工 啦 。 


区 地 址 、 人 FRVY 攻 党 加 止 


还 记 不 记得 我 们 的 mbr 程序 开头 的 那 句 话 :SECTION MBR vstart=0x7c00。 这 里 我 想 跟 大 家 介绍 一 下 vstart， 





也 许 大 家 觉得 
















































































上 一 章 不 是 介绍 过 了 吗 ? 不 就 是 把 地 址 编译 为 0x7c00 吗 ? 是 ， 这 人 句 话 是 我 说 的 ， 站 在 我 的 位 置 











上 印 上 我 的 足迹 。 不 过 没关系 ， 我 在 上 一 章 中 答应 大 家 要 细 说 一 下 














我 甚至 觉得 它 描述 得 无 比 精确 ， 但 我 担心 未 必 把 它 说 清楚 了 ， 对 于 头 一 次 听 说 此 概念 的 同学 来 说 ，vstart 不 是 























那么 简单 的 ， 


咱们 多 花 点 时 间 ， 大 家 随 我 一 起 再 深入 学 习 一 下 吧 。 
我 当初 学 习 时 汇编 语言 时 ， 对 vstart 很 模糊 ， 想 问 
不 知 从 何 问 起 。 其 实 是 哪里 都 不 懂 ， 根本 没 掌 握 ， 能 问 出 问题 的 同学 才 是 党 

















“把 地 址 编译 为 0x7c00” 这 人 句 话 仅 仅 是 水 面 上 的 冰山 ， 这 水 下 看 不 到 的 部 分 可 大 着 呢 。 




































































问题 吧 ， 又 不 知道 问 什 么 ,似乎 











是 不 知道 哪里 不 会 ， 





























屋 得 差不多 了 。 按 理 说 ，vstart 








是 section 中 的 概念 ， 所 以 要 先 学 习 下 section 才 行 ， 但 要 理解 section 得 先 理解 地 址 是 什么 才 行 ， 咱 们 处 处 
体现 着 递归 式 学 习 ， 遇 到 不 明白 的 就 深入 进去 搞 清 楚 。 








所 以 ， 我 觉得 地 址 的 概念 都 没 搞 清楚 的 话 ，section 和 vstart 这 两 个 高 级 的 玩意 学 起 来 当然 如 空中 楼 阅 
了 。 在 这 里 我 把 当初 那 会 的 学 习 体会 在 这 里 跟 大 家 分 享 一 下 ， 这 里 用 了 几 个 例子 来 演示 ， 和 希望 别 把 大 家 摘 
得 更 迷糊 ， 咖 嘿 





































































































我 努力 说 清楚 。 


3.1.1 什么 是 地 址 





地 址 只 是 数字 ， 描 述 各 种 符号 在 源 程序 中 的 位 置 ， 它 是 源 代码 文件 中 各 符号 














的 符号 (指令 、 变 量 等 ) 就 像 旅店 里 的 房间 ， 有 单 人 间 、 双 人 间 ， 虽 然 大 小 不 同 ， 但 它们 也 需要 被 旅店 















































于 指令 和 变量 所 占 内 存 大 小 不 同 ， 故 它们 相对 于 文件 开头 的 偏 移 量 参 差 不 齐 。 源 文 














偏 移 文件 开头 的 距离 。 由 






































牛 就 像 旅店 一 样 ， 里 面 





































































































































































































或 























理 员 编号 ， 也 就 是 每 个 房间 都 有 房间 号 ， 这样 房客 通过 房间 号 便 能 找到 自己 的 住所 。 房 间 由 旅店 管理 员 给 
编 址 ， 那 源 代码 文件 中 各 符号 地 址 又 是 由 谁 来 规划 的 呢 ? 
编译 器 的 工作 就 是 给 各 符号 编 址 。 编 译 器 根据 所 在 硬件 平台 的 特性 ， 将 源 代码 中 的 每 一 个 符号 〈 指 令 








和 数据 ) 都 按照 本 硬件 平台 的 特性 分 配 空 间 ， 在 不 考虑 对 齐 的 情况 下 ， 这 些 符 号 在 空间 上 都 彼此 相 邻 ， 连 


续 分 布 ， 它 人 

















在 程序 中 距 第 一 个 符号 的 距离 便 是 它们 在 程序 中 的 地 址 。 


















































成 ， 那 就 别 习 























这 么 说 还 是 有 点 抽象 ， 地 址 确实 是 很 抽象 的 东西 ， 看 不 到 ， 摸 不 着 ， 不 过 学 习 起 来 完全 靠 想 像 力 可 不 




















Bb 么 费劲 了 ， 咀 们 拿 实际 程 序 说 事 。 先 跟 大 家 交待 一 下 ， 下 面 所 说 的 程序 是 纯 二 进 制 可 执行 文 













































































件 ， 这 样 方便 解释 ， 其 他 类 型 文件 牵扯 到 文件 头 ， 其 实 道理 是 一 样 的 ， 只 不 过 描述 起 








本 质 上 ， 





小 ”来 实现 的 。 题 外 话 ， 这 就 解释 了 为 什么 定义 变量 要 给 出 变量 类 型 ， 因 为 变量 
大 小 ， 每 种 类 型 都 有 其 对 应 的 内 存 容 量 




















程序 中 各 种 数据 结构 的 访问 ， 就 是 通过 “该 数据 结构 的 起 始 地 址 - 

















| 该 数 扩 





















































该 数据 结构 的 起 始 地 址 是 怎样 得 到 的 呢 ? 











来 不 方便 。 
时 结构 所 占 内 存 的 大 














类 型 规定 了 变量 所 占 内 存 














程序 中 定义 的 任何 一 个 变量 , 在 编译 
译 器 来 安排 的 。 编 译 器 是 人 设计 的 ， 所 以 如 果 是 您 
按理 说 ， 人 只 能 创造 出 人 的 思维 能 想到 











是 时 间 长 短 的 问题 。 








之 后 


























的 可 执行 文件 中 都 会 




















来 设计 编译 器 ， 



































的 东 


























敬 

















地 址 , 在 它 后 面 











译 器 无 论 怎样 安排 程 ) FR 
的 其 他 数据 依次 提 




















西 ， 所 以 无 论 人 
























































































































































占据 一 席 之 地 。 此 变量 在 文件 
您 会 怎样 规划 ] 
创造 出 什么 ， 





其 地 址 呢 ? 


















































一 定 能 够 被 人 来 理解 ， 无 非 



























































































































































的 数据 ， 必 然 有 个 先后 顺序 ， 而 占据 第 一 位 的 数据 ， 其 地 址 便 是 整个 程序 的 起 始 
E 开 就 行 了 。 若 以 整个 程序 的 开头 部 分 为 基准 ， 它 的 第 一 个 数据 所 在 的 位 置 必然 




























































































也 是 在 文件 的 开头 ， 也 就 是 偏 移 文件 开头 为 0 的 地 方 。 第 二 个 数据 所 在 的 位 置 是 数据 1 的 起 始 〈 偏 移 为 0) + 数 
据 1 所 占 的 内 存 大 小 。 第 n 个 数据 所 在 的 位 置 便 是 数据 n-1 的 偏 移 + 数 据 n-1 的 内 存 空间 。 可 见 ， 数 据 的 地 址 ， 
其 实 就 是 该 数据 相对 整个 程序 开头 的 距离 ， 即 偏 移 量 。 又 一 个 题 外 话 ， 由 于 程序 第 1 个 数据 的 地 址 〈 偏 移 量 ) 是 
0， 所 以 数组 中 第 1 个 元 素 的 下 标 也 是 0， 本 书 也 是 从 第 0 章 开 始 的 ， 可 见 偏 移 量 的 概念 太 深入 人 心 了 。 
为 了 说 明 地 址 是 偏 移 量 的 概念 ， 咱 们 由 浅 入 深 ,， 先 拿 变 量 举 个 例子 ， 如 图 3-1 所 示 。 
变量 a 是 短 整 型 ， 其 所 占 内 存 大 小 为 2 字 节 ， 其 偏 移 量 为 0。 变量 b 是 短 整 型 ， 也 
是 占 2 字 节 空 间 ， 其 偏 移 量 为 2。 变 量 c 是 整 型 ， 占 4 字 节 空间 ， 其 偏 移 量 为 4。 变 量 d 
是 短 整 型 ， 占 2 字 节 空间 ， 其 偏 移 量 为 8。 
上 述 的 偏 移 量 本 质 上 就 是 地 址 ， 每 个 变量 的 地 址 是 前 一 个 变量 的 地 址 + 前 一 个 变量 
的 内 存 空 间 大 小 。 纯 二 进 制 abin 
看 完了 这 个 简单 的 例子 ， 咱 们 要 上 点 开胃 菜 了 ， 还 是 拿 实际 代码 解释 更 有 说 服 力 。 4 图 3-1 地 址 








代码 编译 之 后 , 源 
便 程 序 员 写 代码 用 的 , 并 不 是 CPU 支持 的 东 























若 想 看 到 程序 编 














家 有 更 好 的 办 法 的 话 ， 还 


a 





译 后 的 各 指令 或 标号 的 








二 保生 
请 您 














的 标号 会 被 蔡 换 为 实际 地 址 ， 




































































口 














6, 所 以 编译 之 后 , 这 些 伪 指令 者 
也 址 ， 可 以 用 反 
诉 我 一 声 ， 兄 弟 提前 谢谢 各 








人 立 啦 。 









































IAA 








的 标号 以 及 伪 指 令 ， 只 是 方 
被 转换 为 CPU 能 够 识别 的 东 东 了 。 
| 编 来 查看 。 昌 然 方法 算 不 上 高 大 上 ， 如 果 大 




































































代码 3-1 前 两 列 是 源码 和 相应 的 行 号 ， 后 三 列 是 反 汇 编 出 来 的 地 址 、 内 容 〈 机 器 码 或 数据 ) 和 汇编 代 
码 。 我 是 用 ndisasm 这 个 工具 完成 的 ， 大 家 有 兴趣 可 以 自行 查阅 相关 资料 ， 简 单 易 用 。 
代码 3-1 
行 号 源码 地 址 地 址 处 的 内 容 : 机 器 码 或 数据 反 汇 编 代 码 
下 mov ax,$5$ 00000000 B80000 mov ax, Ox0 
2 mov ds,ax 00000003 8ED8 mov ds,ax 
3 mov ax, [var] 00000005 Al10D00 mov axr [0xd] 
4 label: mov ax,$ 00000008 B80800 mov ax, Ox8 
5 jmp label 0000000B EBFB jmp short 0x8 
6 Var dw 0x99 0000000D 99 
7 0000000E 00 





























什么 。 
源码 经 乡 
容 。 例 如 第 二 行 





























“mov ds,ax”， 明显 是 指令 ， 




















有 译 之 后 都 会 变 成 我 们 不 认识 的 东西 ， 这 个 东西 是 机 器 码 ， 还 是 数 




















长 得 完全 不 像 “mov ds,ax” 了 。 





AAA 


条 





六 行 的 源码 “var dw 0x99” 人 明显 就 是 数 志 





LU 








为 dw 是 定义 一 个 字 ， 双 字 节 ， 并 且 
地 址 D 处 内 容 为 99， 地 址 下 处 内 容 为 00。 
译 器 为 咱 1 


为 了 感谢 编 




















x86 是 小 端 




















门 做 的 贡献 ， 简 要 说 




















不 知 大 家 有 没 





说 起 来 就 有 点 复杂 了 ， 比 如 指令 前 
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万 成 总 
感觉 





译 姨 处 ] 





四 定义 ， 查 看 








理 之 后 ， 其 所 在 地 志 


























下 复杂 的 机 器 指令 。 
到 奇怪 ， 第 1 行 和 第 4 行 的 mov 操作 ， 机 
3 行 同样 是 mov 指令 ， 机 器 码 却 有 天 壤 之 别 ， 似 乎 找 不 到 共性 。 
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Te 





原 

















又 
级 


、 主 操作 码 字 节 以 及 寻 刀 


首先 这 段 程序 并 没有 什么 实际 意义 ， 大 家 不 要 琢磨 代码 功能 了 ， 这 里 只 是 为 了 帮助 大 家 理 清 地 址 是 





居 ， 取 决 于 源码 中 相应 的 内 
止 处 的 内 容 就 是 机 器 码 8ED8， 


译 之 后 ， 变 成 了 99、00， 
字 节 序 ， 低 位 的 99 在 低地 址 ， 高 位 的 00 在 高 地 址 ， 所 以 


器 码 第 1 个 字 节 都 是 B8， 而 另外 第 2、 
是 机 器 码 是 由 很 多 部 分 组 成 的 ， 这 个 
止 方式 字 节 。 寻 址 方式 由 ModR/M 字 节 、SIB 








字 节 、 位 移 量 、 广 





是 立即 数 。 第 5 行 
转 je”，“ 不 小 于 等 


3.1 地 址 、section 、vstart 浅 尝 辆 止 


即 数组 成 。 第 1 行 和 第 4 行 的 mov 的 机 器 码 中 第 1 字 节 都 是 B8， 其 原因 是 寻 址 方式 都 
的 “无 条 件 跳 转 jmp” 对 应 的 机 器 码 第 1 字 节 是 EB。 还 有 “小 于 时 跳 转 jj” “等 于 时 跳 
于 时 跳 转 jnle”……… “ 跳 转 家 族 ” 成 员 多 着 呢 ， 有 没有 感觉 到 机 器 码 好 乱 ， 好 膝 烦 ， 是 












































不 是 累 觉 不 爱 了 … 
机 器 指令 算 啦 。 大 











起 始 地 址 $$ 被 置换 
第 2 行 代码 是 
第 3 行 引 用 了 


















































… 不 过 大 家 不 用 琢磨 这 个 机 器 码 了 ,要 是 把 它 搞 清楚 了 还 要 汇编 语言 有 喻 用 , 咀 直 接 写 























家 若 对 此 感 兴趣 ， 可 以 参考 指令 格式 。 








看 第 1 行 的 mov 指令 ， 和 4 表示 的 是 所 在 的 section 的 起 始 地 址 ， 由 于 这 6 行 代码 中 没有 定义 sec 
故 nasm 默认 把 全 体 文件 当成 一 个 大 的 section， 全 体 文件 自然 偏 移 地 址 为 0， 所 以 在 反 汇编 代码 那 列 ! 



































为 0。 
真 指令 ， 不 牵涉 到 符号 转换 ， 所 以 反 汇 编 后 的 代码 同 源码 一 致 。 





tion， 




















var 变量 的 值 ，[] 符 号 是 取 所 在 地 址 处 的 内 容 。 在 相应 的 反 汇 编 代码 中 ， 相 应 的 第 三 行 





























中 var 这 个 符号 地 址 被 编译 器 蔡 换 为 0xd。 结 合 地 址 列 查看 一 下 内 容 列 ， 地 址 为 0xd 的 内 容 为 99， 这 正 是 


var 的 值 。 
第 4 行 源码 为 


表示 当前 行 地 址 。 按 理 说 这 两 个 标号 值 应 该 是 一 致 的 ， 验 证 一 下 : 查看 下 有 反 汇 编 代码 列 的 第 4 行 ，$ 被 
0x8， 即 本 行 mov 指令 地 址 是 0x8， 在 地 址 列 第 4 行 查看 ， 地 址 确实 为 8， 吻 合 。 
寺 换 为 jmp short 0x8， 这 是 短 跳 转 指令 ， 地 址 为 8 处 的 内 容 是 第 4 行 


的 “mov ax，$”， 





第 5 行 的 “jmp label” 编 译 后 被 





























“]abel: mov ax,$”,label 是 个 标号 ,代表 指 令 “mov ax, $” 所 在 地 址 。$ 是 个 隐 式 的 











标号 ， 



































换 为 


























同样 吻合 。 








AAA 




















第 6 行 的 便 是 
与 源码 定义 吻合 。 

顺便 说 一 句 ， 
顺 次 向 下 执行 的 ， 


成 指令 ， 是 否 会 报 

















数据 定义 了 ， 定 义 了 双 字 节 变 量 var， 其 值 为 99。 在 内 容 处 的 第 6 行 可 知 ， 内 容 为 99， 





CPU 不 去 判断 给 它 的 内 容 是 指令 ， 还 是 一 般 数据 ， 它 也 分 不 清楚 。CPU 执行 指令 时 是 




















所 以 若 没有 第 5 行 的 jmp 形成 死 循 环 ，CPU 执行 到 第 6 行 时 ， 会 把 var 变量 的 值 











99 当 


错 还 不 得 而 知 ， 这 得 看 给 它 的 数 是 否 恰好 能 成 为 个 指令 。 由 上 面 提 到 的 指令 格式 可 知 ， 




















指令 有 很 多 组 成 部 





分 ， 有 的 组 成 部 分 还 可 以 省 略 ， 万 一 给 的 这 个 数字 恰好 能 组 成 一 个 指令 呢 。 如 此 处 var 















































变量 值 99 就 恰好 是 汇编 语言 中 的 字 扩展 指令 CWD， 它 的 功能 是 将 一 个 字 型 变量 扩展 为 双 字 型 变 和 
Change Word to Double word 。 


终于 说 到 重点 




















了 ， 大 家 观察 一 下 ,“ 地 址 ” 列 中 的 数字 和 “内 容 ” 列 中 的 内 容 有 这 样 一 种 关系 : 














县 > 即 


地 址 





等 于 上 一 个 地 址 + 上 一 个 地 址 处 的 内 容 的 长 度 。 例 如 地 址 列 第 二 行 的 3 等 于 “上 一 个 地 址 0”+“ 上 一 个 地 址 





0 处 的 内 容 : B80000 的 长 度 3” 以 此 类 推 。 
































这 说 明 这 和 











们 前 面 的 示意 图 是 一 致 的 。 











于 是 ， 现在 可 
是 各 符号 相对 于 文 

















以 斩钉截铁 地 得 出 结论 : 编译 器 给 程序 中 各 符号 (变量 名 或 函数 名 等 ) 分 配 的 地 址 ， 就 

















件 开头 的 偏 移 量 。 











3.1.2 什么 是 section 


不 知道 有 多 少 





持 segment 和 section 这 两 个 关键 字 , 它们 的 功能 都 是 在 程序 中 宣称 一 个 区 域 。 不 过 这 可 不 是 Linux | 


程 中 的 段 。 为 不 引 
编译 器 提供 的 




















同学 对 汇编 语言 中 的 section 感到 迷惑 ， 这 个 section 称 为 节 ， 在 有 的 编译 器 中 ， 同 时 文 




















] 户 进 
































起 混乱 ， 咱 们 只 用 section 来 描述 汇编 语言 中 的 段 。 















































关键 字 Section 只 是 为 了 让 程序 员 在 逻辑 上 将 程序 划分 成 几 个 部 分 ， 因 为 它 是 伪 指 令 ， 






































CPU 都 不 知道 有 这 个 东西 ， 更 不 知道 咱们 交 给 它 执行 的 代码 经 过 了 这 很 多 的 “ 风 风 雨 十 > 甚至 ， 我 怀疑 
nasm 即使 提供 了 这 个 section, 它 也 不 知道 这 个 section 中 的 内 容 是 什么 ,是 代码 ? 数据 ? 栈 ? nasm 不 
也 没 必 要 关心 , 因为 这 是 它 给 程序 员 的 福利 , 程序 员 自 己 知道 在 哪个 section 中 是 什么 就 行 啦 。 一 般 section 
的 应 用 场所 是 根据 不 同 的 属性 人 为 地 将 程序 划分 几 部 分 ， 如 数据 放 在 一 个 section 中 ， 指 令 放 在 另 一 个 






























































关心 ， 


section 中 ， 这 样 程序 员 便 将 指令 和 数据 分 开 了 ， 使 代码 结构 清晰 明了 ， 更 易于 维护 。 程 序 如 何 划分 ， 这 个 
看 程序 员 自 己 的 风格 喜好 ， 其 至 可 以 利用 section 把 程序 切 得 零碎 不 堪 ， 所 以 你 懂 了 ， 





没有 规定 ， 完 全 是 





















































nasm 根本 没 必要 知道 你 的 section 中 到 底 是 啥 。 
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代码 3-2 
行 号 源码 地 址 地 址 处 的 内 容 : 机 器 码 或 数据 反 汇 编 代 码 
1 section code 
2 mov ax,$5$ 00000000 B80000 mov ax, 0x0 
3 mov ax, section.data.start 00000003 B81000 mov ax, Ox10 
4 mov ax [varll] 00000006 Al11000 mov ax, [0x10] 
5 mov ax, [var2] 00000009 Al1400 mov ax, [0x14] 
6 label: jmp label 0000000C EBFE jmp short Oxc 
7 0000000E 0000 
8 section data 
9 varl dd Ox4 00000010 0400 
10 00000012 0000 
Var2 dw 0x99 00000014 99 
12 00000015 00 
代码 3-2 在 上 一 个 基础 上 稍 做 了 一 些 改 变 ， 添 加 了 变量 及 section 的 应 用 。 
第 1 行 和 第 8 行为 空 ， 并 没有 产生 相应 地 址 或 机 器 指令 ， 这 就 是 section 是 伪 指 令 的 原因 。 
第 3 行 中 用 到 了 section.data.start， 其 用 法 是 section. 节 名 .start， 这 里 是 获得 名 为 data 的 section 在 本 文 





















































件 中 的 真实 偏 移 ， 即 起 始 地 址 ， 是 nasm 提供 的 伪 指 令 。 查 看 “ 反 汇 编 代 码 ” 列 的 同一 行 ， 编 译 后 已 经 被 
替换 为 0x10， 说 明定 义 的 数据 section 起 始 地 址 为 0x10。 可 见 ， 定 义 的 section， 其 起 始 地 址 默认 是 从 上 一 
个 数据 的 地 址 延续 下 来 的 。 

由 于 varl 是 数据 section 的 首 个 数据 ， 其 地 址 必然 是 和 数据 section 一 致 。 故 对 比 下 “源码 ” 列 和 “ 反 
汇编 代码 ” 列 的 第 4 行 ，varl 的 地 址 确实 被 替换 为 0x10。 

Var2 是 继 varl 之 后 的 变量 ， 由 于 varl 的 类 型 是 dd， 即 双 字 ， 故 其 占用 4 字 节 ， 所 以 var2 的 地 址 应 该 
是 0x14。 这 一 点 可 以 通过 对 比 “ 源 码 ” 列 和 “ 反 汇 编 代 码 ” 列 看 出 。 

于 是 ， 现 在 可 以 趾 高 气 扬 地 得 出 结论 : 关键 字 section 并 没有 对 程序 中 的 地 址 产生 任何 影响 ， 即 在 默 
认 情 况 下 ， 有 没有 section 都 一 个 样 ，section 中 数据 的 地 址 依然 是 相对 于 整个 文件 的 顺延 ， 仅 仅 是 在 逻辑 
上 让 开发 人 员 梳 理 程序 之 用 。 








































































































FF 











































































































3.1.3 什么 是 vstart 


先 看 看 官方 的 说 法 ， 以 下 摘自 nasm 技术 手册 ， 上 面 给 出 了 它 的 名 称 和 作用 。 
nasm 手册 : 
7.1.3 Multisection Support for the bin Format 









































e Sections can be given a virtual start address, which will be used for the calculation of all memory 

references within that section with vstart=. 

大 概 意思 是 section 用 vstart= 来 修饰 后 ， 可 以 被 赋予 一 个 虚拟 起 始 地 址 virtual start address〈 强 调 了 这 
个 是 虚拟 的 地 址 ， 不 过 要 注意 ， 这 与 x86 CPU 中 开启 分 页 后 的 虚拟 地 址 是 两 码 事 ， 不 能 混为一谈 )， 它 被 
用 来 计算 在 该 section 内 的 所 有 内 存 引 用 地 址 。 

vstart 是 虚拟 起 始 地 址 ， 这 里 面 有 两 个 重要 的 概念 ，1 虚拟 ，2 起 始 。 

以 下 我 要 通过 “长 篇 大 论 ” 来 解释 一 裔 ， 各 位 做 好 心理 准备 。 

vstart 的 作用 是 为 section 内 的 数据 指定 一 个 虚拟 的 起 始 地 址 ， 也 就 是 根据 此 地 址 ， 在 文件 中 是 找 不 到 
相关 数据 的 ， 是 虚拟 的 ， 假 的 ， 文 件 中 的 所 有 符号 都 不 在 这 个 地 址 上 。 

给 大 家 再 整 一 个 硬 菜 ， 继 续 看 代码 。 
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3.1 地 址 、section 、vstart 浅 尝 辑 止 
代码 3-3 
行 号 源码 地 址 地 址 处 的 内 容 : 机 器 码 或 数据 反 汇 编 代码 
1 section code vstart=0x7c00 
pe mov ax SS 00000000 B8007C mov ax, Ox7c00 
3 mov ax, section.code.start 00000003 B80000 mov ax, Ox0 
4 mov ax, section.data.start 00000006 B81400 mov ax, 0X14 
5 mov ax,$ 00000009 B8097C mov ax, Ox7c09 
6 mov ax [varl] 0000000C Al10009 mov ax [0x900] 
和 mov ax [var2] 0000000F A10409 mov ax, [0x904] 
8 jmp $ 00000012 EBFE jmp -2 
9 section data vstart=0x900 
10 varl dd 0x4 00000014 0400 
J 00000016 0000 
12 Var2 dw 0x99 00000018 99 
00000019 00 
样 例 代码 3-3 在 section 中 添加 了 vstart， 这 个 参数 是 让 编译 器 将 section 中 的 数据 的 地 址 以 vstart 的 值 
为 起 始 ， 不 再 从 整个 程序 开头 算 起 。 只 有 以 程序 开头 0 算 起 的 地 址 才 是 真实 存在 的 ， 在 这 个 地 址 上 能 访问 
到 相应 的 符号 ， 所 以 不 以 程序 开头 算 起 的 地 址 ， 必 然 在 程序 内 部 不 存在 ， 是 虚拟 的 。 
源码 第 1 行 的 section 含有 vstart=0x7c00， 故 该 节 中 的 数据 地 址 以 0x7c00 为 起 始 编 址 。 此 0x7c00 便 
是 虚拟 的 地 址 ， 在 程序 中 没有 偏 移 文件 开头 为 0x7c00 的 地 址 ， 整 个 程序 不 到 100 字 节 。 
源码 第 2 行 的 $$ 在 编译 后 被 蔡 换 为 vstart 的 值 0x7c00， 可 见 ，$$ 以 该 节 的 虚拟 起 始 地 址 为 主 ， 若 该 节 
未 用 vstart 来 指定 则 以 在 文件 中 的 起 始 地 址 ( 较 虚拟 地 址 来 说 ， 此 地 址 便 为 真实 地 址 〉 为 主 ， 而 该 节 在 文 
件 中 的 起 始 地 址 是 code. 节 名 .start。 

















第 3 行 和 第 4 行 的 源码 和 相应 反 汇 编 代 码 表明 “code. 节 名 .start” 是 节 在 整个 程序 中 的 地 址 ， 即 相对 于 
文件 开头 的 偏 移 量 
第 5 行 的 $ 在 文件 中 的 地 址 是 0x9， 经 编译 后 变 成 了 0x7c09， 类 似 于 重 定位 : 新 的 地 址 + 在 文件 中 的 地 


址 (也 相对 于 整个 文件 的 1 

















第 6、7 行 ! 
0x900，var2 是 0x900+varl 

这 里 要 和 大 家 说 一 下 ， 
肥 汇 编 
果 是 我 手 



























































引用 的 变量 varl 和 var2 
的 内 存 空间 4 字 节 =0x904。 这 上 
第 8 行 的 jmp $， 按 到 
的 结果 是 jmp short 0x12，0x12 是 相对 于 整个 文件 
F 工 修改 成 “jmp -2” 的 ， 原 因 如 下 。 
我 心 想 ， 既 然 我 已 经 用 vstart 指定 虚拟 起 始 地 址 了 ，jmp $ 编译 的 结果 按 到 












































扁 移 量 )， 即 0x7c00+9。 













































































说 可 以 多 













































































同 0x7c00 一 样 。 





说 要 么 是 jmp near 0x7c12， 操 作 


[多 





属于 data 节 ， 由 于 该 节 有 vstart=0x900， 所 以 该 节 中 的 varl 地 址 是 
的 0x900 也 属于 虚拟 地 址 ， 原 因 
前 译 成 相对 转移 的 形式 : jmp -2， 而 我 用 ndisasm 
的 绝对 地 址 ， 可 称 为 真实 地 址 。 此 处 的 反 汇 编 结 





弓 


用 二 口 




















码 以 E9 开头 ， 这 说 明 这 是 相对 近 转 移 的 语法 : jmp 16 位 地 址 ， 要 么 是 jmp short -2， 操 作 码 是 EB， 这 是 相对 短 





转移 的 语法 : jmp -128 一 127 之 间 的 数 。 可 是 看 这 jmp short 0x12, 0x12 是 真实 的 ] 
占 1 字 节 ， 操 作 数 是 相对 于 跳 转 目标 地 址 的 1 
时 用 参数 -o 0x7c00 给 





是 相对 短 转移 ， 其 操作 码 是 
可 正 可 负 ， 只 能 在 段 内 唱 








EB， 











kt 转 。 于 是 我 用 ndisasm 反 汇 














“ndisasm -o 0x7c00” 但 反 


[ 编 的 结 











过 间 。 
验证 了 














~ 

















好 了 才 行 ,这 是 永恒 不 变 的 。 程序 中 
要 的 才 行 ， 换 句 话说 ， 必 须 保证 自己 想 要 的 东 7 
加 载 器 做 的 事 ， 根 据 文件 头 中 给 出 的 各 段 的 位 置 ， 将 它们 加 载 到 内 存 中 上 





内 存 必须 是 你 想 

















2 





乡 




















户 


地 址 ， 似 乎 不 了 












































-2。 所 以 




















UD 


的 地 址 ， 最 终 是 





























要 











用 来 访问 物理 内 存 














要 提前 在 天 


西 














的 ， 所 以 该 








添加 了 个 起 始 地 址 来 测试 ， 如 
变 成 了 jmp short 0x7c00， 这 结果 明显 不 对 ， 偏 移 量 0x7c00 不 在 -128 一 127 
于 jmp short 指令 操作 码 和 操作 数 各 是 1 字 节 ， 总 共 加 起 来 是 2 字 节 。 于 是 怀 着 志 直 的 心情 在 bochs 中 
， 执 行 到 jmp $ 的 时 候 果 然 是 jmp 
地 址 访问 策略 是 根据 程序 中 给 

















四 第 8 行 是 被 我 手工 改 为 jmp -2 的 ， 请 大 家 知晓 。 
的 地 址 ， 到 地 址 处 去 拿 东 西 ， 所 以 这 个 东 





8 个 地 址 处 准备 


F 确 。 鉴于 jmp short 
高 移 量 ， 是 1 字 节 的 有 符号 数 ， 故 


人 人 
命令 











也 址 对 应 的 物理 






































被 加 载 到 


那个 物理 


























内 存 位 置 。 这 就 是 程 请 
的 相应 地 址 ， 这 样 用 户 程序 才能 访 
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问 到 自己 需要 的 东西 。 




















vstart=XXXX 和 org xxxx 这 两 个 关键 字 是 同一 功能 , 但 很 多 同学 都 混淆 其 意义 。 它 们 并 不 是 告诉 编译 器 
程序 加 载 到 地 址 xxxx， 这 似乎 一 听 ， 好 像 是 编译 器 有 加 载 器 的 功能 了 ,“ 加 载 ” 不 是 它 的 工作 ， 这 是 加 载 


器 的 工作 ， 编 译 器 只 会 规划 代码 















































》 只 会 为 程 请 编 址 ， 并 不 负责 加 载 。 




















vstart 和 org， 它 们 的 功能 是 告诉 编译 器 :“ 嘿 ， 老 兄 ， 你 帮 我 把 后 面 所 有 数据 《指令 和 变量 ) 的 地 址 











以 xxxx 为 起 始 开 始 编 吧 ” 就 这 





























点 意思 而 已 ， 没 别 的 了 。 编 译 器 从 不 问 你 这 是 为 哈 。 只 有 开发 人 员 知 道 以 








xxxx 为 起 始 的 原因 是 将 来 有 某 个 加 载 器 要 把 我 的 这 个 程序 放 到 内 存 的 xxxx 地 址 ， 如 果 我 程序 中 引用 的 所 








有 地 址 不 是 以 xxxx 为 起 始 的 ， 那 就 坏 了 ， 访 问 错 的 数据 肯定 出 事 。 



























































再 重复 一 次 , 编译 器 只 负责 编 址 ， 它 只 会 将 数据 相对 于 文件 开头 的 偏 移 量 作为 该 数据 的 地 址 ， 全 是 以 








0 起 始 的 。 所 以 把 整个 
如 此 待遇 在 0 物理 地 址 上 走 上 一 
编译 器 以 相对 于 文件 开头 偏 
个 地 址 为 段 基 址 ， 文 件 内 的 数据 

为 什么 mbr 能 够 运行 正常 ? 







































































程序 加 载 到 内 存 地 址 0 处 ， 程 序 运行 肯定 是 没 问 题 的 。 但 基本 上 没有 哪个 程序 能 有 



























































可 《不 包括 保护 模式 下 分 页 产生 的 虚拟 地 址 )。 
移 来 编 址 的 好 处 是 利于 重 定位 。 整 个 文件 新 加 载 到 某 个 地 址 后 ,可 以 以 这 
的 地 址 是 以 0 为 开始 算 的 ， 所 以 它们 直接 就 可 以 用 作 段 内 偏 移 地 址 了 。 



























































mbr 用 vstart=0x7c00 来 修饰 的 原因 ， 是 因为 开发 人 员 知道 mbr 要 被 加 载 器 (BIOS)〉 加 载 到 物理 地 址 
0x7c00，mbr 中 后 续 的 物理 地 址 都 是 0x7c00+。 另 外 ， 因 为 BIOS 进入 mbr 是 通过 jmp 0: 7c00 来 实现 的 ， 
故此 时 cs 己 经 变 成 0， 相 当 于 “平坦 模型 ”了 ， 只 不 过 此 “平坦 模型 ”大 小 只 是 65536 字 节 , 而 不 是 4GB。 
所 以 mbr 中 各 数据 编译 出 来 的 地 址 (大 于 等 于 0x7c00) 实际 上 都 成 了 偏 移 地 址 ， 这 样 “0*16: 偏 移 地 址 
0x7c00+” 来 访问 被 加 载 到 0x7c00 的 mbr 是 正确 无 误 的 。 所 以 说 ， 用 vstart 的 时 机 是 : 我 预先 知道 我 的 程 












































































































































序 将 来 被 加 载 到 某 地 址 处 。 程 序 只 有 加 载 到 非 0 地 址 时 vstart 才 是 有 用 的 ， 程 序 默认 起 始 地 址 是 0。 




































































其 实 section 用 vstart=0 修饰 更 方便 , 节 内 元 素 地 址 是 以 0 为 起 始 的 偶 移 ,由 于 实 模 式 下 会 使 段 寄存 器 

















中 的 值 乘 以 16， 所 以 咱们 提供 的 段 基 址 要 事先 除 以 16， 如 使 ds= (section.xxx.startt 加 载 的 地 址 ) /16， 这 











样 访问 节 内 数据 直观 多 了 。 注 意 
保护 模式 时 会 给 大 伙 儿 解释 明白 
举 个 生活 中 的 例子 : 比如 我 


























这 个 简单 的 例子 就 是 模拟 的 








跟 我 说 ， 下 午 韩 梅 梅 叫 他 去 学 校 了 ， 找 他 的 话 直 接 去 学 校 吧 。 











， 在 保护 模式 下 段 寄 存 器 中 的 值 是 不 用 乘 以 16 的 ， 在 后 面 介绍 实 模 式 和 




































































想 去 找 李 雷 ， 在 李 雷 不 外 出 的 情况 下 ， 直 接 去 李 雷 家 就 行 了 。 但 李 雷 上 午 


























CPU、 访 问 对 象 、 加 载 器 三 者 的 关系 。 






































这 里 面 我 相当 于 CPU， 李 雷 相当 于 程序 中 访问 的 数据 ， 韩 梅 梅 相 当 于 加 载 器 。 李 雷 知道 下 午 会 被 吾 


梅 梅 叫 到 学 校 ， 因 为 他 的 地 址 变 
某 个 地 址 ， 所 以 告诉 编译 器 把 它 






































身 在 文件 中 的 地 址 (相对 于 文件 
定 得 用 0 来 填充 ， 那 得 多 出 多 少 















































了 ， 所 以 让 我 改变 了 找 他 的 地 点 。 由 于 程序 知道 自己 将 来 会 被 加 载 器 放 到 
编 成 这 个 地 址 ， 将 来 CPU 用 此 地 址 才能 找到 它 。 









































再 提醒 一 下 ，vstart 只 是 告诉 编译 器 以 新 的 数字 作为 后 面 数据 的 地 址 的 起 始 值 ， 它 本 身 没 改变 数据 本 

















开头 的 偏 移 )， 若 能 改 的 话 ， 比 如 vstat=0x7c00， 那 0x7c00 之 前 的 间隙 肯 
填充 物 啊 ， 那 文件 就 太 大 啦 。 总 不 该 用 了 vstart 后 ， 文 件 就 跟着 变 大 。 





















































由 上 分 析 ，vstart 只 是 按照 开发 人 员 的 意愿 安排 新 的 起 始 地 址 ， 不 再 以 文件 开头 0 为 起 始 ， 其 地 址 若 


超过 文件 大 小 则 不 会 落 在 文件 内 


























， 所 以 是 虚拟 的 。 


不 管 程序 用 的 是 不 是 虚拟 地 址 ， 只 要 交 给 地 址 总 线 一 个 地 址 ， 地 址 总 线 就 会 去 寻找 该 地 址 处 的 内 容 。 




















根据 这 个 原则 ， 只 要 保证 该 地 址 






































处 的 内 容 正 是 你 所 需要 的 即 可 。 如 果 程 序 员 用 vstart 指定 了 新 的 地 址 ， 干 
































涉 了 纺 译 器 编 址 的 方 武 ， 程 请 员 


.< 汪 的 实 模式 


由 于 mbr 在 实 模式 下 工作 





















































要 清楚 地 知道 自己 需要 的 东西 是 否 会 出 现在 物理 内 存 中 这 个 新 的 地 址 处 。 











ns 什么 ?什么 是 实 模式 ? 这 时 候 有 同学 打 断 了 我 。 我 心 想 ， 这 下 好 办 




















了 …… 了 哈哈, 没有 啦 ， 开 个 玩笑 而 已 。 我 们 这 里 所 说 的 实 模式 其 实 就 是 8086 CPU 的 工作 环境 、 工 作 方式 、 

















工作 状态 ， 这 是 一 整套 的 内 容 ， 
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并 不 是 单 指 茶 一 方面 的 设置 。 

















实 模式 是 指 8086 CPU 的 寻 址 方式 、 寄 存 器 大 小 、 
作 的 概念 。 所 以 想 了 解 实 模式 这 利 
大 家 都 学 过 




























































































3.2.1 CPU 的 工作 原理 


在 介绍 CPU 的 各 种 模式 之 前 ， 
聊 CPU 的 工作 原理 。 
当然 这 里 所 说 












































想 讲 也 讲 不 出 来 。 第 二 我 觉 4 
外 令 时 ,您 的 大 脑 总 是 联想 到 各 利 








由 令 用 法 等 ， 是 
































技术 里 那么 细致 ,精确 到 逻辑 门 等 电子 

















昔 到 那么 细致 ， 如 果 懂 的 太 名 









































强迫 症 似 的 要 求 掌握 每 个 步骤 的 细节 














] 来 反应 CPU 在 该 环境 下 如 何 工 
由 象 的 概念 ， 主 要 就 是 了 解 在 实 模式 下 CPU 能 做 什么 。 

了 讲 实 模式 、 保 护 模 式 之 类 的 ， 但 鉴于 太 过 和 久远， 为 了 让 后 面 的 工作 顺 
利 进行 ， 我 觉得 还 是 有 必要 给 大 家 介绍 下 CPU 的 工作 模式 。 


























E 占 用 大 家 几 分 钟 的 时 间 ， 说 点 在 两 种 模式 下 公共 的 内 容 ， 和 大 家 聊 
































|] 了， 会 为 之 所 和 











电路。 第 一 我 也 不 会 ， 


， 您 想 ， 每 次 执行 一 条 
EL 程 ， 本 来 一 瞬间 完成 的 工作 您 可 能 要 给 放大 一 千 倍 ， 非 得 
上: 想 不 通 了 这 就 会 让 人 感到 很 泪 背 ， 影响 心 情 ， 甚 至 





























质疑 上 层 的 纺 





上 介绍 下 CPU 工作 原理 。 

大 家 都 知 
指令 的 流程 是 怎样 的 呢 ? 
CPU 大 体 - 
空 制 单 元 是 CPU 的 控 人 





过 









































哈 ， 我 知道 说 得 有 点 严重 了 ， 不 夸张 一 点 的 话 不 容易 表述 问题 ， 好 了 ， 下 面 在 宏观 




















上 可 以 划分 为 3 个 衣 
关中 心 ，CPU 需要 经 过 它 的 帮 有 
令 寄 存 器 IR (Instruction Register)、 指令 译 码 器 ID (Instruction Decoder)、 操 作 控 人 














组 成 。 程 序 被 加 载 到 内 存 后 ， 也 就 是 
令 的 地 址 ， 控 
这 些 指令 是 什么 ， 在 它 昌 





上 令 格 式 来 解码 ， 分 析出 操作 码 是 什么 ， 操 作 数 在 哪里 之 类 的 。 表 3-1 给 
IA32 指令 格式 
寻 址 方式 、 操 作 数 类 型 


表 3-1 


前 绥 





识 





这 些 ， 如 rep“〈 用 
址 方式 又 有 好 多 ， 如 基 址 寻 址 、 变 寺 
用 到 了 立即 数 ， 就 要 将 3 
量 记录 到 指令 格式 中 的 

既然 指令 是 

存储 单元 是 指 CPU 
数据 是 说 指令 中 的 操作 数 


































































































一 的 任务 就 是 执行 指令 ， 在 它 眼 里 ， 指 令 就 是 一 串 010101…… 那 它 执行 每 条 
单元 、 运 算 单 元 、 存 储 单元 。 











才 知 道 自 己 下 一 步 要 做 什么 。 而 控制 单元 大 致 由 指 
央 器 OC (Operation Controller) 











这 时 都 在 内 存 中 了 ， 指 令 指针 寄存 器 IP 指向 内 存 中 下 一 条 待 执行 指 
向 ， 将 位 于 内 存 中 的 指令 逐个 装载 到 指令 寄存 器 中 ， 但 它 还 是 不 知道 









































看 上 去 还 是 很 复杂 的 ， 复 杂 的 原 
只 别 一 种 格式 。 

由 于 CPU 支持 的 指令 数量 较 多 ， 一 些 指 令 还 可 以 搭配 一 些 
经 常用 )、 段 超越 前 级 。 操 作 码 就 是 大 家 平时 | 
止 寻 址 等 ， 操 作 数 类 型 中 记录 的 是 ) 
其 记录 到 指令 格式 中 立即 数 的 部 分 ， 如 果 寻 址 方式 中 用 到 了 侦 




































































的 ， 那 指令 中 用 到 的 数据 存放 到 
内 部 的 LI1、L2 缓存 及 寄存 器 ， 答 处 理 的 数据 间 





因 是 必须 用 一 种 统一 的 格式 去 归纳 所 有 亚 


























时 还 没有 实际 意义 。 然 后 指令 译 码 器 将 位 于 指令 寄存 器 中 的 指令 按照 
上 了 一 般 的 指令 格式 。 


偏 移 量 





J 指令， 因为 CPU 只 能 




















甫 助 的 东 东 ， 所 以 就 


i 需要 在 前 级 部 分 记录 

















的 mov、jmp 等 。 寻 














j 哪 些 寄存 器 2 











类 的 。 如 果 在 指令 



































移 量 , 就 要 将 此 偏 移 





























因 是 缓存 基本 上 都 是 采 / 
的 存储 器 。 这 么 
(Dynamic Random Access Memory)，DRAM 内 存 需要 每 隔 一 段 时 间 就 去 刷 
充电 ， 否 则 存储 的 数据 就 会 丢失 。 而 SRAM 不 需要 
含义 ， 因 此 SRAM 性 能 较 强 劲 。 但 SRAM 也 不 是 完美 无 缺 的 ， 它 的 集成 度 较 低 ， 相 同 容量 之 下 ，SRAI 



































。 为 什么 数据 已 经 在 内 存 中 了 还 非得 在 CPU 内 部 下 








峙 








EE 呢 ? 下面 介绍 存储 单元 。 


























的 SRAM (Static RAM) 存储 器 ， 从 名 字 上 看 就 
说 ,似乎 还 有 动态 存储 功能 的 存储 器 ?是 啊 , 其 实 我 们 捐 


























存放 在 这 些 存储 单元 中 ， 这 里 的 
了 整 这 么 个 存储 单元 干吗 ? 原 
































道 它 是 一 种 具有 静态 存 取 功能 
上 的 物理 内 存 就 是 DRA 









































M 

， 刷 新 就 是 指 给 DRAM 

刷新 电路 即 能 保存 它 内 部 存储 的 数据 ， 这 就 是 静态 的 
M 









































的 体积 比 DRAM 要 大 很 多 。 二 级 缓存 都 不 大 ， 目 前 来 说 顶 多 4MB 左右 ， 所 以 现代 CPU 用 二 级 缓存 的 数 





























量 取胜 ， 如 Ll1、L2、L3 共 三 级 。 寄 存 器 可 分 为 两 大 类 ， 程 序 员 











如 通用 寄存 器 、 段 寄存 器 。 和 和 























可 以 使 ) 

















j 的 寄存 器 称 为 程序 可 见 寄 存 器 ， 
序 不 可 见 寄存 器 是 指 程序 员 不 可 使 用 ， 也 无 法 访问 到 它们 ， 系 统 运行 期 间 可 
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第 3 章 完善 MBR 
能 要 用 到 的 寄存 器 ， 如 ALU 




















算术 逻辑 和 





各 元 在 求 和 时 ， 会 将 结果 4 








E 送 到 数据 暂 存 寄存 器 。 























EE 元 。 



































好 啦 ， 文 字 描述 过 了 
的 地 址 在 程序 计数 器 PC 








在 x86CPU .| 





灌 作 码 有 了 ， 操 作 数 有 了 ， 就 差 执 行 指 令 了 ， 随 后 “操作 控制 器 ”给 相关 部 件 发 信号 ， 会 给 哪些 部 件 
发 信号 呢 ? 例如 下 面 要 介绍 的 运算 和 






































运算 单元 负责 算术 运算 〈 加 减 乘 除 ) 和 届 辑 运算 〈 比 较 、 移 位 )， 它 从 控制 单元 那里 接收 命令 〈 信 和 号 ) 
并 执行 ， 它 没有 自主 意识 ， 只 是 个 执行 部 件 。 
它们 之 间 的 关系 如 图 3-2 所 示 。 
CPU 


得 到 要 待 运 
行 指 令 地 址 


取 操 作 数 i 


得 到 操作 数 


得 到 指令 
| 








[ 受 ] 





3 天 RU 








作 后 理 修 忆 











也 看 过 了 








| .» 











Ce 
， 总 结 


























下 CPU 的 工作 原理 。 控 制 单元 要 取 下 一 条 待 运行 的 指令 ， 该 指令 
程序 计数 器 就 是 cs: ip。 于 是 读 取 ip 寄存 器 后 ， 将 此 地 址 送 上 地 址 


























总 线 ，CPU 根据 此 地 址 便 得 到 


了 指令 ,并 将 











中 令 格式 检查 指令 寄存 器 中 的 和 




















存 入 到 指令 寄存 器 及 中 。 这 时 候 轮 到 指令 译 码 器 上 场 了 ， 它 根据 














引 令 ， 先 确 


立 ， 











从 内 存 中 取 回 放 入 自己 





的 存储 单元 ， 若 操作 数 是 在 寄存 器 





定 操作 码 是 什么 ， 再 检查 操 




















企 数 类 型 ， 知 是 在 内 存 中， 就 将 相应 操作 数 
就 直接 用 了 ， 免 了 取 操 作 数 这 一 过 程 。 操 作 码 有 了 ， 


















































操作 数 也 齐 了 ， 操 作 控 和 
当前 指令 的 大 小 ， 于 
头 ，CPU 便 开始 了 日 复 一 日 的 
以 上 是 CPU 的 工作 原 弄 
起 来 后 再 讲 模式 就 简单 多 了 ， 
3.2.2” 实 模式 下 的 寄存 器 


先 说 一 下 什么 是 寄存 器 。 
寄存 器 是 一 种 物 至 





征 让 
= 





























人 












































区 机 
| 


口 


内 





存储 元 们 
Bb 有 好 多 这 样 的 寄存 器 用 来 给 CPU 存 取 数 所 


制 器 给 运算 单元 下 令 ， 大 





又 指向 了 下 一 条 指令 的 地 址 。 接 着 控 











循环 ， 




















兄弟 们 加 ; 




















先 简短 说 这 一 两 句 ， 和 暂时 离 天 
缓存 也 是 一 项 非常 伟大 的 发 明 ，, 成功 解决 了 速度 不 匹配 设备 之 间 的 数据 传输 ， 并 
H 现 ， 有 效 减少 了 低速 IO 设备 的 访问 频率 ， 从 而 大 
中 处 处 都 是 缓存 的 应 


是 整个 系统 的 瓶颈 ， 缓 存 的 
大 家 对 缓存 一 定 不 会 陌 4 








(1) 浏览 器 内 部 都 有 dns 客户 


和 记 当 出 恬 








该 ip。 如 果 没 有 ， 该 ns 客 

















于 CPU 特别 不 容易 十， 所 以 唯 
E， 无 论 CPU 在 哪 利 


FE， 只 不 过 它 


























F 工 ， 于 是 运算 单元 便 真正 开始 执行 指令 了 。 ip 寄存 器 的 值 被 加 
绰 单 元 又 要 取 下 一 条 指令 了 ， 流 程 回 到 了 本 上 段 开 
一 它 停 下 来 的 条 件 就 是 停电 。 

模式 下 工作 ， 这 一 核心 原理 是 不 变 的 。 有 了 这 一 思想 





























如 


1 ] 











口 






































装 





起 








， 下 一 节 ， 不 见 不 散 。 


它 比 一 般 的 存储 介质 要 快 ， 能 够 跟 上 CPU 的 步伐 ， 所 以 在 CPU 


出 o 
只 


























E， 生 活 


和 




















> 十 


广 下 主题 ， 


们 先 看 看 相对 熟悉 一 些 的 概念 一 一 缓存 。 

在 一 般 情况 下 ，IO 
晶 度 地 提升 了 速度 。 

和。 比如 浏览 器 在 请 求 一 个 域名 ip 时 。 




































































站 





Sk 








2 而 7 











Et 要 查找 自己 


Et 查询 本 地 dns 缓存 中 是 否 有 该 域名 的 ip， 如 果 有 就 直接 去 访问 
机 所 设置 的 dns 服务 器 ， 然 后 去 该 dns 服务 器 去 查询 ip。 















































(2) 如 果 该 dns 服务 器 本 地 缓存 中 有 该 域名 的 A 记录 《域名 与 ip 地 址 的 对 应 记录 )， 则 直接 返回 给 浏 
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dns 服务 器 才 找 到 了 答案 。 于 是 这 路 
的 cache 中 ， 以 备 下 次 再 
(3) 浏览 器 中 的 dns 客户 









































有 相同 域名 查询 时 好 直接 返回 。 
端 得 到 此 域名 的 ip 地 址 后 ， 也 将 该 域名 和 ip 放 在 
































用 户 再 键入 同一 域名 时 ， 避 和 免 再 查 一 次 ip。 


(4) 浏览 器 开始 通过 网 络 用 http 协议 访问 该 ip 地址 的 80 端口 (默认 是 80 端 





口 ， 除 











(5) 一 般 情 


假设 该 ip 对 应 的 设备 是 台 网 关 
缓存 ， 若 有 则 直接 将 该 http 请 求 分 配给 缓存 ! 
求 转 发 给 该 Web 服务 器 处 理 。 
口号 缓存 起 来 ， 以 备 下 次 该 用 户 的 请 求 到 来 时 ， 依 然 给 该 Web 
息 ， 从 而 可 以 将 请 求 再 次 落 到 上 

(6) Web 服务 器 拿 到 请 求 后， 如 果 是 静态 请 求 ， 先 检查 自 
从 硬盘 上 取出 页 面 ， 

















务 器 ， 将 该 http 请 

















况 下 该 记 对 应 的 设备 不 是 最 终 的 Web 服务 器 ， 很 少 有 人 

















(7) cgi 拿 到 请 求 后 ， 先 检查 


向 数据 库 发 出 请 求 。 





(8) 数据 库 也 是 先 检查 EE 






































般 是 硬件 路 由 设备 ), 该 网 关 检查 本 地 缓存 ! 


日 Se 
是 否 


自己 的 缓存 ! 


pe et 


览 器 中 的 dns 客户 端 。 没有 该 域名 的 A 记录 ， 就 通过 递归 的 方式 向 上 询问 其 他 dns 服务 器 ， 也 许 问 到 了 根 
上 所 有 被 询问 过 的 dns 服务 器 ， 都 将 此 域名 对 应 的 A 记录 缓存 到 自己 














， 以 备 下 次 





FE 特别 指定 )。 
巴 Web 服务 器 直接 暴露 在 公 网 。 
相关 Web 服务 器 的 


















































的 Web 服务 器 。 否 则 从 服务 器 列表 
随后 将 该 Web 服务 器 的 ip 地 址 〈 一 般 是 
































个 请 求 的 Web 服务 器 上 。 























中 重新 分 配 一 台 Web 服 




















内 网 地 址 ) 和 端 








服务 器 。 有 的 网 关 可 以 识别 用 户 cookie 信 




















己 的 缓存 中 是 否 有 该 页 面 的 
后 ， 再 存 入 本 地 静态 缓存 中 。 如 果 动 态 请 求 ， 先 交 给 自 


自己 的 缓存 系统 ， 如 memcache， 如 果 绥 在 中 没有 ， 














































































































将 其 返回 




































































己 的 cgi 去 处 理 。 
与 数据 库 建立 连接 ， 


记录 ， 否 则 直接 
















































































己 的 缓存 ， 若 没有 结果 集 ， 则 从 表 中 检索 到 数据 后 返回 ， 












































(9) cgi 拿 到 数据 后 ， 返 匠 
(10)〉 Web 服务 器 拿 到 了 数据 后 ， 将 数据 返回 
(11) 网 关 拿 到 数据 
(12) 如果 浏览 器 发 现 其 中 有 静态 数据 ， 如 医 
您 看 ， 就 这 么 一 个 不 起 眼 








给 Web 服务 器 ， 并 将 数据 缓存 到 memcache 中 。 
给 网 关 。 由 于 是 动态 数据 ， 不 需要 缓存 


















































后 ， 直 接 返 回 给 浏览 



































氏 



































片 ， 也 将 静态 数据 缓存 到 用 户 的 internet 临时 目 

















并 将 结果 集 缓存 起 来 。 


o 





录 。 














的 网 页 请 求 ， 就 经 过 了 12 步 ， 几 乎 每 一 步 都 要 缓存 结果 ， 














存 都 有 一 定 的 失效 时 间 ， 超 过 多 少 秒 后 就 将 缓存 ， 















































中 恰好 有 








需要 的 内 容 ， 这 就 称 为 命 ! 





其 实 


























hit， 否 则 称 为 缺失 mis。 











[的 缓存 ， 我 还 没 说 全 昵 ， 硬 件 之 间 还 有 缓存 呢 ， 比 如 硬盘 控制 器 和 硬盘 …… 














吧 ， 我 是 来 学 操作 系统 的 ， 您 跟 我 说 这 干吗 ， 还 说 了 12 个 步骤 ， 这 与 我 何 干 ? 
前 面 所 说 的 各 种 缓存 ， 是 为 了 引出 CPU 中 的 缓存 。CPU 中 的 一 级 缓存 LI、 二 级 缓存 L2， 它 们 都 是 





SRAM,， 即 


好 啦 不 卖 关 子 啦 ， 也 许 您 
据 的 ， 这 就 是 SRAM 快 
存储 电路 ， 工 作 速度 极 快 ， 是 纳 秒 级 别 的 ， 
我 也 不 是 很 了 解 ， 所 以 只 能 跟 您 说 到 这 了 ， 点 到 为 止 ， 对 于 硬件 背 
还 是 数据 ，CPU 内 部 总 该 有 个 地 方 存放 它们 ， 和 否则 CPU 这 位 巧 妇 





巧 妇 








难为 无 米 之 炊 ， 不 管 是 





吕 


和 


















































的 原 理 》 咱 




















已 人 
引 令 ， 






































连 锅 都 没有 ， 还 怎么 给 大 家 烧 一 桌 好 菜 昵 ? 所 以 ， 寄 存 器 是 给 CPU 处 理 数据 的 场所 。 


























的 记录 置 为 无 效 。 这 其 中 还 有 另外 一 个 术语 ， 如 果 绥 存 


得 ， 打住 


静态 随机 访问 存储 器 , 它 是 最 快 的 存储 器 啦 。 也 许 您 又 说 :“ 是 啊 , 这 个 我 知道 , 那 又 怎么 样 ? ” 
听 说 L1、L2、SRAM， 但 您 可 能 不 知道 的 是 SRAM 是 用 寄存 器 来 存 





嵌 数 


的 原因 。 而 寄存 器 为 什么 快 呢 ? 原因 是 寄存 器 是 使 用 触发 器 实现 的 ， 这 也 是 一 种 
您 想 寄 存 器 能 不 快 吗 ， 这 和 CPU 的 速度 是 一 个 级 别 啦 。 硬 件 





门 晴 虹 点 水 即 可 。 


到 这 里 ， 大 家 心里 应 该 对 寄存 器 有 个 感性 认识 了 ， 这 样 学 起 来 ， 似 乎 看 得 见 摸 得 着 了 。 
CPU 中 的 寄存 器 大 致 上 分 为 两 大 类 。 








一 类 是 其 内 部 使 用 的 ， 对 程序 员 不 可 见 。“ 是 否 可 见 ” 不 是 说 寄存 








日 台 已 人 力 
是 否 能 看 和 


























否 能 使 用 。CPU 内 部 有 














会 有 
法 使 
任务 寄存 器 TR、 























它们 ， 比 如 全 


ve 二 
什 


己 的 运行 机 制 ， 是 按照 某 个 预定 框架 进行 的 ， 为 了 CPU 能 够 








其 自 






































E 





见 ， 是 指 程序 员 是 
运行 下 去 ， 必 然 
些 寄存 器 来 做 数据 的 支撑 ， 给 CPU 内 部 的 数据 提供 存储 空间 。 这 一 部 分 对 外 是 不 可 见 的 ， 我 们 无 








苗 述 符 表 寄 存 器 GDTR、' 











局 






















































































寄存 器 。 








断 描 述 符 表 寄 存 器 IDTR、 局 部 描述 符 表 寄 存 器 LDTR、 
制 寄存 器 CR0~~3、 指 令 指针 寄存 器 PP、 标志 寄存 器 flags、 调 试 寄存 器 DR0~7。 
另 一 类 是 对 程序 员 可 见 的 寄存 器 。 我 们 进行 汇编 语言 程序 设计 时 ， 能 够 直接 操作 


器 ， 如 有 段 寄 存 器 、 通 | 


的 就 是 这 些 寄存 


























虽说 第 


类 的 程序 是 不 可 见 寄存 器 , 我 们 没 办 法 直 














接 使 用 , 但 它们 中 的 一 部 分 还 得 由 














们 给 初始 化 呢 。 
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比如 全 局 描述 符 表 寄 存 器 GDTR， 以 后 咱们 还 要 通过 lgdt 指令 为 其 指定 全 局 描述 符 表 的 地 址 及 偏 移 
折 描 述 符 表 寄 存 器 IDTR， 咱 们 也 是 要 通过 lidt 指令 为 其 指定 中 断 描述 符 表 的 地 址 。 而 局 部 描 
述 符 表 寄存 器 LDTR， 可 以 用 lgdt 
苗 述 符 表 1dt)。 对 于 任务 寄存 器 TR， 
我 们 也 有 办 法 设置 它 ， 系 统 

























































































外 令 为 其 指定 局 部 描述 符 表 1dt 但 我 们 效仿 了 现代 操作 系统 ， 未 用 局 部 
我 们 也 要 用 ltr 指令 为 其 指定 一 个 任务 状态 段 tss。 对 于 flags 寄存 器 ， 


















































提供 了 pushf 和 popf 指令 ， 分 别 用 于 将 flags 寄存 器 的 内 容 压 入 栈 ， 将 栈 中 内 容 




















弹 到 flags 寄存 器 。 额 外 说 一 句 ，1ldt 和 tss 都 位 于 gdt 中 。 这 些 方面 的 内 容 咱们 在 学 习 保护 模式 后 都 会 讲 到 。 





内 偏 移 + 


一 节 中 也 是 讲 内 存 分 段 的 理由 。 您 合理 安排 阅读 。 
现在 假设 您 已 经 了 解 分 段 机 制 啦 ， 上 面 提 到 的 “ 段 基 址 : 段 内 偏 移 地 址 ”中 的 段 基 址 ， 就 是 用 段 寄存 


在 实 模式 下 ， 默 认 用 到 
段 寄 存 器 是 做 喻 的 昵 ? 


也 址 ”的 形式 来 访问 内 存 的 ， 





的 寄存 器 都 是 16 位 宽 的 ， 咱 们 说 说 具体 的 寄存 器 吧 。 
说 到 段 寄 存 器 存在 的 理由 ， 得 先 说 到 内 存 访 问 机 制 。CPU 是 用 “ 段 基 址 : 段 



















































































如 果 您 对 此 访 存 形式 不 了 解 ， 前 面 第 0 章 中 有 解释 过 分 段 ， 而 且 在 下 










































































器 来 存储 的 ， 段 寄存 器 的 作用 就 是 指定 一 片 内 存 的 起 始 地 址 ， 故 也 称 为 段 基 址 寄存 器 。 尽 管 段 基 址 在 实 模 
式 下 要 乘 以 16, 在 保护 模式 下 只 是 个 选择 子 (保护 模式 中 会 讲 ), 但 其 作用 就 是 指定 一 片 内 存 的 起 始 地 址 。 





而 段 内 偏 移 地 址 ， 顾 名 思 义 ， 仅 仅 相 对 于 此 起 始 地 址 的 偏 移 量 。 
















































































访问 内 存 ， 是 要 通过 地 址 总 线 ， 给 地 址 总 线 一 个 数字 (也 就 是 地 址 )， 地 址 总 线 就 能 找到 以 该 数字 为 地 址 的 


内 存 。 可 
合适 ， 也 更 容易 。 如 果 用 内 存 来 存储 内 存 地 址 ， 首 先 访 问 该 内 存 就 是 个 问题 ,该 内 存 的 地 址 是 什么 ?这 就 跟 先 有 
鸡 还 是 先 有 和 蛋 的 本 源 问 题 一 样 了 。 您 可 能 会 有 疑问 ， 地 址 也 只 是 个 数字 ， 把 数字 存放 在 内 存 中 有 什么 不 行 的 ? 我 








是 这 个 数字 是 哪 来 的 呢 ? 对 了 

















首次 访问 内 存 之 前 , 其 内 存 地 址 肯定 是 要 放 在 与 内 存 不 同 的 存储 介质 中 更 

































































这 里 所 说 的 并 不 是 内 存 寻 址 ,您 说 的 这 个 数字 只 是 该 内 存单 元 中 的 内 容 ， 这 是 内 存 寻 址 ， 前 提 是 您 已 经 给 地 址 总 











线 提交 








举 个 例子 ， 我 想 ) 














保存 该 数字 的 内 存 地址。 我 说 的 是 提交 给 地 址 总 线 的 地 址 是 从 哪里 获得 的 。 不 知道 我 说 清楚 了 没有 , 再 
j 木 材 做 一 个 船 模 ， 我 不 可 能 还 用 木质 工具 去 加 工 它 ， 只 能 用 铁器 等 比 木 更 硬 的 材料 通过 削 、 磨 








































































































等 方式 将 它 加 工 出 来 。 换 在 计算 机 中 也 一 样 ， 访 问 内 存 就 要 提供 地 址 ， 初 次 访问 内 存 时 ， 该 地 址 要 么 用 立即 数 ， 





















































要 么 存储 在 某 个 存储 器 中 能 让 CPU 取出 来 再 访问 内 存 ， 肯 定 不 能 用 内 存 本 身 来 存 。 由 于 寄存 器 比 内 存 更 高 级 ， 
CPU 更 能 接受 ， 所 以 就 用 寄存 器 来 存储 内 存 地 址 。 由 于 要 指定 的 是 内 存 中 的 一 段 区 域 的 起 始 地 址 ， 所 以 称 之 为 
段 基 址 寄存 器 ， 也 称 段 寄存 器 ， 无 论 是 在 实 模式 下 ， 还 是 保护 模式 下 ， 它 们 都 是 16 位 宽 。 



























































图 3-3 所 示 就 是 实 模式 下 的 段 寄 存 器 。 段 寄存 器 (sreg) 都 是 16 位 宽 


代码 段 简 | 



































件 中 ， 也 可 以 是 被 加 载 后 











用 来 指向 内 存 中 这 段 指令 























数 





j 言 之 就 是 把 所 有 指令 都 连续 排放 在 一 起 ， 形 成 了 一 个 全 部 都 是 指 
令 的 区 域 ， 里 面 存储 的 是 指令 的 操作 码 及 寻 址 方式 等 。 该 区 域 可 以 在 硬盘 上 的 文 
的 内 存 中 ， 总 之 是 一 段 指 令 区域 。 它 们 内 部 都 是 紧凑 挨 
着 的 ， 内 容 形 式 完全 一 样 ， 只 是 存放 的 介质 不 一 样 而 已 。 代 码 段 寄存 器 CS 就 是 
区 域 的 起 始 地 址 。 有 具体 程序 分 段 的 解释 ， 可 见 第 0 章 。 



























































居 段 和 代码 段 类 似 ， 只 是 这 段 区 域 中 的 内 容 不 是 指令 ， 而 是 纯粹 的 数 “图 3-3 实 模式 下 的 段 寄存 器 
































此 数据 区 域 的 起 始 地 址 。 
栈 段 是 在 内 存 中 ,硬盘 文件 中 可 真 没 有 。 一 般 的 栈 段 是 由 操作 系统 分 配 指 定 的 ， 所 以 是 属于 被 加 载 到 
内 存 后 才 有 的 。 本 章 后 面 还 会 讲 栈 ， 
向 此 区 域 的 起 始 地 址 。 
代码 段 、 数 据 段 、 栈 段 寄存 器 从 名 字 上 就 较 容 易 理 解 ， 那 三 个 附加 段 寄 存 器 是 干吗 的 ?” 其 实 就 是 多 给 


大 家 提供 几 个 段 寄 存 器 


























据 ， 也 就 是 说 里 面 存 储 的 是 程序 运行 所 需要 的 数据 ， 属 于 指令 的 操作 数 。 数 据 段 寄 人 存 器 DS 便 是 用 来 指向 




























































































这 里 大 家 就 先 当 它 是 一 段 内 存 区 域 就 好 。 栈 段 寄 存 器 SS 就 是 用 来 指 
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说 明 的 是 在 16 位 CPU 中 ， 














CPU 中 增加 的 。 我 们 使 
GS 寄存 器 。32 位 的 CPU 






























































j 而 已 ， 多 几 个 寄存 器 用 不 是 更 好 吗 ， 省 得 紧 巴 巴 的 ， 纯 粹 是 为 了 方便 大 家 。 





只 有 一 个 附加 段 寄 存 器 





ES。 而 FS 和 GS 附加 段 寄 存 器 是 在 32 位 











的 是 32 位 CPU， 并 不 是 说 32 位 CPU 在 实 模 式 下 的 16 位 环境 中 就 不 能 用 FS 和 




















多 了 个 可 用 的 资源 。 








容 16 位 CPU 的 特性 ， 就 像 一 个 小 学 生 也 可 以 穿 中 学 生 的 衣服 一 样 ， 无 非 是 




















IP 寄存 器 是 不 可 见 寄存 器 ，CS 寄存 器 是 可 见 寄存 器 。 这 两 个 配合 在 一 起 后 就 是 CPU 的 罗盘 ,它们 是 


74 





和 




















给 CPU 导航 用 的 。CPU 执行 到 何 处 ， 完 成 要 听 这 两 个 寄存 器 的 安排 。 为 什么 要 用 两 个 寄存 器 ? 
是 在 内 存 中 ， 访 问 内 存 就 要 用 “ 段 : 段 内 偏 移 ” 的 形式 ， 所 以 CS 寄存 器 用 来 存 代 码 段 段 基 址 ， 
用 来 存储 代码 段 段 内 偏 移 地 址 ， 同 CS 寄存 器 一 样 都 是 16 位 宽 。 































































































因为 指令 
IP 寄存 器 


其 实 这 两 个 寄存 器 没什么 神奇 的 ， 并 不 是 它们 真 地 决定 了 CPU 的 航向 ， 只 是 CPU 的 航向 被 存 入 了 这 


两 个 寄存 器 之 中 。 之 前 说 过 啦 ， 指 令 在 逻辑 上 是 紧凑 的 ， 这 样 CPU 便 能 连续 不 断 地 执行 下 去 ， 天 荡 地 老 ， 
直到 断 电 。CPU 执行 完 一 条 指令 后 ， 顺 便 就 把 下 一 条 指令 的 内 存 地 址 读 进来 。 注 意 看 ， 读 入 的 是 下 一 条 




















外 令 的 内 存 地 址 ， 这 有 两 个 关键 字 , 一 个 是 内 存 ， 另 一 个 是 地 址 。 刚 刚 说 过 啦 ， 是 内 存 就 应 该 










































































j“ 段 基 址 ; 


段 内 偏 移 地 址 ”的 机 制 来 访问 ， 是 地 址 就 该 有 地 方 存 放 。 您 想 ， 即 使 是 洗 全 ， 沫 也 得 先 找 个 盘子 或 盆 之 类 
在 x86 体系 架构 中 ， 本 着 先 满足 “ 段 基 址 : 段 内 偏 移 ” 的 形式 ， 这 个 地 
址 就 分 开 存 到 了 代码 段 CS 寄存 器 和 指令 指针 IP 寄存 器 。 在 执行 当前 指令 的 同时 ， 在 不 跨 段 的 情况 下 ， 

CPU 以 “当前 IP 寄存 器 中 的 值 + 当前 执行 指令 的 机 器 码 长 度 ” 的 和 作为 新 的 代码 段 内 偏 移 地 址 ， 将 其 存 
入 IP 寄存 器 ， 再 到 该 新 地 址 处 读 取 指 令 并 执行 。 如 果 下 一 条 指令 需要 跨 段 访问 ， 还 要 加 载 新 的 段 基 址 到 

















的 器 具 盛 着 再 拿 到 水 龙头 下 冲洗 。 








CS 寄存 器 。 此 后 ， 继 续 重 复 以 上 “ 取 址 、 执 行 ”的 循环 。 










































































图 3-4 所 示 是 实 模 式 下 的 I 了 P 寄存 器 。 









































flags 寄存 器 是 计算 机 的 窗口 ， 展示 了 CPU 内 部 各 项 设置 、 指 标 。 任何 
































































































































个 指令 的 执行 、 其 执行 过 程 的 细节 、 

















对 计算 机 造成 了 哪些 影响 ， 都 在 flags 寄存 器 中 通过 一 些 标志 位 反映 出 来 。 有些 指 令 需 要 满足 某 些 条 件 才能 执行 ， 
它们 的 条 件 是 判断 上 一 条 指令 的 执行 过 程 。 所 以 标志 寄存 器 中 的 标志 位 就 成 了 这 些 指令 所 需要 满足 的 条 件 。 实 模 
式 下 的 flags 寄存 器 是 16 位 的 ， 如 图 3-5 所 示 。 后 面 专门 拿 出 一 节 讲 flags 寄存 器 ， 这 里 先 一带 而 过 。 
了 寄存 器 是 16 位 宽 flags 寄 存 器 是 16 位 宽 
15 0 15 0 
4 图 3-4 ” 实 模 式 下 的 IP 寄存 器 4 图 3-5” 实 模式 下 的 flags 寄存 器 























下 面 说 说 通用 寄存 器 。 无 论 是 实 模式 ， 还 是 保护 模式 ， 通 用 寄存 器 有 8 个 ， 分 别 是 AX、BX、CX、 
DX、SI、DI、BP、SP， 它 们 的 名 称 及 关系 如 图 3-6 所 示 。 15 7 0 位 宽 


拿 AX 寄存 器 举例 ,根据 图 3-6 可 知 ，AX 寄存 器 是 由 AH 寄存 器 和 AL 
寄存 器 组 成 的 ， 它 们 都 是 8 位 寄存 器 ，AX 寄存 器 的 低 8 位 ， 即 0~7 位 ， 是 


AL 寄存 器 。 高 8 位 ， 即 8 一 15 位 


计算 和 32 位 保护 模式 等 )，16 位 AX 寄存 器 不 够 用 了 ， 将 其 扩展 (Extend) 
为 32 位 , 在 AX 原 有 的 基础 上 ,增加 16 位 作为 高 16 位 便 是 扩展 的 AX， 即 














EAX。 所 以 EAX 归根 结 底 也 是 


















































， 是 AH 寄存 器 。 由 于 某 种 原因 (如 数学 












































AL、AH 组 成 的 ，AL 或 AH 值 变 了 直接 





















































影响 EAX。 这 里 提 及 了 寄存 器 eax 

















如 8086。 


但 依然 可 以 用 32 位 寄存 器 ,因为 我 们 所 i 


Ay TD 、 | 二 实 模式 下 通用 寄存 器 
的 原因 是 在 实 模式 下 虽然 操作 数 是 16 位， “图 3-6 实 异 式 下 通用 寄存 器 


























以 上 的 这 8 个 寄存 器 实际 上 是 通用 寄存 器 ， 通 用 是 说 每 个 寄存 器 的 功能 不 单一 ， 可 以 有 多 利 




































































的 是 32 位 CPU 在 实 模式 下 的 工作 状态 , 并 不 是 纯粹 的 16 位 CPU， 





用途 ,不 


像 段 寄 存 器 SS 那样 只 能 用 来 放 栈 段 基 址 ， 通 用 寄存 器 可 以 用 来 保存 任何 数据 ， 包 括 地 址 《当然 ， 地 址 也 








是 一 串 数 字 ， 还 是 数据 )。 
























































虽说 通用 ， 但 还 是 约定 了 它们 的 惯用 法 ， 除 了 通用 的 用 途 外 每 个 寄存 器 肩负 特定 的 功用 。 











般 情 况 下 ，cx 寄存 器 用 作 循 环 的 次 数控 制 ，bx 寄存 器 用 于 存储 起 始 地 址 。 这 是 大 家 约定 




































































西 ， 不 这 样 做 也 可 以 ， 用 其 他 通用 寄存 器 也 能 完成 任务 。 不 过 还 是 有 个 公共 的 约定 更 好 ， 


通用 的 函数 ， 在 为 其 传递 参数 时 会 方便 很 多 。 比 如 BIOS 或 DOS 中 断 调用 ， 一 般 情况 下 ，cx 还 就 是 














用 作 循 环 次 数 的 控制 





有 了 这 村 
































指令 已 经 固定 用 一 些 特定 的 寄存 器 作为 参数 了 ， 比 如 esi 寄存 器 作为 很 多 有 关 数 据 复 制 指 














址 ，edi 作为 目的 地 址 。 

















fF 公共 的 认 知 ， 函 数 在 使 用 上 会 方便 ， 且 显得 轻松 很 多 。 男 






































简短 介绍 下 各 通用 寄存 器 特定 的 功能 ， 见 表 3-2。 








比如 
谷 成 的 东 
这 样 一 些 








外 ， 一 些 
令 的 源 地 





75 




































































































































































































































































































































































































































































表 3-2 通用 寄存 器 介绍 

寡 存 器 助 记名 称 功能 描述 

ax 累加 器 (accumulator) 使 用 频 度 最 高 ， 常 用 于 算术 运算 、 逻 辑 运算 、 保 存 与 外 设 输入 输出 的 数据 

bx 基 址 寄存 器 (base) 常用 来 存储 内 存 地 址 ， 用 此 地 址 作为 基 址 ， 用 来 遍历 一 片 内 存 区 域 

cx 计数 器 (counter) 顾名思义 ， 计 数 器 的 作用 就 是 计数 ， 所 以 常用 于 循环 指令 中 的 循环 次 数 

dx 数据 寄存 器 (data) 可 用 于 存放 数据 ， 通 常情 况 下 只 用 于 保存 外 设 控制 器 的 端口 号 地 址 

ee 

di 的 变 址 寄存 器 (destination index) | 和 si 一样 ， 常 用 于 字符 串 操 作 。 但 di 是 用 于 数据 的 目的 地 址 ， 即 数据 被 传送 到 哪里 

sp 栈 指针 寄存 器 (stack pointer) pt > es 随 着 栈 中 数据 的 进出 ，push 和 pop 这 两 个 对 栈 操 
访问 栈 有 两 种 方式 ， 一 种 是 用 push 和 pop 指令 操作 栈 ，sp 指针 的 值 会 自动 更 新 ， 但 我 
们 只 能 获取 栈 项 sp 指针 指向 的 数据 。 很 多 时 候 ， 我 们 需要 读 写 在 栈 底 和 栈 项 之 间 的 数 



























































bp 基 址 指针 〈base pointer) 据 ， 处 理 器 为 了 让 开发 人 员 方 便 控制 栈 中 数据 ， 还 提供 了 把 栈 当 成 数据 段 来 访问 的 方 
式 ， 即 提供 了 寄存 器 bp， 所 以 bp 默认 的 段 寄存 器 就 是 SS， 可 通过 SS: bp 的 方式 把 栈 
当成 普通 的 数据 段 来 访问 ， 只 不 过 bp 不 像 sp 那样 随 push、pop 自动 改变 






















































































3.2.3” 实 模式 下 内 存 分 段 由 来 


CPU 中 本 来 是 没有 实 模式 这 一 称呼 的 ， 是 因为 有 了 保护 模式 后 ， 为 了 与 老 的 模式 区 别 开 来 ， 所 以 称 
老 的 模式 为 实 模式 。 这 情况 就 像 所 有 同学 坐 在 同一 个 教室 里 ， 本 来 没有 老 同 学 这 一 概念 ， 但 某 天 老师 领 着 
一 个 陌生 人 进入 教室 并 和 大 家 宣布 :“ 这 是 新 转 到 我 们 班 的 韩 梅 梅 ， 大 家 欢迎 新 同学 ”。 得 ， 无 形 之 中 ， 大 
伙 儿 就 成 了 老 同学 。 
实 模 式 的 “ 实 ” 体 现在 : 程序 中 用 到 的 地 址 都 是 真实 的 物理 地 址 ,“ 段 基 址 : 段 内 偏 移 ”产生 的 逻辑 
地 址 就 是 物理 地 址 ， 也 就 是 程序 员 看 到 的 完全 是 真实 的 内 存 。 

不 过 要 说 实 模式 ， 咱 们 还 得 从 CPU 的 发 展 说 起 ， 任 何事 物 发 展 到 今天 ， 都 有 一 段 “ 合 理 ” 的 过 程 ， 
了 解 这 一 过 程 是 怎么 来 的 ， 有 助 于 理解 它 今天 的 形态 。 

不 知道 各 位 同学 当初 学 习 汇编 语言 时 有 没有 这 样 疑 问 :“ 老 师 都 是 拿 8086 型 号 的 CPU 举例 ， 为 什么 不 拿 最 
新 型 号 呢 ? 用 那么 古老 的 CPU 讲解 知识 ， 是 否 已 经 落伍 太 久 了 ， 我 们 学 习 的 知识 到 社会 上 能 用 吗 ? ”我 记得 当 
初学 习 汇编 时 ， 那 时 的 CPU 都 是 奔腾 2.8 了 。 我 带 着 这 样 的 疑问 请 教 了 老师 ， 老 师 回 答 我 说 :“8086 是 Intel 历 
史上 第 一 个 x86 的 CPU， 也 就 是 自 那 以 后 的 CPU 称 为 286、386、486、586…… 即 使 是 现在 的 奔腾 也 属于 x86 
体系 ， 道理 是 不 变 的 ， 而 且 ， 用 最 简单 的 8086 CPU 学 习 ， 这 才 更 容易 理解 和 看 透 CPU 运行 机 制 .” 一 番 话 彻底 
打消 了 我 的 疑虑 ， 自 那 以 后 我 才 理 解 x86 中 的 x 原来 是 个 变量 ， 它 指 代 Intel 所 有 86 系列 的 产品 。 

在 8086 之 前 的 CPU 是 什么 样 呢 ? 为 什么 8086 就 可 以 称 为 CPU 界 的 里 程 碑 呢 ? 原因 是 这 样 的 , 在 它 2 
前 的 CPU 前 辈 们 ， 对 内 存 的 访问 比 8086 还 要 “ 实 诚 ” 它们 没有 段 的 概念 ， 程 序 中 要 访问 内 存 ， 需 要 把 地 
址 写 死 ， 也 就 是 所 谓 的 “ 硬 编码 ” 这 其 实 是 很 麻烦 的 ， 首 先 程序 无 法 重 定位 ， 必 须 加 载 到 内 存 中 国定 的 位 
置 ， 如 果 在 此 位 置 有 其 他 程序 在 用 ， 得 ， 您 先 睡 会 ， 等 它 运行 完成 后 我 叫 您 。 您 看 ， 得 等 人 家 运行 完了 腾 出 
内 存 后 才 轮 得 到 自己 ， 可 见 程序 对 地 址 的 依赖 性 之 强 。 可 用 内 存 很 多 ,但 却 因为 某 一 个 字 节 的 内 存 被 占用 而 
让 后 来 的 程序 等 很 入， 这 是 很 平常 的 事 。 有 些 开 发 人 员 等 不 及 了 ,干脆 把 程序 中 的 地 址 改 成 别 的 吧 ， 重 新 编 
译 后 发 现 还 是 有 某 个 地 址 被 占用 ， 还 是 没 法 上 CPU 运行 ， 怎 么 办 ? 再 改 地 址 …… 所 以 我 估计 那 时 的 开发 人 
员 脾 气 都 会 很 差 ， 这 人 脾气 差 就 容易 伤 肝 ， 肝 火 一 旺 就 会 两 受 斑 白 ， 所 以 IT 工程 师 还 是 很 值得 体恤 的 。 
看 着 越 来 越 多 的 程序 员 两 惨 斑 白 ，Itel 早期 的 工程 师 难 以 承受 内 心 的 自 责 ,不 顾 自己 的 满 头 白 发 ， 熬 
了 无 数 通宵 之 后 ， 终 于 发 明了 “ 段 ” 即 CPU 访问 内 存 用 “ 段 + 偏 移 ” 的 形式 。 这 就 是 前 面 曾 经 讲解 过 访 
问 内 存 用 “ 段 基 址 : 段 内 偏 移 地 址 ”的 策略 ， 它 就 是 首次 在 8086 上 出 现 的 。 自 那 之 后 的 CPU 都 是 用 这 类 
思想 访问 内 存 ， 只 是 在 形式 上 有 小 改动 ， 难 怪 8086 如 此 极 负 盛名 了 。 为 了 支持 段 机 制 ，CPU 中 新 增 了 上段 
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寄存 器 ， 如 cs、ds、es 等 。 

8086 的 地 址 总 线 是 20 位 宽 ， 也 就 是 其 寻 址 范围 是 2 的 20 次 方 =1MB。 但 其 内 部 寄存 器 都 是 16 位 的 ， 
若 用 单一 寄存 器 来 寻 址 的 话 ， 只 能 访问 到 2 的 16 次 方 等 于 64KB 的 空间 。 
由 于 地 址 线 位 宽 和 寄存 器 位 宽 是 没有 必然 联系 的 ， 所 以 大 家 不 要 觉得 为 什么 寄存 器 不 是 20 位 的 ? 这 
样 通过 寄存 器 寻 址 就 能 访问 到 1MB 空间 了 ， 显 得 多 “配套 ”。 
例如 8086 的 多 种 寻 址 方式 中 ， 有 一 种 是 基 址 寻 址 ， 这 是 用 基 址 寄存 器 bx 或 bp 来 提供 偏 移 地 址 的 。 
例如 mov [bx], 0x5; 这 条 指令 便 是 将 立即 数 0x5 存 入 ds: bx 指向 的 内 存 。 

大 家 看 ，bx 寄存 器 是 16 位 的 ， 它 最 大 只 能 表示 0xFFFF 的 地 址 ， 也 就 是 单一 的 一 个 寄存 器 无 法 表示 
20 位 的 地 址 空间 : 1MB。 也 许 有 人 会 说 ， 段 基 址 和 段 内 偏 移 地 址 都 搞 到 最 大 ， 都 为 0xFFFF。 对 不 起 ， 方 
案 不 成 立 ， 首 先 说 会 溢出 ， 结 果 是 0xFFFE， 地 址 不 增 反 小 了 个 1。 即 使 不 溢出 的 话 ， 其 结果 也 只 是 由 16 
位 变 成 了 17 位 ， 即 两 个 n 位 的 数字 无 论 多 大 ， 其 相 加 的 结果 也 超 不 过 n+l 位 ， 道 理 很 简单 ， 即 使 两 个 数 
都 是 n 位 能 表示 的 最 大 数 ， 两 个 相同 的 数 相 加 ， 相 当 于 乘 以 2， 也 就 是 数值 上 等 于 左 移 一 位 而 已 。 依 然 无 
法 访问 20 位 的 地 址 空间 。 也 许 有 人 又 有 好 建议 了 : CPU 的 寻 址 方式 又 不 是 仅仅 这 一 种 ， 上 面 的 限制 是 因 
为 寄存 器 是 16 位 ， 只 要 不 全 部 通过 寄存 器 寻 址 不 就 行 了 吗 ? 段 寄存 器 也 是 寄存 器 ， 同 样 也 是 16 位 ， 既 然 
它 必须 得 用 ， 那 就 在 偏 移 地 址 上 下 功夫 ， 不 要 把 偏 移 地 址 写 在 寄存 器 里 了 ， 把 它 直 接 写成 20 位 立即 数 不 
就 行 啦 ? 例如 mov ax, [0x12345]， 这 样 最 终 的 地 址 是 ds+0x12345， 肯 定 是 20 位 ， 解 决 啦 。 不 错 ， 这 种 是 
直接 寻 址 方式 ， 至 少 道理 上 讲 得 通 ， 这 是 通过 编程 技巧 来 突破 这 一 瓶颈 ， 能 想到 这 一 点 我 觉得 非常 nice。 
晶 是 作为 一 个 严谨 的 CU， 既然 宣称 支持 通过 寄存 器 来 寻 址 ， 那 就 要 能 够 自圆其说 才 行 ， 不 能 靠 程 序 员 
的 软 实力 来 克服 CPU 自身 的 缺陷 。 于 是 ， 一 个 大 胆 的 想法 出 现 了 。 
为 了 让 16 位 的 寄存 器 寻 址 能 够 访问 20 位 的 地 址 空间 (注意 , 我 这 里 说 的 是 通过 寄存 器 寻 址 ， 因 为 只 有 
通过 16 位 的 寄存 器 去 寻 址 才 会 受到 16 位 的 限制 )，CPU 工程 师 定 位 到 根本 瓶颈 是 在 段 寄存 器 ， 它 要 是 能 提 
供 20 位 的 段 地 址 ， 哪怕 偏 移 地 址 是 1 也 照样 可 以 访问 到 内 存 的 各 个 角落 。 于 是 ， 通 过 先 把 16 位 的 段 基 址 左 
移 4 位 后 变 成 20 位 ， 再 加 段 内 偏 移 地 址 ， 这 样 便 形 成 了 20 位 地 址 ， 只 要 保证 了 段 基 址 是 20 位 的 ， 偏 移 地 
址 是 多 少 位 都 不 关心 了 ， 从 而 突破 了 16 位 寄存 器 作为 偏 移 地 址 而 无 法 访问 1MB 空间 的 限制 。 
有 了 20 位 地 址 便 能 访问 到 20 位 的 空间 ， 虽 然 解决 了 一 个 大 问题 ， 但 是 引入 了 一 个 小 问题 。 

还 拿 0xFFFF 来 说 ， 现 在 能 访问 的 最 大 的 地 址 是 0xFFFF: 0xFFFF， 经 过 左 移 段 基 址 4 位 后 得 到 的 
大 地 址 是 : 0xFFFF*16+0xFFFF=0xFFFFO+0xFFFF 

=0xFFFFF+O0xFFFO0=1M+16*4KB-16-1=0xl0FFEF。 这 公式 有 点 晤 是 吗 ? 其 实 最 后 结果 0x10FFEF 是 最 如 
的 ， 前 面 的 推算 就 是 想 告 诉 大 家 ， 按 照 新 方法 获取 地 址 ， 可 以 得 到 的 最 大 地 址 是 1MB+64KB-16 字 节 
为 这 是 空间 范围 ， 所 以 要 减 去 1 得 到 地 址 范围 。 

大 家 看 到 了 ， 当 初 费 了 好 大 周折 才 搞 定 了 能 够 访问 20 位 地 址 空间 ， 现 在 反而 有 点 过 了 ， 过 头 的 原因 
是 段 基 址 为 0xFFFF0， 偏 移 地 址 应 该 小 于 等 于 F 就 对 啦 ， 而 这 个 偏 移 地 址 却 是 0xFFFF， 超 出 了 0xFFF0 
的 空间 ， 也 就 是 多 出 来 64K-16 字 节 ， 这 部 分 内 存 就 是 传说 中 的 高 端 内 存 区 (High Memory Area，HMA )。 
可 是 这 部 分 内 存 不 存在 ， 怎 么 处 理 呢 ? 

答案 说 出 来 吓 你 一 跳 : 不 用 处 理 。 您 想 ，8086 一 共 就 20 条 地 址 ， 地 
址 线 是 从 0 开始 的 ， 即 A0 一 Al19， 所 以 其 地 址 空间 才 是 1MB 的 啊 。 内 存 
地 址 0xFFFFF+ 是 要 用 到 A20 地 址 线 ， 可 是 8086 它 没有 啊 ， 只 能 接收 20 
位 长 的 地 址 。 所 以 由 于 超过 了 20 位 而 产生 的 进位 ， 就 给 丢掉 了 。 其 作用 
相当 于 把 地 址 对 1MB 取 模 了 。 举 例 ， 如 0xFFFFF+2， 理 论 上 是 变 成 了 
0x100001。 但 由 于 只 能 容纳 20 位 长 的 数据 ， 所 以 最 终结 果 是 0x00001。 这 
是 地 址 回 卷 的 效果 ， 即 超过 最 大 范围 后 ， 从 0 重新 开始 计数 。 回 卷 英文 称 
为 wrap-around， 示 意图 如 图 3-7 所 示 。 a 本 

这 就 引出 了 从 实 模式 到 保护 模式 要 打开 A20 地 址 线 的 问题 ,不 过 这 部 “图 3 ” 实 模式 下 高 端 内存 同 关 
分 在 讲 保护 模式 时 咱们 再 说 。 
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3.2.4” 实 模式 下 CPU 内 存 寻 址 方式 


上 一 节 跟 大 家 讲述 了 “ 段 基 址 + 段 内 偏 移 地 址 ”的 由 来 ,在 实 模式 下 CPU 访问 数据 将 按照 此 方法 来 进 
行 。 没 有 规矩 不 成 方 事 ，CPU 访问 数据 也 得 有 个 章法 可 循 。 其 实 一 切 所 谓 的 格式 都 是 一 种 “协议 ””“ 约 
定 ” “约定 ”的 原因 是 为 了 省 事 ， 让 大 家 共同 按照 某 种 约定 行事 ， 这 样 服务 的 提供 方 就 不 必 为 满足 各 种 各 
样 需求 方 而 煞费苦心 。 为 了 CPU 设计 更 容易 ，CPU 访问 数据 的 形式 也 需要 提前 “约定 ”好 ， 这 就 是 所 谓 
的 寻 址 方式 。 下 面 把 8086 的 寻 址 模式 和 大 家 说 说 。 

寻 址 方式 ， 从 大 方向 来 看 可 以 分 为 三 大 类 : 

(1) 寄存 器 寻 址 ; 

(2) 立即 数 寻 址 ; 

(3) 内 存 寻 址 。 
在 第 三 种 内 存 寻 址 中 又 分 为 : 

(1) 直接 寻 址 ; 

(2) 基 址 寻 址 ; 

(3) 变 址 寻 址 ; 

(4) 基 址 变 址 寻 址 。 

要 讲 寻 址 方式 ， 得 先知 道 什 么 是 寻 址 。 

从 名 字 上 看 , 寻 址 就 是 寻找 地 址 , 寻找 谁 的 地 址 ? CPU 眼 里 只 有 二 进 制 数 , 所 以 这 是 CPU 在 寻找 “ 数 ” 
的 地 址 。 这 个 “ 数 ” 可 以 源 操作 数 ， 也 可 以 是 目的 操作 数 ( 顺 便 提 一 句 ，Intel 汇编 语言 语法 是 “指令 目的 
操作 数 ， 源 操作 数 ”)， 简 而 言 之 ， 寻 址 就 是 找到 “ 数 ” 的 所 在 地 ， 从 哪 来 ， 往 哪 去 。 

。 寄存 器 寻 址 

最 直接 的 寻 址 方式 就 是 寄存 器 寻 址 ， 它 是 指 “ 数 ”在 寄存 器 中 ， 直 接 从 寄存 器 中 拿 数 据 就 行 了 。 例 如 
下 面 用 mul 指令 实现 0x10*0x9。 





































































































































































































































































































mov ax, 0x10 
mov dx, 0x9 
mul dx 


以 上 三 条 指令 都 是 寄存 器 寻 址 。 

第 一 条 命令 是 将 0x10 存 入 ax 寄存 器 ， 第 二 条 命令 是 将 0x9 存 入 dx， 第 三 条 指令 是 求 ax 和 dx 的 乘积 ， 
乘积 的 高 16 位 在 dx 寄存 器 ， 低 16 位 在 ax 寄存 器 。 只 要 牵扯 到 寄存 器 的 操作 ， 无论 其 是 源 操作 数 ， 还 是 
的 操作 数 ， 都 是 寄存 器 寻 址 。 上 面 的 第 一 、 二 条 指令 , 它们 的 源 操作 数 都 是 立即 数 ， 所 以 也 属于 立即 数 寻 址 。 

e 立即 数 寻 址 

什么 是 立即 数 ? 立即 数 就 是 常数 。 常 数 就 常数 呐 ， 为 什么 拐 着 弯 叫 别 的 名 呢 ? 

是 这 样 的 ， 指 令 由 操作 码 和 操作 数组 成 ， 得 到 一 个 数 往往 不 容易 ， 或 者 说 不 那么 直接 。 这 个 数 要 么 在 
寄存 器 中 ， 要 么 在 内 存 中 ， 都 是 间接 给 出 的 ， 所 以 得 到 数 就 要 花费 一 些 CPU 周期 。 如 果 操 作 数 “直接 ” 
存在 指令 中 ， 直 接 拿 过 来 ， 立 即 就 能 用 了 。 为 了 突显 “立即 就 能 用 ”的 高 效率 ， 此 数 便 称 为 立即 数 。 立 即 
数 免 去 了 找 数 的 过 程 ，CPU 最 喜欢 它 啦 。 如 ; 
































































































































mov axr 0x18 
mov ds, ax 


第 一 条 指令 中 的 源 操作 数 0x18 是 立即 数 ， 目 的 操作 数 ax 是 寄存 器 ， 所 以 它 既 是 立即 数 寻 址 ， 也 是 寄 
存 器 寻 址 。 第 二 条 指令 中 ， 源 操作 数 和 目的 操作 数 都 是 寄存 器 ， 所 以 纯粹 是 寄存 器 寻 址 。 
提醒 一 下 ， 像 这 样 的 寻 址 也 是 立即 数 寻 址 : 





















































mov ax macro selector 
mov ax, label start 


第 一 条 指令 的 源 操作 数 macro_selector 是 个 宏 ， 第 二 条 指令 的 源 操作 数 label_start 是 个 标号 ， 这 两 个 
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。 内 存 寻 址 


以 上 两 种 寻 址 方式 ， 操 作 数 























在 编译 阶段 会 转换 为 数字 ， 最 终 可 执行 文件 中 的 依然 是 立即 数 。 




















数 在 内 存 中 的 寻 址 方式 称 为 内 存 寻 址 。 




















个 是 在 寄存 器 中 ， 一 个 是 在 指令 中 直接 给 出 。 它 们 都 不 在 内 存 中 。 操 作 























CPU 中 有 很 多 寄存 器 ， 有 些 是 程序 员 不 可 见 的 ， 它 们 是 为 了 CPU 正常 运行 而 存在 的 ， 属 于 CPU 运行 框架 


内 的 需求 。CPU 给 程序 员 
相对 就 大 多 了 ， 于 是 CPU 工程 师 





























的 寄存 器 并 不 是 很 多 ， 所 以 操作 数 一 多 起 来 的 时 候 ， 基 本 就 倒 腾 不 开 了 。 内 存 空间 





























门 自然 而 然 想到 了 用 内 存 来 存储 操作 数 。 另 外 ， 用 立即 数 寻 址 ， 得 提前 知道 立 









































即 数 是 多 少 , 否则 还 真 用 不 了 。 而且， 大 多 数 时 候 操作 数位 于 内 存 中 的 某 个 位 置 , 只 知道 操作 数 所 在 的 内 存 地 址 ， 























不 知道 操作 数 的 值 ， 更 谈 不 上 将 其 变 成 立即 数 用 在 指令 中 了 ， 这 就 更 加 有 理由 让 内 存 寻 址 成 为 “应 该 ” 







































































由 于 访问 内 存 是 用 “ 段 基 址 ; 偏 内 偏 移 地 址 ”的 形式 ， 特 别 强调 一 下 ， 此 形式 只 用 在 内 存 访问 中 。 默 





认 情 况 下 数据 段 寄存 器 是 DS， 即 段 
决定 作用 的 、 有 效 的 是 段 内 偏 移 地 址 ， 




























































































基 址 已 经 有 了 ， 只 要 再 给 出 段 内 偏 移 地 址 就 可 以 访问 内 存 了 ， 最 终 起 














所 以 段 内 偏 移 地 址 称 为 有 效 地 址 。 











以 下 所 说 的 寻 址 方法 都 是 在 内 存 中 寻 址 的 方法 。 






































址 中 的 值 作为 操作 数 。 如 : 

















| mov ax [0x1234 


mov ax [fs: 


Ox5678] 








0x1234 是 段 








第 二 条 指令 


gs 寄存 器 的 值 *16+0x5678，CPU 到 此 内 存 地 址 取 值 再 存 入 ax 寄存 器 
注意 啦 ， 不 要 和 立即 数 寻 址 混 了 ， 立即 数 寻 址 中 的 数字 是 直接 拿 来 就 用 作 操 作 数 了 ， 直接 寻 址 中 的 数 






































直接 寻 址 ， 就 是 将 直接 在 操作 数 中 给 出 的 数字 作为 内 存 地 址 ， 通 过 中 括号 的 形式 告诉 CPU， 取 此 地 


内 偏 移 地 址 ， 默认 的 段 地 址 是 DS。 这 条 指令 是 将 内 存 地 址 DS: 0x1234 处 的 值 写 入 ax 寄存 
器 。 还 记得 规则 吗 ? 段 基 址 *16 变 成 20 位 地 址 后 ， 再 加 上 段 内 偏 移 地 址 0x1234， 当 然 结果 还 是 20 位 地 址 。 
中 ， 由 于 使 用 了 有 段 跨越 前 级 fs，0x5678 的 段 基 址 则 变 成 了 gs 寄存 器 。 最 终 的 内 存 地 址 是 






































字 是 用 来 进一步 寻 址 的 。 




















。 基 址 寻 址 
基 址 寻 址 ， 就 是 在 操作 数 中 用 bx 寄存 器 或 寄存 器 作为 地 址 的 起 始 ， 地 址 的 变化 以 它 为 基础 。 注 意 看 啦 ， 









































这 里 说 的 是 只 能 用 bx 或 bp 作为 基 址 寄存 器 。 用 寄存 器 作为 内 存 寻 址 ， 在 实 模式 下 就 是 这 样 的 ， 必 须 用 bx 





或 bp 寄存 器 。 到 了 保护 模式 下 就 没 ; 











这 个 限制 了 ， 基 址 寄存 器 可 选择 的 很 多 ， 可 以 是 全 部 的 通用 寄存 器 。 














说 明 一 下 ，bx 寄存 器 的 默认 段 寄存 器 是 DS， 而 bp 寄存 器 的 默认 段 寄存 器 是 SS， 即 bp 和 sp 都 是 栈 

















的 有 效 地 址 。 如 果 你 忘记 了 什么 
word[bx]， 0x1234” 这 条 指令 





























引 令 用 到 了 立即 
模式 下 恒久 不 变 


























再 看 个 用 bp 寄存 器 作为 基 i 
寄存 器 是 SS。 这 就 是 说 ，bp 是 





数 寻 址 和 内 存 基 址 寻 
的 步 又 。 














是 有 效 地 址 , 第 0 章 有 介绍 , 简 而 言 之 有 效 地 址 就 是 指 偏 移 地 址 。 例 如 “add 
S$ 将 0x1234 加 上 内 存 地 址 ds: bx 处 的 值 后 再 存 入 内 存 地 址 ds: bx 中 。 这 条 
址 两 种 方式 。 同样 ，ds 也 要 乘 以 16 后 再 加 上 bx 寄存 器 的 值 ， 这 是 实 




































































用 的 寄存 器 ，push 指令 往 哪个 内 存 压 








实 模式 下 ，CPU 
分 为 两 步 ， 假 如 


1 sub sp, 2 
2 mov sp, ax 


实 模 式 下 pop 指令 ， 其 工作 原理 


1 mov ax, [ 
2 add sp, 2 


执行 push ax: 





第 ax 的 值 


























引 寄 存 器 的 例子 。 前 面 说 过 啦 ， 用 bp 寄存 器 作为 偏 移 地 址 时 ， 其 默认 的 自 
] 来 访问 栈 的 。 为 什么 已 经 有 了 sp 寄存 器 来 “专门 ”访问 栈 ， 还 要 再 单独 
准备 个 bp 呢 ? sp 寄存 器 作为 栈 顶 指针 ， 相 当 于 栈 中 数据 的 游标 ,这 是 专门 给 push 指令 和 pop 指令 做 导航 















































入 数据 ，popd 将 哪个 地 址 的 数据 弹出 栈 ， 都 要 看 sp 的 值 是 多 少 。 在 





















































字 长 是 16， 所 以 实 模式 下 的 push 指令 默认 情况 下 是 压 入 2 字 节 的 数据 ， 其 工作 原理 可 以 


先 将 sp 的 值 减 去 


mov 加 到 新 的 sp 指向 的 内 存 




















也 分 为 两 步 ， 假 如 执行 pop ax: 

















sp] 先 将 sp 指向 
再 将 sp 的 指 











的 值 mov 到 ax 
十 二 2 
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估量 的 灾难 。 

栈 也 是 内 存 中 的 区 域 ， 既 然 sp 不 敢 乱 动 的 话 ， 该 如 何 访问 到 此 区 域 中 的 数据 呢 ? 
有 需求 的 地 方 就 有 解决 的 办 法 ， 得 看 为 什么 要 访问 栈 。 

访问 栈 有 两 种 方式 ， 一 种 是 把 栈 当成 “ 栈 ” 来 使 用 ， 也 就 是 用 push 和 pop 指令 操作 栈 ， 但 这 样 我 们 只 能 访 
问 到 栈 顶 ， 即 sp 指向 的 地 址 ， 没 有 办 法 直接 访问 到 栈 底 和 栈 项 之 间 的 数据 。 很 多 时 候 ， 我 们 需要 读 写 栈 中 的 数 
据 ， 即 需要 把 栈 当成 普通 数据 段 那样 访问 。 举 个 需要 直接 写 栈 的 例子 ， 比 如 标志 寄存 器 eflags 无 法 直接 修改 ， 只 
能 用 pushf 指令 把 eflags 寄存 器 的 内 容 压 到 栈 中 ， 我 们 在 栈 中 修改 完 后 ， 再 用 popf 把 它 弹 回 到 eflags 中 。 处 理 器 
为 了 让 开发 人 员 方 便 控 制 栈 中 数据 ， 提 供 了 这 种 把 栈 当成 数据 段 来 访问 的 方式 ， 可 以 用 寄存 器 bp 来 给 出 栈 中 偏 
移 量 ， 所 以 bp 默认 的 段 寄 存 器 就 是 SS， 这 样 就 可 通过 SS: bp 的 方式 把 栈 当成 普通 的 数据 段 来 访问 了 。 
再 举 个 需要 直接 读 栈 中 数据 的 例子 。 一 个 最 重要 的 应 用 就 是 在 栈 中 保存 局 部 变量 和 函数 参数 。 这 里 
虽然 是 想 解 释 bp 寄存 器 的 应 用 ， 但 若 不 拿 例子 解释 的 话 会 显得 很 刻意 ， 最 好 的 例子 是 用 32 位 环境 下 的 
ebp 寄存 器 来 解释 ，ebp 和 bp 的 应 用 原理 是 一 样 的 。 在 32 位 环境 下 ，ebp 就 应 用 在 堆栈 框架 中 ， 堆 栈 杠 
架 是 编译 器 在 栈 中 为 局 部 变量 分 配 内 存 空间 的 方式 ,局 部 变量 存在 于 函数 中 ， 因 此 有 关 堆 栈 框 架 的 汇编 
旧 令 是 在 函数 的 开头 和 结尾 处 。 下 面 通过 这 段 代 码 了 解 堆栈 框架 的 原理 。 
ee by, ‘Tn GN), 4 
int "di 


} 
a++; 


假设 这 是 在 32 位 下 。 

(1) 调用 function(1,2); 按照 C 语言 调用 规范 ， 参 数 入 栈 的 顺序 从 右 到 左 : 会 先 压 入 2， 再 压 入 1。 
每 个 参数 在 栈 中 各 占 4 字 节 。 

(2) 栈 中 再 压 入 function 的 返回 地 址 ， 此 时 栈 顶 的 值 是 执行 “a++” 相 关 指 令 的 地 址 。 

下 面 是 堆栈 框架 的 指令 。 

(3) push ebp; 将 ebp 压 入 栈 ， 栈 中 备份 ebp 的 值 ， 占 用 4 字 闻 

(4) movebp，esp; 将 esp 的 值 复制 到 ebp，ebp 作为 堆栈 框架 的 基 址 ， 可 用 于 对 栈 中 的 局 部 变量 和 其 
他 参数 寻 址 。 

此 时 的 ebp 便 是 栈 中 局 部 变量 的 分 界线 。 在 这 之 后 , esp 将 自 减 一 定 的 值 为 局 部 变量 在 栈 中 分 配 空间 ， 
该 值 取决 于 所 有 局 部 变量 空间 大 小 的 总 和 。 

(5) sub esp,4; 由 于 函数 function 中 有 局 部 变量 d 
专门 给 变量 d 使 用 。 

终于 到 了 应 用 ebp 指针 的 时 候 ， 以 ebp 为 基 址 对 栈 中 数据 寻 址 。 

















































































































































































































































































































































































































































































































下 




















































































































局 部 变量 是 在 栈 中 存放 的 , 故 esp 要 预 留 出 4 字 节 ， 















































































































































[ebp-4] 是 局 部 变量 d， 对 应 上 看 的 第 (5) 步 。 栈 向 下 发 展 高 地 址 
[ebp] 是 ebp 在 栈 中 的 备份 ， 对 应 上 面 的 第 (3) 步 。 ebp+12 
[ebp+4] 是 函数 的 返回 地 址 ， 对 应 上 面 的 第 (2) 步 ebp+8 
A a ebp+4 (目前 的 esp) 
函数 中 的 参数 b 是 用 [ebp+8] 访 问 ， 参 数 c 用 [ebp+12] 访 问 ， 对 ei 
应 上 面 的 第 (1) 步 。 cp_ [ind | ebp-4 
栈 中 数据 的 布局 如 图 3-8 所 示 。 一 一 一 
| 低地 址 

















(6) 函数 结束 后 跳 过 局 部 变量 的 空间 : mov esp, ebp。 

(7) 恢复 ebp 的 值 : pop ebp。 4 图 3-8 ”堆栈 框架 栈 中 布局 示意 图 

至 此 函数 中 堆栈 框架 的 指令 结束 了 ， 然 后 是 返回 指令 ret， 接 着 主 调 函 数 中 执行 “add esp,8” 来 回收 参 
数 b 和 c 的 空间 。 

例子 说 完了 ， 您 看 ， 用 [elbp 寄存 器 作为 栈 的 指针 来 访问 栈 中 数据 还 是 非常 方便 的 。 

另外 说 一 下 , 堆栈 框架 的 工作 是 为 函数 分 配 局 部 变量 空间 , 因此 应 该 在 刚刚 进入 函数 时 就 进行 为 局 部 变量 分 
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se 


配 空间 的 工作 , 离开 函数 时 再 回收 局 部 变量 的 空间 ,所 以 堆栈 框架 的 创建 和 回收 工作 分 别 是 在 进入 函数 和 离开 函 
数 时 进行 的 。 为 了 在 名 称 上 突显 堆栈 框架 这 两 个 阶段 ， 有 一 条 指令 叫 enter， 它 是 在 进入 函数 时 执行 的 ， 其 功能 
就 是 备份 ebp 并 使 ebp 更 新 为 esp， 即 先 “push ebp” 再 “mov ebp，esp” 因此 第 3~4 步 的 两 条 指令 通常 会 由 一 
条 enter 指令 来 代替 。 另 一 条 指令 是 leave， 它 是 在 离开 函数 时 执行 的 ， 其 功能 是 回收 局 部 变量 的 空间 并 恢复 ebp 
的 值 ， 即 先 “mov esp,ebp” 再 “pop ebp” 因此 第 6~7 步 的 两 条 指令 也 通常 由 一 条 leave 指令 来 代替 。 

。 变 址 寻 址 

变 址 寻 址 其 实 和 基 址 寻 址 类 似 , 只 是 寄存 器 由 bx、 bp 换 成 了 si 和 di。si 是 指 源 索 引 寄存 器 (source 
index)，di 是 指 目 的 索引 寄存 器 (destination index)。 两 个 寄存 器 的 默认 段 寄 存 器 也 是 ds。 


mov [di], ax :将 寄存 器 ax 的 值 存 入 das: di 指向 的 内 存 
mov [si+0x1234], ax ; 变 址 中 也 可 以 加 个 偏 移 量 










































































































































































































































































变 址 寻 址 主要 是 用 于 字符 搬运 方面 的 指令 , 这 两 个 寄存 器 在 很 多 指令 中 都 要 成 对 使 用 , 如 movsb, movsw， 
movsd 等 ， 我 们 的 代码 中 也 用 到 了 此 命令 ， 讲 到 时 会 细 说 ， 目 前 大 家 有 兴趣 可 自行 查阅 。 
其 实 单纯 的 变 址 寻 址 没什么 新 鲜 的 ， 它 只 是 为 了 配合 基 址 寻 址 ， 用 来 实现 基 址 变 址 寻 址 。 
。 基 址 变 址 寻 址 
从 名 字 上 看 ， 这 是 基 址 寻 址 和 变 址 寻 址 的 结合 ， 即 基 址 寄存 器 bx 或 bp 加 一 个 变 址 寄存 器 si 或 di。 如 : 


mov [bx+di], ax 
add [bx+si], ax 































































































第 一 条 指令 是 将 ax 中 的 值 送 入 以 ds 为 段 基 址 ，bx+di 为 偏 移 地 址 的 内 存 。 第 二 条 指令 是 将 ax 与 [ds: 
bx+si] 处 的 值 相 加 后 存 入 内 存 [ds: bx+si]。 
在 咱们 项 目 里 的 汇编 代码 里 还 没有 这 么 用 的 ， 不 做 过 多 演示 ， 大 家 知道 有 这 种 形式 就 行 。 

CPU 访问 数据 的 方式 看 上 去 很 死板 (有些 寄 存 器 是 规定 的 ), 原因 是 一 种 寻 址 方式 对 应 一 种 电路 实现 ， 
增加 一 种 寻 址 方式 ， 会 增加 硬件 电路 的 复杂 性 ， 所 以 寻 址 方式 是 有 限 的 。 

就 拿 “mov ax，[bx+si]” 来 说 ， 您 有 没有 疑问 ， 换 成 mov ax，[cx+dx] 行 不 行 ? 这 在 逻辑 上 没有 任何 问 
题 ， 我 不 觉得 它们 之 间 有 什么 不 同 ， 咱 们 关心 的 是 bx+si 要 等 于 cx+dx 就 行 了 。 这 是 人 类 的 理解 ， 我 们 不 知 
不 觉 中 站 在 了 抽象 层 来 看 待 这 个 偏 移 地 址 ， 即 咱们 关注 的 是 这 个 数 是 否 正确 ， 而 不 管 这 个 数 是 怎么 来 的 。 

对 于 有 效 地 址 〈 段 内 偏 移 地 址 )， 不 管 其 形式 是 寄存 器 、 立 即 数 ， 还 是 内 存 中 的 值 ， 甚 至 是 个 表达 
式 ， 它 在 人 类 眼 里 只 是 个 数字 ， 按 理 来 说 都 是 一 样 的 ， 不 应 该 强调 具体 形式 。 可 是 这 对 计算 机 硬件 实现 
来 说 却 是 截然 不 同 的 ， 所 以 才 又 细 分 了 这 么 多 的 寻 址 形式 。 给 大 家 举 个 生活 中 的 例子 。 

大 家 吃饭 时 对 于 主食 的 选择 ， 有 人 喜欢 吃 饼 ， 有 人 喜欢 吃 米 饭 。 虽 然 它 们 都 是 主食 ， 但 这 两 种 食物 的 
加 工 方法 必须 是 不 同 的 ， 饼 是 用 饼 销 做 出 来 的 ， 米 饭 是 用 锅 蒸 出 来 的 。 想 吃 饼 类 食物 ， 其 制作 过 程 就 一 定 
要 用 到 饼 销 ， 这 是 最 底层 不 变 的 东西 。 无 论 做 出 的 是 鸡蛋 饼 ， 还 是 馅 饼 ， 其 上 层 形 式 无 论 多 丰富 ， 万 变 不 
离 其 宗 ， 都 是 经 过 人 饼 销 毫 制 而 成 的 。 总 结 出 : 一 类 食物 种 类 对 应 一 类 工具 ， 想 创造 一 种 新 食 类 ， 就 要 发 明 
新 的 工具 〈 当 然 我 这 么 总 结 是 不 严谨 的 ， 用 一 口 锅 也 能 做 出 很 多 种 不 同 的 食物 ， 这 确实 是 可 能 的 )。 结 合 
CPU 寻 址 方式 ， 大 家 可 以 这 么 想 ， 一 种 寻 址 方式 相当 于 一 类 食物 ， 而 其 相应 的 硬件 电路 是 某 种 制造 工具 ， 
上 层 形式 万 千 的 变化 ， 归 根 结 底 就 是 这 么 几 类 硬件 电路 ， 而 它 是 有 限 的 。CPU 的 寻 址 方式 看 似 不 灵活 ， 
有 的 甚至 要 背 下 来 ， 这 是 因为 这 和 人 类 理解 的 方式 是 不 一 样 的 ， 人 类 是 站 在 抽象 层 来 看 待 寻 址 的 ， 如 果 站 
在 底层 来 看 它们 ， 就 会 理解 在 这 么 多 的 寻 址 方法 中 ， 为 什么 看 似 一 样 却 又 有 这 么 多 形式 ， 就 是 因为 8086 
在 寻 址 方面 的 硬件 电路 做 得 简单 有 限 ， 为 了 更 简单 ， 某 些 功 能 中 使 用 的 寄存 器 甚至 要 “ 写 死 ?。 如 该 用 基 
址 寻 址 时 ， 电 路 中 就 只 针对 bx 或 bp 寄存 器 ， 从 硬件 上 就 没 考虑 其 他 寄存 器 。 
寻 址 方式 到 这 里 就 讲 完了 。 
咱们 在 实 模式 下 的 代码 中 还 用 到 了 call、ret 和 jmp， 下 面 说 说 它们 的 用 法 。 


3.2.5” 栈 到 底 是 什么 玩意 儿 
CPU 中 有 栈 段 SS 寄存 器 和 栈 指 针 SP 寄存 器 ， 它 们 是 用 来 指定 当前 使 用 的 栈 的 物理 地 址 。 换 句 话 说 ， 
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运行 ， 必 须 
数 和 


但 
本 











;有 栈 。 栈 是 什么 ? 














在 用 户 进程 空间 中 ， 

















免 混 涌 ， 只 说 栈 。 





栈 是 线性 表 上 









































F 吗 用 的 ?本 节 将 给 大 家 一 个 交代 。 
结构 中 的 栈 吗 ? 那 是 逻辑 上 的 数据 存 取 结构 ， 是 种 如 何 用 

















的 一 种 ， 什 么 是 线性 表 ? 妇 




















线 ， 还 是 


昌 线 ， 








有 线 的 性 质 ， 就 像 


条 线 





在 线 








上 任意 位 置 





只 能 











日 
[未 护 昌 








E 是 堆 ， 栈 是 栈 ， 但 堆栈 却 是 人 们 党 说 的 栈 ， 和 堆 没 关系 ， 所 以 ， 咱 


这 样 的 问题 ， 
样 ， 连 续 性 强 ， 从 一 个 方向 到 另 一 个 方向 。 线 上 没有 面积 的 概念 
容纳 一 个 数据 对 象 。 线性 表 简 而 言 之 就 是 一 个 线性 存储 单元 ， 结 构 ! 








每 个 元 素 都 有 一 个 前 驱 和 一 个 后 继 元 素 ， 








元 素 。 栈 也 是 这 样 ， 不 过 不 同 的 是 数据 的 存 取 都 在 
址 永远 不 动 ， 称 为 栈 底 。 这 就 是 上 学 时 ， 老 好 
后 放 进 去 的 数据 最 先 被 取出 。 



































这 里 我 就 不 用 举 汉 诺 塔 这 样 经 
定 挤 过 公交 车 吧 ， 尤 其 
为 他 要 在 最 后 下 村 
的 ， 因 为 他 会 是 第 一 个 下 车 。 所 以 ， 挤 公交 车 就 是 
的 元 素 ， 这 个 例子 其 实 还 算 生动 。 








儿 不 算 )， 因 








举 的 例子 
来 说 , 可 能 是 
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虽然 很 常见 ,但 这 对 于 已 经 形 
能 是 依然 像 说 废 i 
































昌 仅 各 有 一 个 。 












































这 种 数据 结构 来 存 取 数 据 的 描述 。 



































们 后 面 为 避 
我 想 您 可 能 不 清楚 什么 是 线性 。 线 性 就 是 









































， 不 管 是 直 





















































端 进行 ， 这 

















! 的 例子 了 ， 毕 况 上 学 时 都 听 得 太 多 了 。 我 说 个 大 家 都 认同 的 








是 早 班车 和 末班车 ,要 
































人 六， 在 于 


天 一 贞 














挤 的 





FE 厢 里 人 挤 人 ， 站 都 站 不 稳 。 
FE 厢 中 折磨 的 时 间 最 长 。 后 挤 上 车 的 乘客 在 下 车 的 时 候 


















































老师 说 





只 要 在 路 





器 上 把 











或 UDP 协议 自然 就 不 可 
某 人 说 话 ， 最 简单 的 办 法 就 
理论 知识 ， 依 然 让 我 有 点 摸 不 着 头 腕 
您 现在 也 有 这 样 的 体会 ， 没 关系 ， 以 后 会 不 断 接 触 栈 的 ， 熟 了 自然 就 理解 了 ， 这 只 是 时 
构 时 ,不 容易 理解 其 本 质 ， 我 当初 在 学 习 这 门 课时 ， 感觉 云 








初次 学 习 数据 结 



































是 如 





老路 




















民 《〈 网 络 层 ) IP 协议 


J 了。 为 了 让 我 们 明 











合 让 其 上 

















电解 栈 的 人 来 说 ， 我 像 是 在 说 废话 一 样 没 新 意 。 对 了 
#， 说 了 也 意 会 不 到 栈 是 什么 。 我 非常 理解 这 种 心情 ,记得 当初 我 在 学 网 络 时 ， 
(不 是 指令 指针 寄存 器 四 ) 禁用 ， 
白 这 种 依赖 关系 ， 其 至 不 惜 举 出 这 样 的 例子 ， 如果 不 想 让 


重 着 ， 而 不 是 劝 他 保持 安静 。 这 个 但 用 例子 来 理解 








办 ， 










































































这 可 不 是 上 








喻 恰 不 恰当 的 事 ， 知 





这 就 是 线性 的 体现 : 连续 ， 且 任意 位 置 只 有 一 个 
端 称 为 栈 顶 ， 男 一 端 作为 存储 单元 的 基 
j 们 常常 说 的 后 进 先 出 ， 先 放 进 去 的 数据 要 在 最 后 才能 取出 ， 
































先 挤 上 车 的 乘客 其 实 很 倒霉 的 《有 


人 
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还 是 很 高 兴 


型 的 后 进 先 出 。 车 厢 就 相当 于 栈 ， 乘 客 就 相当 于 栈 中 存 取 












































不 理解 栈 的 人 
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层 〈 传 输 层 


























例子 非常 浅显 易 懂 ， 


识 是 严谨 的 , 不 是 比喻 出 



































司 问题 。 
































筋 里 的 ， 似 乎 明 


) 上 的 TCP 






































来 的 。 如 


HA 个 


白 似乎 











































































































































































































































































































































































































又 不 懂 ， 老 师 让 不 懂 的 同学 提问 ， 我 又 不 知道 该 怎样 描述 问题 ， 不 知道 哪里 不 懂 。 同 样 的 定义 ， 同 样 的 文 
字 描 述 ， 每 个 人 理解 的 都 不 一 样 。 就 像 鱼 和 小 鸟 ， 鱼 认为 自己 离开 水 就 会 死 ， 水 就 是 生命 ， 小 鸟 也 认为 没 
水 会 涅 死 ， 水 也 是 生命 。 但 鱼 和 小 乌 对 水 的 理解 能 一 样 吗 ? 

赶紧 回来 ， 还 是 说 咱们 的 正事 。 栈 只 是 一 种 抽象 概念 ， 是 一 种 虚拟 出 来 的 数据 存 取 方 法 。 其 实现 形式 
是 不 限 的 ， 只 要 满足 栈 的 定义 就 可 以 。 

。 首先 得 是 线性 结构 ， 并 且 数 据 的 存 取 在 线性 结构 的 一 端 进 行 。 如 果 您 愿意 ， 可 以 用 链表 来 实现 ， 
也 可 以 用 数组 来 实现 ， 它 们 都 是 线性 数据 结构 。 

。 其 次 需要 维护 一 个 指针 ， 用 它 来 指向 线性 结构 的 一 端 ， 数 据 存 取 都 通过 此 指针 。 

前 面 又 比喻 又 回忆 的 ， 说 了 这 么 多 ， 栈 能 够 干什么 呢 ? 

栈 是 一 种 很 伟大 的 发 明 ， 可 以 解决 很 多 难题 。 

。 表达 式 计算 ， 如 中 缀 表达 式 和 后 缀 表达 式 的 转换 。 

。 函数 调用 ， 无 论 是 嵌 套 调用 或 递归 调用 ， 用 来 维护 返回 地 址 。 

。 深度 优先 搜索 算法 。 

到 目前 为 止 , 我 们 说 的 只 是 数据 结构 中 的 栈 ， 这 是 逻辑 上 的 ， 最 终 我 想 表 达 的 是 内 存 中 的 栈 ， 这 是 物 
理 上 的 。 把 数据 结构 中 的 栈 的 概念 用 物理 硬件 来 实现 ， 这 就 是 我 们 要 说 的 栈 。 它 同 数据 段 、 代 码 段 一 样 ， 


丰 














硬件 是 如 何 实现 这 个 栈 的 呢 ? 
还 是 那 句 话 ， 首 先 得 满足 栈 的 概念 ， 具备 栈 的 特性 ， 即 使 是 硬件 也 不 能 例外 ， 必 须 满足 上 生 


























两 个 条 件 : 一 个 是 线性 结构 ， 另 一 个 是 在 栈 顶 对 数据 存 取 。 
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个 内 存 中 的 区 域 ， 也 就 是 栈 段 寄存 器 SS 和 栈 指针 SP 所 指向 的 内 在 
就 是 这 个 内 存 区 域 无 法 容纳 数据 了 。 

















区 域 。 我 们 常 听 说 的 栈 溢 出 ， 指 的 








j 提 到 的 这 

















大 








为 它 毕竟 造 的 是 栈 , 不 具备 这 些 就 不 叫 栈 了 。 


线性 结构 这 个 简单 ， 内 存 就 是 ， 直 接 用 物理 内 存 存 取 最 方便 了 ， 咱 们 要 做 的 就 是 给 栈 指定 一 片 内 
存 区 域 ， 区 域 的 起 始 地 址 作为 栈 基 址 ， 存 入 栈 基 址 寄存 器 SS 中 ， 另 一 端 是 动态 变化 的 ， 用 栈 指针 寄 
存 器 SP 来 指定 。 栈 在 使 用 过 程 中 是 向 下 扩展 的 ， 所 以 栈 顶 地 址 肯定 小 于 栈 底 地 址 。 

栈 既 然 是 一 片 内 存 区 域 ， 访 问 内 存 就 要 用 “ 段 基 址 ; 段 内 偏 移 地 址 ”的 形式 ， 所 以 栈 中 的 内 存 地 
址 也 是 用 “ 段 基 址 SS 的 值 *16+ 栈 指针 SP《〈 段 内 偏 移 地 址 ) 形成 的 20 位 地 址 ”访问 到 的 。 

由 于 是 硬件 实现 的 栈 ， 故 硬件 提供 了 相应 的 方法 来 存 取 栈 ， 即 push 和 pop 指令 。push 指令 负责 把 数 
据 压 入 栈 , pop 指令 功能 相反 , 将 其 从 栈 中 取出 。 不 过 我 刚才 说 的 不 全 面 , 栈 的 出 口 和 入 口 都 是 栈 顶 , push 
把 数据 压 向 哪里 ， 它 得 知道 栈 顶 在 哪里 才 行 。pop 指令 也 一 样 ， 它 得 知道 哪里 是 栈 顶 才能 从 栈 中 取出 正确 
的 数据 。 这 正 是 栈 指针 寄存 器 SP 的 作用 ， 此 寄存 器 中 的 值 是 段 内 偏 移 地 址 ， 是 栈 顶 相对 于 栈 底 的 偏 移 量 。 

栈 项 (SP 指针 ) 是 栈 的 出 口 和 入 口 ， 它 指向 的 内 存 中 存储 的 始终 是 最 新 的 数据 。push 和 pop 就 是 操 
作 这 个 指针 所 指向 的 内 存 。 由 于 栈 从 高 地 址 向 低地 址 发 展 , 所 以 栈 顶 、 栈 指针 指向 的 地 址 会 越 来 越 低 。push 
压 入 数据 的 过 程 是 : 先 将 SP 减 去 字 长 ， 目 的 是 避免 将 栈 顶 的 数据 破坏 ， 所 得 的 差 再 存 入 SP， 栈 项 在 此 被 
更 新 ， 这 样 栈 顶 就 指向 了 栈 中 下 一 个 存储 单元 的 位 置 。 再 将 数据 压 入 SP“〈 新 的 栈 顶 ) 指向 的 新 的 内 存 地 
址 。pop 指令 相反 ， 既 然 是 在 栈 中 弹出 数据 ， 栈 指针 寄存 器 SP 的 值 应 该 是 增 大 一 个 数据 单位 。 由 于 要 弹 
出 的 数据 就 在 当前 栈 顶 ， 所 以 在 弹出 数据 后 ， 才 将 SP 加 上 字 长 ， 所 得 的 和 再 存 入 SP， 从 而 更 新 了 栈 顶 。 
这 样 SP 就 指向 了 上 一 个 存储 单元 的 位 置 。 

上 面 提 到 的 字 长 ， 是 指 CPU 的 字 长 ， 即 一 次 可 处 理 的 数据 的 长 度 。 在 实 模式 下 的 字 长 是 16。 

物理 内 存 中 的 栈 如 图 3-9 所 示 。 
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内 存 
= = = 
1 
| 


地 址 高 


SS 寄存 器 =0x1234, 栈 底 0x12340 
经 过 SS*16 后 指向 栈 底 最 先入 栈 的 数据 , | 0x1233F 
0x1233E 
第 2 入 栈 的 数据 ， 0x1233D 











: 
栈 顶 是 最 后 入 栈 :| 楼 只 是 
栈 顶 的 数据 , 占 2 字 节 内 存 中 
sp 小 于 64K 且 是 2 的 整数 倍 | | 的 区 域 
I = 
pd 
地 
引 | [| 
二 
上 = 
< = 
| 
ss 
ee 








4 图 3-9 ” 栈 在 内 存 中 的 示意 图 


注意 啦 ， 如 图 3-9 所 示 ， 虽 然 栈 是 向 下 发 展 的 ， 但 栈 也 是 内 存 ， 访 问 内 存 依然 是 从 低地 址 往 高 地 址 ， 
假如 当前 栈 顶 是 0x1233E， 栈 顶 数据 占 2 字 节 的 话 ， 其 范围 是 0x1233E~0x1233F。 
个 人 觉得 ， 这 个 硬件 中 的 栈 让 人 感到 神秘 ， 主 要 有 两 方面 原因 。 
一 方面 是 栈 指针 不 是 自己 维护 ， 这 不 像 咱们 在 高 级 语言 中 自己 创建 的 栈 那 样 ， 指 针 的 一 举 一 动 都 是 自 
己 在 操作 。 不 直接 受 控 的 东西 往往 让 人 心 存 忧 虑 和 有 点 小 恐慌 。 其 实 即使 是 这 里 的 硬件 栈 ， 咱 们 也 可 以 自 
己 维护 指针 ， 如 push ax 可 以 这 样 代 蔡 : 


mov bp,sp 
sub bp, 2 
mov [bpl],ax 
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bp 默认 的 段 寄 存 器 就 是 SS， 用 bp 的 时 候 直接 操作 的 便 是 栈 。bp 就 相当 于 栈 指针 啦 ， 自 己 维护 毕竟 
太 麻 烦 ， 有 直接 省 事 的 干吗 不 用 呢 。 

另 一 方面 ， 栈 就 是 一 片 内 存 区 域 ， 只 不 过 “经 常 ” 操 作 这 片 内 存 的 指令 不 是 mov， 而 是 push、pop， 
这 两 条 指令 无 非 是 自动 维护 存 取 数 据 的 位 置 (SP 寄存 器 的 值 ) 而 已 ， 大 家 用 mov 来 操作 这 片 内 存 ， 不 是 
也 得 要 给 出 存 取 地 址 吗 。 这 样 看 来 ， 它 和 普通 的 数据 段 没什么 不 同 ， 不 要 觉得 它 比 金字 塔 还 神秘 。 

一 定 要 注意 ，push 和 pop 操作 是 要 成 对 出 现 的 ， 这 样 才能 维护 栈 平衡 。 否 则 ， 光 push， 不 popp， 有 进 
没 出 ， 这 栈 很 快 就 溢出 啦 。 切 记 ， 一 个 push 要 对 应 一 个 pop， 每 键入 一 个 pop 指令 ， 一 定 要 清楚 它 对 应 的 
是 哪个 push 。 

好 啦 ， 栈 就 先 说 这 么 多 ， 不 摸索 实际 东西 的 话 还 是 不 能 真 
来 不 了 真知 识 。 
3.2.6” 实 模式 下 的 ret 

由 于 指令 都 是 存在 内 存 中 ， 所 以 CPU 也 要 访问 内 存 才 能 拿 到 要 执行 的 指令 。 上 既然 是 访问 内 存 ， 就 免 
不 了 要 用 “上 段 基 址 : 段 内 偏 移 地 址 ”的 形式 ， 对 于 指令 来 说 ，CS 寄存 器 是 代码 段 段 基 址 ， 卫 寄存 器 中 的 
是 代码 段 的 段 内 偏 移 地 址 。 经 过 寄存 器 CS*16 后 再 加 上 IP 寄存 器 的 值 ， 所 得 的 和 就 是 指令 存放 的 内 存 地 
址 。CPU 在 此 内 存 地 址 处 获得 指令 并 执行 。 所 以 说 ，CPU 前 进 的 方向 永远 是 CS: IP 这 两 个 寄存 器 。 
由 于 不 能 直接 往 卫 寄存 器 中 赋值 (如同 mov ip ， xxxx 这 样 的 指令 是 错误 的 )， 即 使 能 的 话 ， 太 灵 
活 了 反而 更 麻烦 ， 很 多 相关 数据 结构 都 要 自己 设置 。 例 如 call 指令 要 压 入 返回 地 址 ， 进 入 中 断 时 ， 要 压 入 代 
码 段 寄存 器 CS、 指 令 指 针 寄 存 器 了 一、 状态 寄存 器 fags， 除 此 之 外 还 要 考虑 特权 级 ， 若 特权 级 有 变化 ， 还 要 
压 入 栈 段 寄 存 器 SS 及 栈 顶 指针 寄存 器 SP。 所 以 为 了 大 家 使 用 方便 ，CPU 中 提供 了 很 多 可 以 改变 CPU 执行 
流 的 指令 ,它们 在 内 部 实现 上 ,包含 了 许多 微 操 作 ， 用 于 设置 相关 数据 结构 。 人 家 已 经 将 这 些 步 又 封装 成 一 
个 指令 ,咱们 直接 调用 就 好 。 所 以 其 表面 上 看 来 是 一 个 指令 ， 实际 上 其 内 部 干 的 活 可 不 少 呢 。 例 如 即将 讲述 
的 call、ret、jmp 都 是 此 类 指令 ， 它 们 在 原理 上 是 修改 寄存 器 CS 和 了 P 的 值 ， 将 CPU 导向 新 的 位 置 。 

call 指令 用 来 执行 一 段 新 的 代码 ， 让 CPU 踏 上 新 的 征途 ， 为 避免 这 是 一 条 不 归 路 ， 还 需要 返回 指令 
ret 来 帮忙 。 

生活 中 ， 我 们 去 某 个 地 方 办 事 、 游 玩 ， 虽 然 表 面 上 看 一 下 子 就 直 奔 主题 ， 乘 坐 各 种 交通 工具 直接 过 去 
了 ， 但 其 实在 大 家 的 潜意识 中 ， 去 某 个 地 方 之 前 ， 是 先 考虑 了 怎样 才能 回来 ， 去 之 前 就 已 经 想 好 了 回来 的 
路 ， 如 果 您 没有 考虑 如 何 回来 的 话 ， 您 这 份 不 霸 的 洒脱 还 是 很 值得 我 向 往 的 。 

所 以 ， 我 觉得 在 讲述 call 之 前 ， 大 家 最 好 要 了 解 下 ret。 

call 指令 调用 一 个 函数 时 ， 发 生 了 什么 昵 ? 压 入 返回 地 址 ， 为 将 来 能 够 回来 埋 下 伏笔 。call 指令 不 负 
责 “ 回 来 ” 它 只 负责 如 何 “去 ” 回来 的 工作 要 交 给 ret。 

call 指令 不 是 一 去 不 回头 ， 它 执行 完 目标 函数 后 还 是 要 回来 的 ， 所 以 它 得 提前 把 回来 的 路 〈 返 回 地 址 ) 记 
好 了 ， 对 于 CPU 来 说 ， 它 是 靠 程 序 计数 器 PC 来 指 路 的 ， 所 以 路 就 在 PC 中 。 凡 是 调用 call 指令 ，CPU 就 要 
找 地 方 把 返回 地 址 存 起 来 以 备 将 来 函数 执行 时 有 路 可 以 返回 。 在 哪里 保存 返回 地 址 合适 呢 , 这 需要 考虑 函数 舱 
套 调 用 的 问题 。 由 于 函数 有 可 能 舱 套 调用 ， 也 就 是 随 着 函数 调用 的 层 数 增加 ， 会 有 更 多 的 返回 地 址 需要 保存 。 
用 宝贵 且 有 限 的 寄存 器 来 保存 无 数 的 返回 地 址 ， 这 显然 是 不 现实 的 。 内 存 空间 相对 是 无 限 的 , 在 内 存 中 保存 数 
量 未 知 的 返回 地 址 比较 理想 。 栈 这 种 数据 结构 是 再 适合 不 过 的 ， 利 用 其 后 进 先 出 的 特性 ， 可 以 保证 函数 嵌 套 调 
用 及 骨 套 返回 顺序 的 一 致 性 , 而 且 其 空间 只 受 限 于 内 存 大 小 。 于 是 在 内 存 中 创建 这 样 一 个 数据 结构 就 完美 地 解 
决 了 这 个 问题 ， 所 以 CPU 在 栈 中 保留 程序 计数 器 PC 的 值 。 在 x86 中 的 程序 计数 器 是 CS: IP， 具 体 保留 卫 
部 分 还 是 CS 和 卫 都 保留 ， 是 要 看 目标 函数 的 段 基 址 是 否 和 当前 段 基 址 一 致 ， 也 就 是 说 ， 是 否 跨 段 访问 了 。 
保留 的 这 个 返回 地 址 并 不 是 给 call 指令 用 的 ，call 指令 不 会 自动 回来 ， 它 只 会 留 下 返回 地 址 后 并 踏 上 新 的 
征程 ， 返回 地 址 是 给 ret 或 retf 指令 准备 的 ， 也 就 是 说 , 在 目标 函数 中 必须 有 这 两 个 指令 之 一 ，CPU 才能 回来 。 

ret (Cretum ) 指令 的 功能 是 在 栈 顶 〈 寄 存 器 ss: sp 所 指向 的 地 址 ) 弹出 2 字 节 的 内 容 来 替换 卫 寄存 器 ， 
注意 ， 我 这 里 说 的 是 “内 容 ”，ret 指令 不 管 里 面 的 内 容 是 不 是 地 址 ， 它 只 负责 把 当前 栈 顶 处 的 内 容 弹 出 栈 
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E 掌 握 和 理解 ， 本 书 强调 实践 ， 纸 上 谈 兵 可 
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是 从 高 地 址 往 低地 址 发 

retf (return far) 是 从 栈 顶 取得 4 字 节 ， 栈 顶 处 的 2 字 节 | 
CS 寄存 器 。 同 样 ，retf 也 不 会 去 检查 从 栈 顶 往 上 的 4 字 节 内 容 是 不 是 1 
们 ， 并 将 它们 分 别 载 入 代码 段 寄 存 器 CS 和 指令 指针 寄存 器 IP， 























并 用 它 为 IP 寄存 嚣 赋值。 至 于 内 容 的 正确 























自己 控制 。 





性 应 该 由 程序 员 




















j 换 段 基 址 ， 属 于 近 返 回 。 既 然 我 们 称 之 为 弹出 栈 ， 也 就 是 说 ret 指 
展 ， 所 以 被 回收 的 栈 顶 空间 应 该 是 使 sp 指针 值 变 大 ， 故 ret 指令 会 使 sp 指针 +2。 
j 来 蔡 换 IP 寄存 器 ， 另 外 的 2 字 节 用 来 蔡 换 





















































ret 只 置换 了 IP 寄存 器 ， 也 就 是 说 ， 
令 也 要 负责 维护 栈 顶 指针 ， 












































视 移 地 址 和 段 基 址 ， 它 只 负责 弹出 它 




















程序 

















说 ， 在 用 ret 或 retf 之 前 ， 程 序 员 应 该 知道 此 时 
换 了 ， 说 明 这 属于 远 返 回 。 
小 结 一 下 ，ret 和 retf 的 
ret 和 call 指令 是 需要 配合 使 用 











栈 顶 中 的 数据 是 什么 ， 











retf 指令 也 要 负责 维护 栈 项 指针 ， 所 以 retf 
区 别 便 是 ret 用 于 近 返 回 ，retf 用 于 远 返 回 。 
































call 的 种 类 从 大 方向 上 分 也 就 两 和 


call 和 ret 是 一 对 配合 ， 用 于 近 调 ) 








的 ， 注意 了 ， 是 ret 要 以 call 为 主 ， 
Fh， 一 是 近 调 用 ， 另 一 个 是 远 调 用 。 



































如 果 call 是 近 调 | 


1， 在 


























处 偏 要 用 retf，CPU 也 不 会 报错 ， 
用 途 应 该 是 什么 。 
器 的 值 ， 也 破坏 了 栈 ， 随 后 便 会 出 错 。 











的 值 其 
























































和 近 返 回 ，call far 和 retf 是 一 对 配合 ， 用 于 远 调 ) 
标 函 数 中 就 要 用 ret 来 返回 ， 因 为 近 调 用 的 call 只 在 栈 中 留 下 了 2 字 节 的 返 
可 地 址 (IP 寄存 器 的 值 )，ret 只 是 从 栈 顶 取得 2 个 字 节 作为 偏 移 地 址 载 入 IP 寄存 器 。 换 名 话说 ， 如 果 此 
寻 为 CPU 不 知道 之 前 压 入 栈 的 是 什么 内 容 ， 从 而 无 法 保证 从 栈 中 弹出 
retf 会 从 栈 中 弹出 4 个 字 节 ， 各 2 个 字 节 用 来 替换 CS 和 IP， 破 坏 了 原 CS 寄存 





员 负 责 栈 中 数据 的 正确 性 。 换 句 话 
能 不 能 用 作 返 回 地 址 。 段 寄存 器 都 
指令 会 使 sp 指针 +4。 



































根据 call 的 种 类 来 选择 ret 或 retf。 























和 远 返 回 。 故 : 















































如 果 call 是 远 调 ) 





是 在 























段 基 址 和 段 内 偏 移 地 址 ，retf 寺 

















只 月 














标 函 数 中 就 要 用 retf (ret far) 来 返回 ， 因 
站 令 只 会 从 栈 中 弹出 2 字 节 的 偏 移 地 址 和 


























3.2.7” 实 模式 下 的 call 











































































































为 远 调用 的 call 指令 在 栈 中 留 下 了 
2 字 节 的 段 基 址 。 同 理 ， 如 果 此 时 


















































有 ret 来 返回 ，CPU 也 不 会 报错 ， 但 栈 少 弹 出 了 一 个 值 ， 已 经 破坏 了 ， 其 后 的 运行 状况 不 可 知 。 


另 一 个 是 call。 它 们 的 区 别 是 jmp 
之 后 再 也 


























































































































来 的 情况 ， 当 然 它 























在 8086 处 理 器 中 ， 有 两 个 指令 用 于 改变 程序 流程 。 一 个 是 jmp， 
属于 一 去 不 回头 地 去 执行 新 的 代码 ， 适 用 环境 是 “交接 ” 如 我 们 的 BIOS 将 接力 棒 交 给 MBR， 
用 不 到 BIOS 其 余 的 代码 。 程 序 中 有 执行 主线 时 ，call 指令 用 于 执行 完 一 段 分 支 后 再 匠 
能 回来 还 是 需要 用 ret 或 retf 来 配合 。 

call， 意 为 呼叫 、 调 用 。 在 汇编 言 中 ， 用 call 命令 实现 一 个 函数 的 调用 。 

在 8086 处 理 器 中 ， 也 就 是 我 们 所 说 的 实 模式 下 ，call 指令 调用 函数 有 四 种 方式 。 

下 面 所 说 的 前 两 种 是 近 调 用 ， 后 两 种 是 远 调 用 。 


下 面 开始 介绍 第 一 种 函数 调用 方式 。 
。 16 位 实 模式 相 
方式 中 ， 强 调 了 两 个 概念 ， 一 个 是 近 ， 另 一 个 是 相对 。 
标 函 数 和 当前 代码 段 是 同一 个 段 ， 即 在 同一 个 64KB 的 空间 内 ， 所 以 只 给 








这 种 调 
何谓 近 ? 
出 段 内 偏 移 
强调 一 下 ， 



































名 字 上 和 “ 近 


种 数据 类 型 转换 ， 














call 指令 所 调用 
也 址 就 好 了 ， 不 用 给 出 段 基 址 。 
“ 近 ” 就 是 指 在 同一 段 内 ， 不 用 切换 段 ， 不 




















对 近 调 用 
















































































] 换 段 基 址 ， 只 需 给 出 段 内 偏 移 地 址 。 



































何谓 相对 ? 














指令 格式 是 call near 立即 数 地 址 ， 注 意 啦 ， 此 形式 ! 
指令 是 个 3 字 节 指令 ，0xe8 是 此 操作 的 操作 码 ， 占 1 字 节 ， 剩 下 2 字 节 便 是 操作 数 。 





”有 关 的 调用 就 可 以 用 关键 字 near 来 修 
和 数据 类 型 伪 指 令 word 作 





1 于 是 在 同 






































相同 。near 






































5，near 表示 在 内 存 或 寄存 器 中 取 2 字 节 ， 这 是 一 
可 以 省 略 ，nasm 编 
个 代码 段 中 ， 所 以 只 要 给 出 目标 函数 的 相对 地 址 即 可 。 

的 操作 数 是 立即 数 。 其 中 的 near 可 以 省 略 。 此 





译 器 默认 在 地 址 处 取 2 字 节 。 
























































指令 中 的 立即 数 地 址 可 以 是 被 调用 的 函数 名 、 标 号 、 立 即 数 ， 函 数 名 同 标号 一 样 ， 它 只 是 地 址 的 人 性 





化 表示 方法 ， 最 
后 的 操作 数 是 目 

















被 编译 器 转换 为 一 个 实际 数字 划 
标 函 数 proc_name 的 绝对 地 址 ， 在 编 




















也 址 ， 如 call near prog_name。 不 过 千 万 不 要 误会 
译 后 的 机 器 码 的 操作 数 中 ， 它 是 call 指令 相对 于 目标 








译 














地 址 的 偏 移 量 ， 是 个 地 址 差 。 也 就 是 说 ， 假 如 proc_name 被 编译 器 分 配 的 地 址 是 0x1234，call 指令 最 终 的 
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操作 数 并 不 是 0x1234， 而 是 目标 地 址 减 去 当前 call 指令 的 地 址 ， 





























结果 才 是 call 相对 近 


call 指令 是 





周 用 指令 的 操作 数 ， 下 
要 占用 内 存 空间 的 ， 这 里 我 们 解释 的 是 相对 近 调 











掉 给 您 分 析 一 下 。 























其 中 e8 是 操作 码 ， 表 示 相 对 近 调 用 

















得 的 差 有 


























下 减 去 此 指令 的 长 度 3， 最 终 的 


， 此 指令 机 器 码 是 e8llhh， 占 用 3 字 节 。 


， 卫 表示 操作 数 的 低位 ，hh 表示 操作 数 的 高 位 ，hhll 表示 跳 转 目 标 为 4 








位 地 址 。 由 于 x86 平台 是 小 端 字 节 序 ， 故 写成 了 llhh， 即 高 位 在 高 地 址 ， 低 位 在 低地 址 。 这 4 位 
前 call 指令 的 地 址 ， 所 和 
用 的 机 器 码 大 小 是 3 字 节 ， 故 要 减 去 3)， 最 终 的 结果 便 是 call 指令 








有 


相对 增 量 , 请 问 这 是 如 何 得 出 的 呢 ? 
call 指令 机 器 码 的 大 小 (此 


中 的 操作 数 ， 即 与 目标 地 二 












































能 直接 被 CPU 使 用 
在 实际 执行 中 还 要 将 此 
的 实例 中 会 给 大 家 演示 这 一 点 。 

既然 是 相对 量 ， 就 有 正 负 之 分 。 
标 地 址 上 





(4 直接 ” 训 









































里 ， 





类 相对 近 
上 的 相对 地 址 增 量 。 
由 于 此 操作 数 并 不 是 目标 函数 的 
是 操作 数 以 立即 
兽 量 还 原 成 绝对 地 址 。 


当前 call 指令 地 址 小 ， 地 址 相对 量 便 为 负数 。 








首先 用 




















四 
| 








目标 函数 的 地 址 减 去 当 




















色 对 地 址 ， 只 是 相对 于 



































所 以 此 相对 近 j 





图 























如 果 目 标 地 址 比 当前 call 寺 





















































位 大 小 的 空间 ， 所 以 ， 正 负数 的 范围 











是 -32768 一 32767 。 


局 
































也 址 是 个 
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的 差 再 


有 减 去 此 





























周 





外 令 地 址 大 ， 地 址 相对 量 则 为 正 数 。 如 果 目 





1 此 可 见 ， 操 作 数 是 个 有 符号 数 。 

















标 函数 地 址 的 相对 增 量 ， 所 以 此 操作 数 并 不 
数 的 形式 给 CPU 后 ，CPU 拿 来 就 用 ， 不 用 转换 )。CPU 
并 不 能 称 为 “直接 ”相对 近 j 





用 , 在 下 面 

















1 于 段 是 个 16 





当 在 程序 中 调用 某 函 数 时 ， 如 call proc_name，proc_name 是 某 函 数 名 ， 假 如 call 指令 所 在 的 地 址 是 





0x9, 而 我 们 事先 又 知道 proc_name 所 在 的 地 址 是 0x12, 所 以 故 做 聪明 地 把 函数 调用 写成 call 0x12 的 
] ， 它 被 编译 器 拿 来 算 














以 为 0x12 便 是 call 的 操作 数 了 ， 其 
1 


字 节 序 的 原因 
































低位 在 低地 址 ， 


》 


局 移 量 了 。 此 处 的 call 是 相对 近 转 移 ， 机 器 码 




















实 这 样 理 解 是 错误 的 。 那 0x 


FF 2 守 4 
喇 3 子 


-3 























址 转换 成 相对 
形式 ， 这 是 硬件 设计 的 问题 ， 
地 址 或 绝对 地 址 只 是 个 数字 , 从 数 
















































































工程 师 
值 | 











12 有 











地 址 呢 ? 这 是 和 硬件 相关 的 内 容 了 ， 在 同一 段 内 的 函数 调用 《〈 近 

















门 只 设计 了 这 一 种 形式 ， 要 



































想 


































































































“相对 近 
上 无 法 区 分 这 是 哪 类 地 址 ,硬件 一 律 认 为 给 它 的 操作 数 就 是 相 


没 ? 当 然 有 
最 终 call 的 操作 数 是 0x12-0x9-3=0x6， 
高 位 在 高 地 址 ， 进 而 最 终 的 操作 码 是 e80600。 为 














调 
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]” 就 要 迁就 硬件 ，1 
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使 输入 的 是 绝对 地 址 )。 要 想 让 CPU 工作 正确 ， 就 要 确保 给 它 输入 的 是 真正 的 相对 地 址 。 如 果 让 开发 人 员 自 
己 算 相 对 地 址 偏 移 量 ， 这 太 不 人 性 化 了 ， 真 要 这 样 的 话 ， 我 想 这 门 开发 语言 肯定 无 法 流行 ， 所 以 编译 器 在 编 
译 阶段 悄悄 帮 着 开发 人 员 把 函数 地 址 转换 成 适合 此 指令 的 形式 ， 这 是 一 个 好 的 编译 器 的 基本 素养 。 
说 了 半天 ， 可 能 您 还 是 对 我 所 说 的 持 怀 疑 不 确信 的 态度 。 咱 们 还 是 拿 数据 说 话 靠 谱 ， 让 我 们 来 证 明 以 
上 是 对 的 。 
拿 下 面 这 个 源码 做 例子 。 
1call.S 
1 call near near proc 
2 jmp $ 
3 addr dd 4 
4 near proc: 
5 mov ax， 0x1234 
6 ret 
这 个 函数 很 简单 ， 完 全 是 演示 之 用 ， 无 实际 意义 ， 就 是 在 第 一 行 调 用 了 个 函数 ， 函 数 名 叫 near_proc。 
此 处 演示 的 是 近 调用 ， 所 以 “显示 地 ”加 了 个 near， 其 实 不 加 也 是 被 默认 处 理 为 近 调 用 的 。 
编译 ，nasm -o call.bin call.S 生成 的 二 进 制 文件 是 call.bin。 
让 我 们 直接 查看 call.bin 文件 中 有 什么 ， 用 xxd 命令 就 可 以 啦 。xxd 命令 是 用 来 逐 字 节 查 看 文件 的 ， 
无 论 什么 文件 在 它 面前 都 无 所 授 形 ， 简 直 就 是 Linux 界 的 照妖镜 。 由 于 这 个 命令 咱们 今后 会 常用 ， 所 以 为 












































更 方便 使 








j， 我 将 它 封装 成 了 个 脚本 ， 给 大 家 贴 出 来 看 看 。 





[work@localhost book]$ cat ~/tool/xxd.sh 


#usage: 


sh xxd.sh 文件 起 始 地 址 长 度 
xxd -u -a -9g 1 -s $2 -1 $3 $1 














#-u use upper case hex letters. Default is lower case. 
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# 

#-a | -autoskIP 

# toggle autoskIP: A single '*' replaces nul-lines. Default off. 

# 

#-g bytes -groupsize bytes 

# separate the output of every <bytes> bytes (two hex characters or eight bit-digits each) 
by a whitespace. Specify -g 0 to 

# suppress grouping. <Bytes> defaults to 2 in normal mode and 1 in bits mode. Grouping does 
not. applYy -to pOostserTPt. Or 

# include style. 

# 

#-c cols | -cols cols 

# format <cols> octets Per line. Default 16 (-i: 12, -ps: 30, -b: 6). Max 256. 


# 
#-s [+] [-] seek 

# start at <seek> bytes abs. (or rel.) infile offset. + indicates that the seek is relative 
to the current stdin file position 

# (meaningless when not reading from stdin). - indicates that the seek should be that many 
characters from the end of 

# the input (or if combined with +: before the current stdin file position). 

# Without -s option, xxd starts at the current file position. 












































L 体 参数 我 就 不 翻译 了 ， 直 接 用 这 个 脚本 就 行 ， 大 家 把 参数 自己 琢磨 下 。 
脚本 的 使 用 方法 是 :“sh 脚本 被 查看 的 文件 起 始 地 址 长 度 ”。 
通过 11 -b call.bin， 得 到 文件 大 小 是 13 字 节 ， 于 是 执行 : 
sh 一 /tool/xxd.sh call.bin 0 13 回 车 ， 以 下 这 一 行 是 xxd 命令 的 输出 。 
0000000: E8 06 00EB FE 04 0000 00B83412C3 ss 4.. 
以 上 输出 中 , 冒号 左边 的 0000000 是 地 址 , 这 个 不 重要 , 看 冒号 右边 的 内 容 。 这 些 内 容 全 是 机 器 码 , e80600 
代表 相对 近 调 用 ， 操 作 数 是 0x06。 各 指令 机 器 码 都 有 自己 的 格式 ， 从 而 确定 了 指令 。 例 如 ， 当 CPU 遇 到 
时 ， 就 知道 这 是 相对 近 调 用 指令 ， 其 操作 数 是 个 2 字 节 的 数字 ， 总 共 长 度 是 3 字 节 。ebfe 是 jmp $ 的 机 器 
码 ，eb 是 操作 码 ，0xfe 是 操作 数 ， 由 于 操作 数 是 有 符号 数 ， 所 以 其 表示 -2， 而 不 是 234。04000000 是 定义 的 4 
字 节 数据 addr dd 4。b83412 这 3 个 字 节 中 b8 是 mov 的 操作 码 ,3412 是 立即 数 操作 数 , 对 应 的 是 mov ax, 0x1234。 
值得 注意 的 是 同样 的 指令 ， 由 于 寻 址 方式 不 同 ， 编 译 产生 的 机 器 码 也 是 不 同 的 。 不 要 以 为 mov 的 机 器 码 一 律 
是 b8， 这 里 是 因为 其 操作 数 是 立即 数 的 原因 ， 若 是 其 他 寻 址 方式 操作 码 就 会 变 的 ， 这 就 是 CPU 可 以 通过 操作 
码 来 识别 操作 数 类 型 和 数量 的 缘由 。 寻 址 方式 也 跟 大 家 说 过 啦 ， 这 里 我 就 不 给 大 家 举 更 多 mov 的 例子 ， 是 时 
候 大 家 自行 号 几 个 实践 了 ，mov 指令 通过 组 合 不 同 的 寻 址 方式 ， 会 产生 不 同 的 操作 码 。 
其 实 这 样 看 还 不 是 很 清楚 ,因为 大 家 有 可 能 不 知道 各 操作 码 需要 的 操作 数 大 小 ， 从 而 无 法 判断 指令 的 
宽度 。 这 好 办 ,咱们 上 bochs 看 ,让 其 边 执行 边 反 汇编 给 咱们 看 结果 。 下 面 粗 体 的 文件 是 我 加 的 注释 说 明 。 
<bochs:1> b 0x900 我 把 call.bin 放 在 了 内 存 0x900 处 , 所 以 在 此 处 设置 断 点 


<bochs:2> c 

(0) Breakpoint 1, Ox00000900 in ?? () 

Next at t=17827831 

(0) [Ox000000000900] 0000:0900 (unk. ctxt): call .+6 (0x00000909) ; e80600 
<bochs:3> trace on 用 trace on 打开 了 反 汇 编 , 每 执行 名 都 会 反 汇 编 

Tracing enabled for CPUO 

<bochs:4> n 

(0) . [17827831] [0x000000000900] 0000:0900 (unk. ctxt): call .+6 (0x00000909) 
e80600 
上 面 的 cal1l 指令, 当前 地 址 是 0x900。 其 操作 数 是 正 6, 这 是 相对 地 址 , 括号 中 的 是 目标 地 址 的 真实 地 址 :0x909。 
左边 的 e80600 是 call 相对 近 调 用 的 机 器 码 , 3 字 节 大 小 

这 说 明 call 指令 的 操作 数 确实 是 相对 地 址 , 即 0x909-0x900-3=0x6 
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(0jcd 2827832] 0x000000000909] .0000350909 unik, ctxt}s mov ax; ‘0x1234 2- D83412 
左边 b83412 是 上 面 mov 的 机 器 码 




















(OFm lL?8278331. IQxQ00000000900T, 000000906 mk cExt ys Let 天 
左边 c3 是 ret 的 机 器 码 








Next at t=17827834 
(0) [Ox000000000903] 0000:0903 (unk. ctxt): jmp .-2 (0x00000903) ; ebfe 
<bochs:5> 
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b, 操作 数 是 0xfe, 即 -2。 
， 当前 指令 地 址 0x903 加 上 上 


jmp 的 操作 码 是 0xe 
此 处 的 jmp 是 短 转 移 
循环 往复 








己 机 器 码 的 





























无 条 件 跳 转 jmp 中 有 介绍 。 

















记 任 ) 











这 下 大 家 相信 了 吧 ， 确 实 是 用 的 相对 地 址 ， 程 序 中 用 的 绝对 地 址 都 


址 转换 成 相对 地 址 啦 。 


括号 的 〈《0x00000909)，0x909 是 call 指令 的 目标 函数 


法 是 : 当前 的 IP 指引 
看 ， 虽 然 操 作 数 是 地 址 增 
说 过 的 ， 不 能 直接 给 CPU 用 ， 所 以 此 调 





CPU 的 航线 立马 被 


不 知道 大 家 仔细 想 过 这 人 句 指 令 没 有 ? 
0000:0900 (unk. ctxt): call .+6 (Ox00000909) 




















大 小 2 字 节 , 再 加 上 操作 数 -2, 又 回 到 了 jmp 的 地 址 0x903.， 

















日 .和 八 
是 给 


程序 员 看 的 , 编译 器 已 经 将 地 





;e80600 


0000:0900 表示 有 段 寄存 器 CS 为 0， 段 内 偏 移 地 址 是 0x0900。call .+6 是 相对 近 调 用 ，+6 是 操作 数 。 带 











的 绝对 地 址 。e80600 是 机 器 码 。 












































call 相对 近 调 用 中 的 操作 数 0006 并 不 是 被 CPU 直 
+ 操作 数 + 机 器 码 大 小 = 目标 函数 乡 


量 ， 但 最 终 


~) 




















Ey 















































CPU 还 是 要 想 办 法 ; 
方式 不 能 称 为 “直接 ”相对 近 调 





接 用 了 ，CPU 又 将 其 恢复 成 绝对 地 址 啦 ， 恢 复 的 方 
色 对 地 址 ， 也 就 是 0x900+0x06+0x3=0x909。 所 以 您 
各 其 转换 为 绝对 地 址 来 寻 址 。 这 就 是 我 在 前 面 
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call 相对 近 调 








改变 到 目标 地 址 处 。 


] 发 生 时 , CPU 将 当前 IP 寄存 器 值 压 入 栈 , 再 提 





巴 上 面 计 算出 的 绝对 地 址 载 入 IP 寄存 器 ， 





























另外 ， 这 个 输出 的 信息 确实 太 多 了 ， 影 响 了 大 家 的 












































阅读 。 但 我 还 是 想 让 大 家 看 看 虚拟 机 bochs 输出 的 原 








貌 ， 这 样 便于 大 家 认识 调试 信息 ， 在 以 后 的 例子 里 为 避免 排版 太 乱 ， 我 就 只 拣 重 点 信息 啦 。 























下 面 是 第 二 种 函数 调用 方式 。 
16 位 实 模式 间接 绝对 近 调 用 
































我 就 喜欢 在 名 字 上 分 析 关 键 字 ， 














这 里 的 关键 字 是 16、 人 位、 间接、 绝对 、 近 、j 








周 用 。 哈哈 ， 原 谅 我 ， 











就 像 老 师 





期 末 给 大 家 画 重点 一 样 











位 相对 近 调 ) 





j” 相 比 ， 这 种 方式 的 区 别 是 间接 各 
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LL 入 元 











Ea 








色 对 。 





后 ， 发 现 整 本 书 都 是 重点 。 咱 


数 的 形式 出 现 。 


给 出 段 基 址 。 
站 令 的 一 般 形 式 是 “call 寄存 器 寻 址 ”或 “call 内 存 寻 址 ” 如 call ax，call [0x1234]。 不 同 的 指令 





“间接 ”是 指 目标 函数 的 




















“绝对 ”是 指 目标 函数 的 地 址 是 绝对 
还 有 一 点 ， 这 也 是 近 调 用 ， 即 只 能 调 


也 址 ， 不 像 “ 









































也 址 并 没有 直接 给 出 ， 地 址 要 么 在 寄存 器 中 ， 要 么 在 内 存 中 ， 


j 同 一 个 代码 段 ， 

















们 只 抓 更 重点 的 ， 和 上 一 个 “16 
先 看 看 是 如 何 体现 这 两 词 的 。 























总 之 不 以 立即 





16 位 相对 近 调 用 ”中 的 那样 是 相对 地 址 。 
的 函数 ， 依 然 是 只 给 出 段 内 偏 移 就 好 啦 ， 不 用 





















































Sy 
所 


式 对 应 不 同 的 操作 码 ,“call 内 存 寻 址 ”对 应 的 操作 码 是 企 6， 机 器 码 是 企 16+16 位 内 存 地 址 。 机 器 码 除 了 
与 寻 址 方式 有 关外 ， 还 和 寄存 器 名 称 有 关 ， 如 “call ax” 的 机 器 码 是 fd0,“call ex” 的 机 器 码 是 fdl， 其 


4 








也 形式 的 机 器 码 或 操作 码 不 单独 列 出 。 
名 称 中 和 “ 近 ” 有 关 的 就 可 以 用 near。near 也 可 以 和 











此 调用 形式 也 是 近 调 用 ， 调 用 
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晓 。 由 于 





是 近 调 


的 值 。 














?》 

















































































































并 没有 路段， 所 以 call 指令 只 要 保留 卫 寄存 器 的 值 就 好 了 , 将 其 压 入 栈 后 ， 再 用 新 的 偏 移 地 址 蔡 换 他 
我 对 任何 事物 都 是 先 怀 疑 ， 经 过 验证 之 后 才 放心 接受 ， 为 了 验证 上 面 说 的 可 行 ， 还 是 拿 例子 说 话 。 上 
测试 用 例 啦 ， 以 下 代码 纯粹 演示 ， 无 实际 用 途 ， 大 家 不 要 浪费 时 间 琢 磨 代码 背后 的 意思 。 
2call.S 
1 section call test vstart=0x900 
2 mov word [addr], near proc 
3 call [addr] 
4 mov ax, near proc 
4 如 及 
6 jmp $ 
7 addr dd 4 
8 near proc: 
9 mov ax 0x1234 
10 ret 
这 里 就 演示 call 的 间接 近 调 用 用 法 , 所 以 大 家 关注 第 3 行 和 第 5 行 就 好 啦 。 第 3 行 是 通过 内 存 来 调用 ， 









































第 5 行 是 通过 寄存 器 来 调 
例 要 求 放 在 内 存 的 0x900 处 ,所 以 加 了 个 “vstart=0x900”。vstart 是 要 定义 在 section 后 国 
键 字 定 义 了 一 个 节 ， 为 了 表示 节 名 不 是 什么 凶 
在 此 位 置 ， 以 后 i 
7 行 的 addr 是 个 4 字 节 的 变量 ，] 
2 行 有 个 关键 字 “word” 这 个 是 


关 





发 


这 也 是 高 级 语言 中 数据 类 型 的 作用 。 
CPU 在 此 内 存 3 











和 A 


第 
现 没有 ， 第 



































也 址 处 连续 


























jj。 好 吧 ， 我 知道 你 看 到 第 1 行 就 间 间 不 乐 了 ， 那 我 挡 带 着 说 下 。 





























loader 时 您 就 清楚 了 。 



































来 存 



































奇 的 东西 




























































































读 2 











116 位 。 


因为 本 测试 用 
| 的 ,所 以 用 了 section 
， 我 随便 起 了 个 名 字 叫 call_test。 至 于 为 什么 放 


渚 函数 near_proc 的 地 址 ， 以 供 第 3 行 的 call 来 调用 。 大 家 
来 告诉 CPU 一 次 要 读 写 多 少 字 节 的 。 就 拿 第 
“mov word [addr], near_ proc”，near_proc 是 个 函数 名 ， 本 身 是 个 地 址 ， 在 编译 阶段 就 会 被 检 换 为 数字 
个 数字 的 宽度 是 不 定 的 ， 比 如 0x18 是 0x0018， 还 是 0x00000018 呢 ? 这 涉及 到 读 写 多 少 个 字 节 的 问 
于 此 时 是 在 16 位 的 实 模式 下 ,我 们 要 用 16 位 的 地 址 ， 必 须 
字 节 就 够 了 ， 所 以 用 关键 字 word 来 表示 2 字 节 , 


2 行 来 说 ， 


这 
项 ， 


得 告诉 


nm 





























上 面 已 经 演示 用 xxd 命令 来 查看 二 进 制 文件 内 容 


看 ， 这 样 才 有 说 服 力 。 下 寿 
乱 太 多 了 ， 怕 大 家 越 看 越 站 











以 下 指令 ， 








mov word ptr ds: 


人 706d41091509 




















涂 ， 所 以 这 个 





Ox911, 0x0915 ; 


























自己 验证 ， 
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们 还 是 实 









































是 实际 执行 的 代码 ， 这 是 从 bochs 中 整理 出 来 的 ， 
列子 中 去 掉 了 无 关 的 信息 。 
， 从 上 到 下 是 2call.S 依次 执行 的 顺序 








一例 池 














// 


call word 
ff£f161109 
// 























mov ax, 
b83412 


Lat 


yo od 寻 3 


内 存 寻 址 ，call 操作 码 是 ff16， 操 


Ox1234 


c3//reg 机 器 码 是 c3 


mov ax, 


b81509 


所有 让 上 上 二 这 
fEfd0 


// 这 依然 是 near_proc 的 函数 体 ， 再 次 被 执行 了 


mOV ax, 
Fe 


jmp 


Ox0915 


Ox1234 


.-2 (0x0000090f) // 虽 





0x911 
作 数 是 0x0911。call 指 


// 函 数 内 的 指令 ， 无 关 紧 要 
// 上 面 指令 的 机 器 码 


// 从 函数 中 返 下 



































话说 上 边 机 器 码 好 长 ， 寻 址 方式 变 了 ，mov 的 操作 码 变 成 了 c706。 








令 在 内 存 //0x0911 处 取得 








标 函 数 地 址 。 











//0x0915 是 函数 near_proc 的 地 址 


// 现在 装 入 ax 寄存 器 
// 这 是 上 


//b8 是 mov 















































// ax 中 是 


// 操作 码 是 ff， 操 作 数 是 d0 














面 指令 的 机 器 码 ， 很 清楚 是 吧 ， 
的 操作 码 ，1509 是 操作 数 ， 这 是 绝对 地 址 


标 函 数 的 地 址 ， 通 过 寄存 器 来 寻 址 


的 约定 





// qd0 是 指 ax 寄存 器 ， 这 是 指令 格式 














次 








b83412 
c3 











到 程序 主线 ， 死 循环 暂停 











ebfe// jmp-2 的 机 器 码 ，eb 是 短 转 移 Jmp，0xfe 是 -2 


> 
yy 于 
注 忆 ， 





size specification ignored ”。 
译 的 机 器 码 依然 是 正确 的 。 
数据 类 型 伪 指 令 有 byte、word、dword、qword 等 ， 它 们 用 在 操作 数 前 








这 和 C 语言 中 





寄存 器 寻 址 中 ， 若 在 寄存 器 名 称 前 添加 数 和 





的 数据 类 型 转换 是 一 个 道理 。 





























中 类 型 伪 指 令 ， 编 译 器 会 报警 告 :“warning: 











际 运行 看 
的 输出 信 





register 




















[iT ET 
el ‘已 、 


警告 信息 字面 





思 是 寄存 器 大 小 被 忽略 。 只 是 提示 和 警告， 不 影响 编译 ， 编 




















都 可 以 用 数据 类 型 伪 指 令 。 


















































， 相 当 于 做 数据 类 型 强制 转换 ， 





在 汇编 语言 中 ， 无 论 操 作 数 是 立即 数 、 寄 存 器 ， 或 是 内 存 ， 


near 的 意思 同 数据 类 型 伪 指 令 word 一 样 ， 是 指 在 内 存 地 址 处 取 2 字 节 内 容 ， 或 者 将 操作 数 强 制 转换 








near 若 加 在 寄存 器 前 面 
类 型 转换 。 由 于 near 的 范围 可 正 可 负 ， 是 个 有 符号 








为 2 字 节 。 可 以 认为 像 near、short、far， 这 些 用 在 调用 或 转移 中 的 修饰 符 (后 理 





i 会 说 到 )， 其 意 


























据 类 型 转换 。 每 种 数据 类 型 大 小 不 同 , 即 表示 数 的 范围 不 同 























， 用 不 同 的 范围 来 表示 不 同 的 调 | 












































， 如 call near ax， 表 示 在 ax 寄存 器 取 2 字 节 ， 相 当 于 给 ax 寄存 器 中 的 值 做 了 








， 所 以 它 不 等 同 于 数据 类 型 


或 转移 范围 。 


I word。 在 














这 种 情况 
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被 转换 成 


他 类 

















请 
并 


伪 指 令 对 寄存 器 宽度 做 了 
下 面 介 绍 第 三 种 调用 





型 ， 就 发 出 
理 ， 后 面 的 far、short 也 一 档 
如 call far ax 或 call short ax， 乡 








强制 转换 ， 当 然 会 发 出 





方式 。 





个 警 





， 编 译 器 发 现 16 位 的 寄存 器 的 值 精度 被 破坏 了 《寄存 器 中 的 原 值 未 变 ， 被 提取 出 来 的 数 被 强制 





/| 

















口 








a 









































何谓 


























16 位 实 模式 直接 绝对 远 调用 
直接 ? 直接 就 是 操作 数 在 # 














口 





o 


。 如 果 在 寄存 器 前 加 word 就 不 会 有 警 
EF£，far 表示 取 4 字 节 ，short 表示 取 1 字 节 ， 
训 译 器 同样 会 发 出 这 个 警 








转换 了 
告 提 示 ， 如 call word ax。 
[0 果 在 寄存 器 前 用 这 些 数 
根本 原因 是 在 寄存 器 前 添加 数据 类 型 
























































站 令 中 直接 给 出 ， 是 立即 数 。 











这 个 警告 了 。 大 家 愿意 的 话 ， 就 用 省 略 near 的 








区 式 吧 。 




















在 各 种 转移 指令 中 ， 凡 是 包含 “直接 ”， 都 意 指 不 需要 经 过 寄存 器 或 内 存 ， 操 作 数 以 立即 数 




















凡是 包含 “ 运 ”， 
由 于 是 远 调 ) 























即 先 把 老 的 CS 寄存 器 压 入 栈 ， 昨 





的 旅途 。 
指令 的 一 般 形式 是 : 























就 意 指 要 跨 段 啦 ， 


目标 函数 和 当前 指令 不 在 同一 个 段 中 。 








]， 所 以 CS 和 IP 都 要 用 








新 的 , call 指令 将 来 还 是 

















call far 段 基 址 (立即 数 ): 段 内 偏 移 地 址 (立即 数 ) 











| 





对 于 直接 绝对 远 调 / 














还 











i 


直接 

















Gall. 0 far Proc 

jmp $ 

Far proG: 
mov ax, 
retf 


OODPpPp 


0x123 











EF 址 ， 即 偏 移 地 址 在 前 











]，far 也 可 以 不 加 。 操 作 码 是 0x9a。 机 器 码 是 0x9a+2 字 节 的 1 
， 段 基 址 在 后 ， 和 指令 的 调用 天 
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section call test vstart=0x900 





3call.S 


要 回来 的 , 所 以 要 在 栈 ， 
和 把 老 的 卫 寄存 器 压 入 栈 后 ， 用 新 的 CS 和 了 下 寄存 器 替换 ， 从 此 开启 新 





的 形式 给 


ey 
o 














保留 回来 的 路 ， 


























扁 移 地 址 +2 字 节 的 











多 式 是 相反 的 。 








代码 极 


简单 ， 直 

















段 基 址 是 0， 段 内 偏 移 地 





用 retf 来 返回 。 
给 大 家 交待 个 背 





[ 接 看 第 2 行 ， 这 个 函数 调 | 
址 就 是 far_proc。 


景 ， 此 程序 是 由 MBR i 

















j 就 用 了 直接 绝对 远 调 用 的 形式 。 











于 此 类 call 是 远 调 
































]， 所 以 要 和 retf 来 配合 ， 见 第 6 行 ， 





pus 





周 用 的 ， 在 执行 此 程序 前 ，CS 的 值 是 0。 而 我 们 的 call 在 此 处 

















用 的 段 基 址 依然 是 0， 段 基 址 没 变 。 这 能 算 跨 段 吗 ? 其 实 CPU 它 不 判断 新 的 段 值 是 否 和 当前 段 值 一 致 ， 


只 要 重新 加 载 段 寄存 器 ， 


Fe 
[一 
一 








就 加 载 





然 CPU 是 计算 机 的 大 脑 ， 但 它 本 身 是 无 脑 的 ， 没 有 自 








炎 ， 在 它 的 设计 有 逻辑 中 未 力 














它 个 段 基 址 ， 





还 是 让 事实 说 话 吧 ， 上 CPU 看 看 再 说 ， 下 面 






































已 就 接收 ， 才 不 管 是 否 和 当前 段 重复 呢 。 

















入 这 一 
己 的 思维 。 所 以 ， 不 管 当前 段 基 址 是 什么 ， 只 要 给 




















的 思想 ， 给 它 什 么 就 是 什么 ， 虽 





方面 



































依然 是 从 bochs : 























提炼 的 指令 和 机 器 码 ， 由 于 本 段 代 码 














较为 简洁 ， 所 以 在 表 3-3 中 列 出 。 
表 3-3 16 位 直接 绝对 远 调 用 指令 与 机 器 码 对 照 表 
行 号 地 址 指 令 指令 机 器 码 
1 0000: 0900 call far 0000: 0907 9a07090000 
2 0000: 0907 mov ax, 0x1234 b83412 
3 0000: 090a retf cb 
4 0000: 0905 jmp .-2 (0x00000905) ebfe 








见 第 1 行 call far 0000: 0907, call 的 操作 码 是 9a, 操作 数 是 07090000。 在 操作 数 中 , 0709,， 即 0x0907， 





是 偏 移 
一 点 要 切记 。 


女 


A 


和 








90 


也 址 ，0000 是 段 基 址 ， 即 1 


























高 移 地 址 在 前 ， 段 基 址 在 后 。 这 和 汇编 




















外 令 中 给 出 的 顺序 是 相反 的 ， 这 














2、3 行 的 代码 是 far_proc 函数 的 实现 ， 其 所 在 的 绝对 地 址 是 0000: 0907。 


操作 数 中 的 偏 移 地 址 0x907， 这 是 个 绝对 地 址 ， 在 表 3-3 的 地 址 列 中 记录 的 都 是 绝对 地 址 。 那 大 家 看 
看 在 地 址 列 中 的 第 2 行 ， 这 是 far_proc 函数 的 起 始 地址 。0000: 0907 表示 的 地 址 就 是 0x907。 这 与 call 中 


















































































































































的 目标 函数 地 址 吻合 ， 说 明 call 指令 确实 是 通过 目标 函数 的 绝对 地 址 来 调用 的 。 

该 说 说 第 4 种 调用 方式 了 。 

e 16 位 实 模式 间接 绝对 远 调用 

这 和 第 3 种 的 区 别 就 是 “直接 ” 变 “ 间 接 ” 了 。 也 就 是 说 ， 段 基 址 和 段 内 偏 移 地 址 ， 都 不 是 立即 
数 ， 要 么 在 内 存 中 ， 要 么 在 寄存 器 中 。 可 是 ， 段 基 址 和 段 内 偏 移 地 址 都 是 16 位 地 址 ， 用 一 个 寄存 器 


























肯定 是 盛 不 下 了 ， 至 少 得 用 两 个 。 寄 存 器 资源 还 是 非常 珍贵 的 ， 既 然 要 用 两 个 ,干脆 一 个 都 不 用 算 啦 ， 
所 以 这 种 间接 绝对 远 调用 的 形式 ， 不 支持 寄存 器 寻 址 ， 只 支持 内 存 寻 址 ， 即 段 基 址 和 段 内 偏 移 地 址 在 
内 存 中 。 

16 位 间接 绝对 远 调 用 指令 格式 是 : call far 内 存 寻 址 ， 如 call far [bx],call far [0x1234]， 操 作 码 是 ffle。 
在 该 内 存 中 的 内 容 大 小 是 4 字 节 ， 此 内 容 便 是 地 址 ， 前 〈 低 ) 2 字 节 是 段 内 偏 移 地 址 ， 后 (高 〉2 字 节 是 
段 基 址 。 在 此 调用 方式 中 一 定 要 加 个 关键 字 far， 和 否则 就 和 第 2 种 的 间接 绝对 近 调用 一 样 了 。 

新 的 段 基 址 和 段 内 偏 移 既 然 是 在 内 存 中 ， 访 问 内 存 的 话 ， 也 要 按照 “ 段 基 址 : 段 内 偏 移 地 址 ”的 形 
式 去 操作 。 例 如 上 面 的 call far [0x1234]， 由 于 没有 段 跨越 前 缀 ， 则 将 默认 的 段 基 址 寄存 器 ds*16 后 再 与 
0x1234 相 加 ， 得 到 的 和 为 物理 地 址 ， 再 到 该 物理 地 址 处 去 读 取 新 的 偏 移 地 址 和 有 段 基 址 ， 以 该 物理 地 址 
为 起 始 的 2 个 字 节 是 段 内 偏 移 地 址 ， 以 (该 物理 地 址 +2) 为 起 始 的 2 个 字 节 是 段 基 址 。 既 然 是 段 基 址 和 
段 内 偏 移 地 址 都 要 用 新 的 ，CPU 为 了 记得 回来 的 路 ， 先 把 老 的 CS 寄存 器 压 入 栈 ， 再 把 老 的 IP 寄存 器 






































































































































SN 






































































































































































































































































































































压 入 栈 中 保存 起 来 ， 再 用 新 的 段 基 址 替换 CS， 新 的 段 内 偏 移 地 址 替换 卫 。 
以 下 面 代码 为 例 。 
4call.S 
1 section call test vstart=0x900 
2 call far [addqr] 
3 jmp $ 
4 addr dw far proc, 0 
5: Far pro 
6 mov ax, 0x1234 
持 retf 
第 2 行 执行 间接 绝对 远 调用 ，addr 是 个 变量 ， 在 第 4 行 定义 的 ， 其 值 的 低 2 字 节 是 函数 far_proc 的 地 
址 ， 高 2 位 是 0， 即 段 基 址 。 和 call 远 调用 匹配 的 是 retf， 所 以 第 7 行 便 是 retf。 
好 啦 ， 直 接 上 CPU 运行 ， 表 3-4 是 实际 执行 的 指令 。 
表 3-4 call 间接 绝对 远 调 用 与 retf 
行 号 地 址 指 令 指令 机 器 码 
1 0000: 0900 call far ds: Ox906 ffle0609 
2 0000: 090a mov ax, Ox1234 b83412 
3 0000: 090d retf cb 
4 0000: 0904 jmp .-2 (Ox00000904) ebfe 





见 表 3-4 第 一 行 的 机 器 码 ， 
前 面 说 过 了 ， 如 果 call 不 加 














far 的 话 ， 就 同 第 2 利 








用 法 ， 我 们 同样 上 CPU， 对 比 着 看 一 下 call 和 ret 的 操作 码 。 


1 


ONOOD 


section call test vstart=0x900 


call 
jmp $ 
addr dw far proc, 
far proc: 
mov ax, 
ret 


[addqr] 


0x12 


0 


34 





间接 绝对 远 调 用 call 的 操作 码 是 fle，retf 的 操作 码 是 cb。 
Ph 间接 绝对 近 调 用 一 样 了 。 下 面 是 间接 绝对 近 调 用 



































91 





























表 3-5 call 间接 绝对 近 调 用 与 ret 
行 号 地 址 指 令 指令 机 器 码 
1 0000: 0900 call word ptr ds: Ox906 ff160609 
2 0000: 090a mov ax, Ox1234 b83412 
3 0000: 090d ret c3 
4 0000: 0904 jmp .-2 (0x00000904) ebfe 
这 次 表 3-5 中 call 指令 的 操作 码 又 变 成 了 企 6， 这 个 操作 码 前 面 已 经 讲 过 啦 ， 就 是 16 位 间接 绝对 近 























调用 的 操作 码 。ret 指令 变 成 了 c3。 

















只 用 前 7 


3.2.8 


无 条 们 





丙种 近 调 用 的 形式 。 
实 模 式 下 的 jmp 





























实 模 式 下 的 call 指令 用 法 就 这 些 了 , 其 实 咀 们 不 必要 每 一 种 都 掌握 , 咱们 实际 应 用 中 基本 上 不 用 跨 段 ， 





F 跳 转 ， 是 指 “生硬 地 ”改变 CPU 航线 ， 将 程序 流转 移 到 新 的 位 置 。 前 面 说 过 啦 ，CPU 的 航线 


是 段 寄存 器 CS 和 IP， 所 以 jmp 指令 也 是 通过 修改 这 两 个 寄存 器 来 为 CPU 导航 的 。 
jmp 转移 指令 只 要 更 新 CS: IP 寄存 器 或 只 更 新 IP 寄存 器 就 好 了 ， 不 需要 保存 它们 的 值 ， 所 以 跳 到 新 


的 地 址 后 没 办 法 再 回来 ， 它 
和 call 一 样 ， 按 远近 《是 否 跨 段 ) 来 划分 ， 大 致 分 为 两 类 ， 近 转移 、 远 转移 。 不 过 在 转移 方式 中 ， 还 
有 个 更 近 的 ， 叫 短 转移 。 
一 共有 5 类 转移 方式 ， 下 国 
16 位 实 模式 相对 短 转 移 
实在 介绍 call 指令 的 时 








壮 



























































属于 “ 





short 立即 数 地 址 。 


此 处 的 立即 数 地 址 也 可 以 是 标号 ， 




















去 不 回头 ”地 去 执行 新 指令 。 














开始 介绍 第 一 种 。 




















吴 我 们 就 已 经 见识 过 相对 短 转移 了 , 就 是 那个 常用 的 jmp $。 指令 格式 是 jmp 
































对 为 标号 只 是 更 为 人 性 化 的 立即 数 形 式 , 在 编译 阶段 将 被 分 配 为 某 个 地 址 。 




















和 call 指令 一 样 ， 既 然 此 转移 方式 是 “相对 ”， 也 就 意味 着 操作 数 是 个 相对 增 量 ， 所 以 其 有 正 负 之 
分 。 也 就 是 说 操作 数 是 个 有 符号 数 。 相 对 短 转移 的 机 器 码 大 小 是 2 字 节 ， 操 作 码 是 0xeb， 可 知 其 为 1 


字 节 大 小 。 那 操作 数 
体现 在 操作 数 中 ， 即 跳 转 的 范围 只 能 是 1 字 节 有 符号 数 所 表示 的 范围 ， 即 -128 一 127 。 




















占 多 少 字 节 ? 答案 显然 啦 , 是 2-1=1 字 节 。 这 正 是 我 想 说 的 , 相对 短 转 移 中 的 “ 短 ”， 


















































短 转移 ， 意 味 着 只 在 段 内 转移 ， 不 需要 跨 段 ， 所 以 只 需要 偏 移 地 址 就 够 了 ， 当 然 ， 此 偏 移 地 址 并 不 是 





程 是 获得 操作 数 的 逆 运 算 。 








也 不 | 


























对 短 转移 形式 中 也 是 一 样 的 














即 用 跳 转 后 的 目 














标 地 址 减 去 jmp 所 在 地 址 ， 昨 





] 卖 关子 了 ， 还 记得 












































直接 给 出 的 ， 而 是 经 操作 数 转 换 而 成 的 。 话 说 欲 知 如 何 转 换 ， 还 得 先知 道 操作 数 是 怎么 来 的 ， 因 为 转换 过 
































过 前 讲 call 的 相对 近 调 用 形式 时 所 说 的 操作 数 吗 ? 写 在 代码 中 的 操作 数 地 址 











并 不 是 真正 机 器 码 中 的 操作 数 , 是 经 过 编译 器 处 理 成 与 目标 地 址 的 地 址 差 再 减 去 机 器 码 大 小 。 在 jmp 的 相 
, 操作 数 也 要 经 过 编译 器 转换 , 其 转换 方法 和 call 的 相对 近 调 用 是 一 样 的 原理 ， 
标 地 址 减 去 当前 地 址 ,所 得 的 差 再 减 去 此 种 jmp 指令 的 大 小 2 字 节 ,最 终 的 结果 便 是 此 jmp 

















































































































相对 短 转移 的 操作 数 。 
值得 


可 





注意 的 是 和 call 相对 近 调 | 









































一 样 ， 此 立即 数 地 址 (操作 数 ) CPU 并 不 能 直接 用 ， 它 只 是 个 地 址 差 〈 目 
了 减 去 jmp 指令 机 器 码 大 小 2 字 节 )， 所 以 此 相对 短 转移 方式 中 ， 并 没有 “直接 ” 















































二 字 。 而 CPU 是 要 用 绝对 地 址 来 寻 址 的 ， 方 法 是 将 此 jmp 的 操作 数 加 上 寄存 器 下 的 值 ， 再 加 上 2 字 节 ， 所 得 

















的 结果 便 是 目 








是 短 转移 ， 目 




















标 地 址 的 绝对 地 址 ， 这 样 的 地 址 CPU 才能 用 。CPU 把 求 得 的 绝对 地 址 载 入 IP 寄存 器 ， 由 于 这 
标 地 址 和 当前 指令 在 同一 个 段 内 ， 所 以 CS 段 寄 存 器 不 用 修改 ，CPU 就 实现 了 向 新 位 置 的 转移 。 
























































另外 ， 关 键 字 short 是 指明 让 nasm 编译 器 将 jmp 编译 为 相对 短 转 移 的 形式 ， 如 果 条 件 不 满足 short 的 
要 求 , 即 操作 数 大 小 不 满足 -128 一 127 的 范围 , 则 会 编译 失败 。 此 参数 可 以 省 略 , 但 省 略 后 并 不 能 保证 nasm 
依然 把 它 编 译 成 相对 短 转移 的 形式 ， 也 许 能 ， 也 许 不 能 。 对 于 nasm 来 说 ， 把 它 编 译 为 何 种 形式 的 转移 指 
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令 ， 取决 于 操作 数 的 大 小 ， 在 这 先 埋 下 伏笔 ， 等 介绍 下 一 种 “相对 近 转 移 ” 时 大 家 就 明白 了 。 
咱们 边 说 边 看 实例 ， 上 个 小 例子 ， 如 下 面 代码 。 


1jmp.S 




















lsection call test vstart=0x900 
jmp short start 
times 127 db 0 
ts 
mov ax, 0x1234 
jmp $ 


第 2 行 的 jmp short start 采用 短 转移 方式 。 目 标 地 址 是 第 4 行 的 start。 
在 第 3 行 特意 定义 了 127 字 节 的 数据 ， 目 的 是 用 来 间隔 目标 地 址 start， 使 第 2 行 的 jmp 和 第 4 行 的 
start 保持 一 定 距 离 。 这 127 字 节 实际 上 就 是 jmp 短 转移 方式 的 操作 数 ， 即 第 4 行 start 的 地 址 减 去 第 2 行 
jmp short start 的 地 址 后 ， 再 减 去 2 字 节 等 于 127。 
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简短 介绍 之 后 ， 还 是 上 CPU 测试 一 下 ， 老 样子 ， 依 然 是 从 虚拟 机 中 提炼 重点 信息 ， 见 表 3-6。 
表 3-6 jmp 相对 短 转移 指令 
行 号 地 址 指 令 机 器 码 
1 0000:0900 jmp .+127 (0x00000981) eb7f 
2 0000:0981 mov ax, Ox1234 b83412 
3 0000:0984 jmp .-2 (Ox00000984) ebfe 



































第 1 行 ， 在 地 址 0x900 处 的 指令 是 jmp .+127， 操 作 数 是 127， 其 转移 的 真实 地 址 是 0x981， 前 面 说 过 
啦 ， 操 作 数 是 不 能 直接 给 CPU 用 的 ，CPU 要 将 其 转换 成 绝对 地 址 。 所 以 此 地 址 是 这 样 得 来 的 : 
Ox900+2+127=0x981。 

机 器 码 eb7f。 由 于 此 指令 是 2 字 节 大 小 ， 所 以 第 1 个 字 节 eb 是 操作 码 ， 第 2 个 字 节 7f 是 操作 数 ， 即 
十 进 制 的 127。 
第 2 行 的 就 不 用 解释 啦 ， 前 面 在 演示 call 指令 时 有 说 过 。 

第 3 行 的 jmp .-2 其 实 就 是 编译 前 的 jmp $， 同 第 1 行 一 样 是 个 相对 短 跳 转 ,原理 是 一 样 的 ， 其 最 终 也 要 
将 操作 数 -2 转换 为 绝对 地 址 0x984。 转换 过 程 是 当前 IP 寄存 器 的 值 (jmp 地址 0x984) + 操作 数 负 2+ 此 指 
令 大 小 2 字 节 =0x984。 

前 面 说 过 啦 ， 操 作 数 范 围 是 -128 一 127， 如 果 操 作 数 不 在 此 范 
示 一 下 出 错 情况 ， 比 如 下 面 这 段 代 码 。 













































































































































































目 ， 将 会 在 编译 阶段 报错 。 给 大 家 实际 
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1.1jmp.S 

section call test vstart=0x900 
jmp short start 
times 128 db 0 
start: 

mov ax, 0x1234 

jmp $ 
由 于 在 第 3 行 我 们 定义 了 128 字 节 的 数据 ， 这 样 第 2 行 的 jmp 所 在 地 址 和 第 4 行 的 start 所 在 地 址 ， 
其 地 址 差 便 为 130 字 节 《如 前 所 述 ，jmp short start 本 身 占 2 字 节 ， 之 间 还 有 128 个 1 字 节 ， 共 130 字 节 )。 
而 操作 数 便 是 128 字 节 ， 操 作 数 超过 了 范围 ， 编 译 时 将 会 报 以 下 错误 。 

nasm -0 ljmp.bin ljmp.S 回 车 后 ，nasm 将 会 报错 如 下 。 


| 1jmp.S:2: error: Short jump is out of range 


除了 将 操作 数 改 为 -128 一 127 之 间 外 ， 难 道 就 没有 别 的 办 法 吗 ? 只 能 转移 到 这 么 近 吗 ? 必须 有 更 好 的 

方法 。 
解决 的 办 法 无 外 乎 就 是 将 操作 数 的 范围 增 大 ， 突 破 1 字 节 的 有 符号 数 表示 范围 就 行 了 。 
(1) 将 第 2 行 jmp 后 的 short 去 掉 ， 改 成 near。 
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(2) 第 2 行 jmp 后 什么 都 不 写 ， 让 nasm 编译 器 来 自动 判断 ， 用 short， 还 是 near。 

此 处 提 到 的 near 又 是 什么 ? 欢迎 jmp 的 第 三 种 用 法 ， 相 对 近 转 移 。 

。 16 位 实 模式 相对 近 转 移 

前 面 给 大 家 埋 下 了 近 转 移 的 伏笔 ， 在 此 揭晓 谜底 啦 。 

说 重点 ， 相 对 近 转 移 和 相对 短 转 移 相 比 ， 就 是 操作 数 范 围 增 大 了 ， 由 8 位 宽度 变 成 了 16 位 宽度 ， 操 
芷 数 依然 是 地 址 相对 量 ， 可 正 可 负 ， 范 围 是 -32768 一 32767。 由 此 可 见 ， 概 念 上 “ 近 ” 比 “ 短 ” 表 示 的 范 
必 更 远 一 些 。 

指令 格式 是 jmp near 立即 数 地 址 ， 其 操作 码 是 0xe9。 

前 令 中 的 立即 数 地 址 也 要 经 过 编译 器 转换 为 地 址 偏 移 量 ， 再 变 成 机 器 指令 中 的 操作 数 。 

无 论 是 call， 还 是 jmp， 介 绍 了 这 么 多 “相对 ”的 形式 ， 大 家 早 就 看 出 来 了 ， 这 个 操作 数 都 是 这 样 来 
的 ， 即 目标 地 址 减 去 当前 指令 地 址 后 所 得 的 差 ， 再 减 去 机 器 码 大 小 。 

由 于 相对 近 转 移 的 机 器 码 是 3 字 节 ， 所 以 操作 数 = 目标 地 址 -当前 指令 地 址 -3。 

还 是 那 句 话 ， 由 于 此 转型 中 包括 关键 字 “ 相 对 ” 机 器 码 中 的 操作 数 是 个 地 址 增 量 ， 所 以 CPU 要 将 其 
还 原 成 绝对 地 址 。 因 为 “ 近 ” 转 移 不 需要 跨 段 ， 所 以 只 算出 偏 移 地 址 就 对 啦 ， 于 是 ， 绝 对 地 址 = 操作 数 +IP 
寄存 器 的 值 +3。 

之 后 ，CPU 用 此 绝对 地 址 蔡 换 了 王 寄存 器 中 的 值 ， 由 于 这 是 近 转 移 ， 目 标 地 址 和 当前 指令 在 同一 个 段 
内 ， 所 以 CS 段 寄 存 器 不 用 修改 ，CPU 马上 就 飞 到 新 的 目标 地 址 了 。 
有 了 这 种 近 转 移 的 方法 ， 咱 们 看 看 能 否 解决 上 一 个 短 转 移 因 为 操作 数 超过 范围 的 报错 。 
修改 上 面 出 错 的 源 文 件 1.1jmp.S 中 的 第 2 行 代码 ， 将 short 改 为 near， 如 2jmp.S。 


2jmp.S 
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1 section call test vstart=0x900 
2 jmp near start 

3 times 128 db 0 

4 start: 

5 mov ax, 0x1234 

6 jmp $ 








只 是 第 2 行 改 为 了 jmp near start， 其 他 代码 都 不 变 。 
nasm -0 2jmp.bin 2jmp.S 回 车 ， 没 有 任何 输出 ， 这 表示 编译 成 功 了 。 表 3-7 是 源 程序 2jmp.S 上 CPU 后 






































表 3-7 jmp 相对 近 转 移 指令 
行 号 地 址 指 令 机 器 码 
lL 0000:0900 jmp .+128 (0x00000983) e98000 
2 0000:0983 mov ax, Ox1234 b83412 
3 0000:0986 jmp .-2 (0x00000986) ebfe 














大 家 看 表 3-7 的 第 1 行 , 在 地 址 0x900 处 的 指令 是 jmp.+128, 括号 中 的 0x983 是 其 要 跳 转 的 绝对 地 址 ， 
也 就 是 会 跳 到 第 二 行 的 mov ax， 0x1234。0x983 是 怎么 来 的 呢 ? 前 面 说 过 啦 ， 操 作 数 (128) +IP 寄存 器 
值 (0x900) + 机 器 码 大 小 (3)。E98000 是 jmp.+128 的 机 器 码 ，e9 是 操作 码 ，8000 是 操作 数 ， 由 于 x86 
是 小 端 字 节 序 形式 ， 所 以 其 值 为 0x0080， 即 十 进 制 的 128。 第 三 行 的 jmp.-2， 也 就 是 源 文 件 中 的 jmp$， 
被 编译 为 短 转移 形式 ， 其 操作 码 是 0xeb。 
补充 一 下 ， 按 照 目前 2.10.07 版 本 的 nasm， 如 果 超 过 了 16 位 有 符号 数 的 范围 -32768 一 32767， 编 译 器 
并 不 会 报错 ， 只 是 会 将 超过 16 位 的 部 分 忽略 ， 只 保留 16 位 的 结果 。 
jmp“ 相 对 ”转移 的 形式 介绍 完了 ， 分 别 是 相对 短 转移 和 相对 近 转 移 。 其 中 的 short 和 near 如 果 省 略 ， 
nasm 编译 器 会 根据 目的 地 址 和 当前 地 址 的 偏 移 量 大 小 来 自行 判断 ， 知 偏 移 量 属于 范围 -128 一 127， 则 编译 
为 short 短 转移 形式 。 若 超过 了 短 转移 的 范围 就 编译 为 near 近 转 移 形 式 。 
下 面 介绍 第 三 种 形式 ， 它 是 咱们 要 介绍 的 最 后 一 种 近 转 移 ， 操 作 数 不 再 是 “相对 ”地 址 偏 移 量 ， 而 是 




































































































































































































































































Im| 

























































































94 


绝对 地 址 啦 。 欢 迎 “ 间 接 绝对 近 转 移 ” 

。 16 位 实 模式 间接 绝对 近 转 移 

同上 一 个 “jmp 相对 近 转 移 ” 相 比 ， 本 “间接 绝对 近 转 移 ” 其 目标 地 址 是 绝对 地 址 ， 并 且 未 在 指令 中 
直接 给 出 ， 存 在 寄存 器 或 内 存 中 。 
在 讲述 call 指令 的 调用 方式 时 ， 我 们 说 过 了 “间接 ”的 意思 。 间 接 ， 是 指 操 作 数 并 不 直接 给 出 ， 而 是 存储 
在 寄存 器 或 内 存 中 。 绝 对 地 址 顾名思义 ， 就 是 段 内 偏 移 地 址 ， 指 的 是 “CS: IP” 中 的 全 值 ， 偏 移 地 址 是 16 
位 。 经 过 这 样 的 拆 词 分 析 ， 概 念 已 经 没 法 再 清楚 了 。 所 以 ,“ 间 接 绝对 近 转 移 ” 就 是 指 段 内 转移 ， 转 移 的 地 址 
是 16 位 宽度 ， 也 就 是 2 字 节 ， 地 址 要 么 在 寄存 器 中 ， 要 么 在 内 存 中 。 

和 “ 近 ” 有 关 的 转移 就 可 以 用 关键 字 near 来 修饰 ， 表 示 在 内 存 或 寄存 器 中 取 2 字 节 ， 这 是 一 种 数据 
类 型 转换 ， 在 此 ，near 依然 可 以 省 略 ，nasm 编译 器 默认 在 地 址 处 取 2 字 节 。 

间 令 格式 是 jmp near 寄存 器 寻 址 ， 或 者 jmp near 内 存 寻 址 。 

若 操作 数 在 内 存 中 ， 在 不 使 用 段 跨越 前 绥 的 情况 下 ， 段 基 址 寄存 器 是 DS。 

由 于 这 也 是 近 转 移 ，CS 寄存 器 的 值 不 用 修改 ，CPU 只 要 用 16 位 寡 存 器 的 值 或 内 存 中 的 2 字 节 载 入 
IP 寄存 器 ，CPU 马上 就 被 带 到 新 的 地 址 。 

采用 寄存 器 寻 址 的 jmp 指令 ， 其 操作 码 是 0xff， 操 作 数 随 寄 存 器 的 不 同 而 不 同 。 采 用 内 存 寻 址 的 jmp 
前 令 ， 其 操作 码 还 要 看 段 基 址 寄存 器 用 的 是 哪个 ， 见 下 面 实例 吧 。 
在 通过 内 存 寻 址 时 ， 在 不 用 段 跨越 前 缀 的 情况 下 ， 默 认 需 要 用 到 DS 寄存 器 。 
老 规矩 ， 上 代码 验证 一 下 。 
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3jmp.S 
1 section call test vstart=0x900 
2 mov ax, start 
3 jmp near ax 
4 times 128 db 0 
5 start: 
6 mov ax, 0x1234 
了 jmp $ 











在 3jmp.S 第 2 行将 地 址 mov 到 寄存 器 ax 中 ， 再 通过 jmp near ax 实现 转移 。 
说 到 这 里 ， 在 上 一 节 中 所 说 的 call 调用 形式 中 ， 第 二 种 调用 形式 间接 绝对 近 调 用 ， 里 面 出 现 了 near 
小 插曲 ，near 放 在 寄存 器 前 编译 器 就 会 报警 告 :“warning: ”register size Specification ignored”， 这 里 也 出 
现 了 。 如 果 您 仔细 看 过 那 段 小 插曲 的 推测 部 分 ， 就 会 了 解 ，near 可 能 《我 用 的 是 可 能 ) 只 是 个 数据 类 型 ， 
和 byte、word、dword 作用 一 样 ， 相 当 于 强制 数据 类 型 转换 ， 用 来 控制 数值 范围 ， 从 而 控制 了 转移 的 范围 。 
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表 3-8 jmp 间接 绝对 近 转 移 之 寄存 器 
行 号 地 址 指 令 机 器 码 
1 0000:0900 mov ax, Ox0985 b88509 
2 0000:0903 jmp ax ffe0 
3 0000:0985 mov ax, Ox1234 b83412 
4 0000:0988 jmp .-2 (Ox00000988) ebfe 
























































表 3-8 中 第 2 行 的 jmp ax 便 是 源 代码 中 的 jmp near ax， 机 器 码 是 ffe0， 操作 码 是 0xff，e0 代表 寄存 器 
ax。 其 他 不 用 多 解释 了 ， 大 家 看 得 太 多 了 。 
再 举 个 jmp 用 内 存 寻 址 的 例子 。 























3.1jmp.S 
section call test vstart=0x900 
mov word [addr], start 
jmp near [addr] 
times 128 db 0 
addr dw 0 
start: 
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mov ax, 0x1234 


jmp $ 


代码 3.1jmp.S 中 的 第 2 行 ， 





















































将 start 地 址 mov 到 内 存 [addr]，addr 是 个 变量 ，2 个 字 节 大 小 ， 在 第 5 行 




















定义 。 将 目标 地 址 写 入 变量 addr 后 ， 在 第 3 行 ，jmp 通过 此 变量 来 转移 。 
表 3-9 是 其 实际 执行 时 的 情况 。 
表 3-9 jmp 间接 绝对 近 转 移 之 内 存 
行 ”号 地 址 指 令 机 器 码 

1 0000:0900 mov word ptr ds:0x98a, Ox098c c7068a098c09 
2 0000:0906 jmp word ptr ds:0x98a ff268a09 
3 0000:098c mov ax, Ox1234 b83412 
4 0000:098f jmp .-2 (Ox0000098f) ebfe 


操作 数 是 c706， 这 还 是 默认 数据 段 ds 寄存 器 ， 如 果 使 / 
的 第 2 行 是 jmp 通过 内 存 寻 址 实现 转移 ， 对 应 源码 第 3 行 ，near 在 此 被 替换 为 word。 
近 一 步 证 明 near 和 short 就 是 nasm 数据 类 型 伪 指 令 ， 不 同 的 数 


宽度 
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表 3-9 的 第 1 行 是 将 立即 数 写 入 内 存 ， 对 应 源码 3.1jmp.S 的 第 2 行 。 











来 实现 转移 范围 。 
。 16 位 实 模式 直接 绝对 远 转 移 
经 过 前 本 



















































































段 基 址 : 立即 数 























j 段 跨越 前 绥 ， 








大 家 看 下 它 的 机 器 码 有 多 复杂 。 











操作 码 又 会 变 成 其 他 样子 了 。 表 3-9 














“直接 ”是 指 操作 数 不 仅 是 立即 数 ， 而 上 有 
“绝对 ”是 指 提供 的 操作 数 是 绝对 地 址 。 
是 指 目的 地 址 和 当前 指令 不 是 一 个 段 ， 有 跨 段 的 需求 ， 所 以 要 操作 数 要 包括 新 的 段 基 址 和 上 段 内 偏 移 。 
直接 绝对 远 转 移 就 是 以 立即 数 的 形式 给 出 目标 地 址 的 段 基 址 和 段 内 偏 移 地 址 。 指 令 格式 为 jmp 立即 数 形 
EB 式 的 段 内 偏 移 地 址 。 例 如 jmp 0: 0x900， 划 











i 拆 词 分 析 的 不 断 强 化 ， 大 家 一 看 这 个 名 字 ， 基 本 就 知道 我 想 说 什么 了 。 直 接 绝 对 远 转移 中 : 





名 类 型 有 不 同 的 宽度 ， 通 过 转换 数据 




















CPU 直接 拿 来 就 用 ， 不 用 

























































































转换。 











中 0 是 段 基 址 ，0x900 是 段 内 偏 移 地 址 。 





由 于 是 远 转移 ， 所 以 CPU 用 操作 数 中 的 段 基 址 载 入 CS 寄存 器 ， 用 操作 数 中 的 偏 移 地 址 载 入 IP 寄存 


才 完 成 转移 。 
还 是 拿 例子 说 话 ， 代 码 如 下 。 


section call test vstart=0x900 


jmp 0: start 
times 128 db 0 
start: 
mov ax, 
jmp $ 


0x1234 


4jmp.S 的 第 2 行 jmp 0: start， 段 基 址 为 0， 偏 移 地 址 是 函数 符号 
字 地 址 。 其 他 的 也 没 啥 可 说 的 啦 ， 直 接 看 实际 运行 情况 。 

















4jmp.S 















































Start， 


最 终 也 会 被 编译 器 编译 为 数 











表 3-10 jmp 直接 绝对 远 转移 

行 “号 地 址 指 令 机 器 码 
1 0000:0900 jmp far 0000:0985 ea85090000 
2 0000:0985 mov ax, Ox1234 b83412 
3 0000:0988 jmp .-2 (Ox00000988) ebfe 








大 家 看 表 3-10 第 一 行 , 在 内 存 地 址 0x900 处 的 指令 是 jmp far 0000: 
2 行 。 机 器 码 是 ea85090000， 操 作 码 是 0xea。 注 意 ， 在 指令 中 的 操作 数 
反 的 ， 指 令 中 的 操作 数 顺序 是 多 
































比较 符合 
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日 译 器 为 人 使 
然 习惯 。 而 机 器 码 中 的 偏 移 地 址 在 前 ， 段 基 址 在 后 ， 




















方便 而 规范 的 ， 人 在 感 观 





顺序 与 机 器 码 的 操作 数 顺序 是 相 


0985， 这 对 应 源码 4jmp.S 的 第 











上 觉得 段 在 前 ， 偏 移 地 址 在 后 ， 









































的 一 是 为 指令 格式 较 统一 ， 指 令 中 加 




















定 字段 是 固定 内 容 。 二 是 硬件 









































e 16 位 实 模式 间接 绝对 远 转 移 


和 上 一 个 “直接 绝对 远 转 移 ” 比 ， 此 处 操作 数 是 
操作 数 不 是 直接 给 出 的 ， 即 段 基 址 和 段 内 1 
在 说 call 间接 绝对 远 调用 时 也 分 析 过 啦 ， 






































中 是 不 可 能 的 啦 ， 前 面 














局 移 不 是 立即 


















































在 内 存 中 取 4 个 字 节 ， 需 要 在 指令 中 用 关键 字 far， 即 
若 不 指定 ， 则 和 第 三 种 的 “间接 绝对 近 转 移 ” 一 样 ， 只 在 内 存 处 取 2 字 节 。 
所 以 其 指令 格式 是 : jmp far 内 存 寻 

































































“直接 ” 变 “ 间 接 ”， 不 下 









































由 于 操作 数 在 内 存 ! 
此 指令 的 操作 数 ， 需 要 访问 内 存 才能 

















， 在 不 使 用 段 跨越 前 


























实际 使 用 的 数据 段 寄存 器 等 情况 来 决定 。 
同样 ， 由 于 是 远 转 移 ，CPU 的 CS 寄存 器 和 IP 寄存 器 都 要 修改 成 操作 数 

















上 荣 ， 见 代码 5jmp.S。 


jmp far [addr] 
times 128 db 0 
addr dw start, 0 
St 


OODP 


jmp $ 





























section call test vstart=0x900 


mov ax, 0x1234 


到 ， 所 以 需要 知道 寻 芭 








在 5jmp.S 中 的 第 4 行 定义 了 +H 


行 直接 通过 此 变量 addr 访问 跳 转 地 址 。 











表 3-11 是 实际 运行 的 情况 。 








的 情况 下 ， 段 基 址 寄存 器 是 DS。 
方式 。 机 器 码 与 寻 址 方式 有 关 ， 要 根据 
































5jmp.S 


也 址 变量 addr， 此 变量 的 低 2 字 节 是 1 





电路 为 了 高 效 而 故意 设计 成 这 样 。 毕 竞 大 多 数 情况 下 都 是 段 内 转移 ， 在 译 
码 阶段 ， 得 到 操作 码 后 ， 紧 接着 的 是 段 内 偏 移 地 址 ， 不 是 更 高 效 吗 ? 


了 拆 词 分 析 啦 ， 也 就 是 说 ， 
数 的 形式 。 由 于 操作 数 是 两 个 数 ， 放 在 一 个 寄存 器 
操作 数 只 能 放 在 内 存 中 。 为 了 指示 CPU 


前 两 个 字 节 是 段 内 偏 移 地 址 ， 后 两 个 字 节 是 段 基 址 。 



































指定 的 值 ， 从 而 实现 转移 。 





局 移 地 址 ， 高 2 字 节 是 段 基 址 。 第 2 

















月 
表 3-11 间接 绝对 远 转移 
行 号 地 址 指 令 器 码 
1 0000:0900 jmp far ds:0x984 
2 0000:0988 mov ax, Ox1234 
3 0000:098b jmp .-2 (Ox0000098b) 


表 3-11 第 一 行 , 地 二 
































代表 DS 寄存 器 。 
































止 0x900 处 的 指令 是 jmp far ds: 0x984, 意思 是 在 地 址 0x984 处 取 
1 于 地 址 0x984 中 的 内 容 是 普通 数据 ， 不 是 指令 ， 所 以 未 在 表 3-11 中 列 





好 啦 ， 无 条 件 跳 转 指令 介绍 完了 ， 有 没有 觉得 好 长 啊 ? 





3.2.9 标志 寄存 器 flags 


按理 说 ， 既 然 有 “无 条 件 转移 ”， 就 应 该 有 “有 条 件 转移 ”， 真 实情 况 也 确实 是 这 样 。 
移 指令 后 ， 该 到 有 条 件 转移 指令 啦 ， 可 是 我 们 得 知道 这 个 条 件 在 哪 
些 条 件 做 出 是 否 转移 的 判断 。 
这 些 条 件 就 放 在 了 标志 寄存 器 flags 中 。 在 名 






































集合 ， 在 此 寄存 器 中 有 很 多 标志 位 。 






































得 跳 转 目标 地 址 。 
上 。 机 器 码 ff2e8409， 其 中 的 2e 



































讲 完 了 无 条 件 转 








已 ， 是 什么 条 件 。 这 样 我 们 才能 根据 这 














字 上 看 , flag 加 了 s， 说 明 是 flag 的 复数 形式 ， 是 flag 的 





实 模式 下 标志 寄存 器 是 16 位 的 flags， 在 32 位 保护 模式 下 ， 扩 展 〈extend) 了 标志 寄存 器 ， 成 为 32 


位 的 eflags。 





其 实 这 些 用 于 判断 的 条 件 ， 本 质 
判断 ， 也 是 判断 上 一 名 代码 的 结果 。 例 如 让 、switch 等 ， 它 们 都 是 判断 











上 是 上 一 条 指令 执行 的 结果 。 想 想 看 ， 我 们 在 实际 编程 中 做 出 的 条 件 












































结构 的 结果 。 
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显而易见 , “条件 


9% 4 日 
加 








存在 于 计算 机 


系统 的 茶 个 地 方 ， 我 们 才能 





在 c 等 高 级 语言 中 ， 
它 不 像 C 语言 这 般 高 级 ， 所 谓 的 “高 级 ”并 不 是 说 真 的 有 多 高 大 


世界 里 ， 








这 些 结果 《条 们 


























语言 ， 


比如 想 盖 个 大 楼 ， 高 级 语言 给 咱们 提供 





] 起 来 比较 方便 ， 更 靠近 人 的 逻辑 思维 ， 














施工 ， 


于 材料 早已 经 准 

















们 提供 的 是 水 、 土 、 沙 


和 
人 


备 好 了 ， 所 以 建 房 速度 就 是 快 ， 但 


三 ra 表 三 | 


访问 到 它 
F) 放 在 了 内 存 变量 中 ， 我 们 判断 的 地 方 是 某 个 内 存单 元 。 但 在 机 器 
































好 了 各 种 成 型 














不 用 考虑 过 多 细节 的 宏观 抽 
4 的 建材 ， 如 彩 钢 、 楼 板 、 


,，“ 高 级 ” 指 


























象 。 但 





越 是 “ 








高 级 ”， 


的 是 比较 接近 人 类 


越 是 受 限 ， 





水 泥 ， 只 7 














本 的 原料 ， 我们 可 











届 等 最 基 











墅 闵 别 里 


卫 醒 力 





Za 


仁 


全 
百 ， 











自 


uy 














往 灵 活性 越 强 ， 提 供 的 信 


于 ， 想 盖 瓦 房 盖 瓦 房 ， 形式 不 受 限 ， 但 














于 是 自己 去 
它 不 单纯 记录 结果 ， 而 且 


























恩 越 丰 富 ， 














寄存 右 ， 真 要 是 每 个 结果 都 
这 些 标志 告诉 大 家 ,为 了 产生 这 个 结果 ， 
解数 据 的 全 貌 ， 产 生 这 个 结果 的 过 程 
中 并 没有 提供 高 级 逻辑 的 指令 ， 
这 个 判断 的 对 象 就 是 标志 寄存 器 中 的 标志 位 。 

其 扩展 (extend) 成 32 位 的 eflags 寄存 器 


志 


4 








IA32 指令 


现 。 判 断 哪 里 ? 判断 什么 ? 
flags 寄存 器 是 16 位 宽 ， 保 护 模式 下 对 











用 寄 


存 器 存放 ， 那 得 用 多 少 寄存 器 。 
机 器 都 做 了 什么 。 











这 些 材料 只 能 盖 楼 房 。 而 
以 随意 加 工 成 我 们 需要 的 建筑 材料 ， 
‖ 造 建筑 材料 ， 房 子 盖 得 就 很 慢 。 
这 个 结果 来 的 过 程 。 由 于 提供 
的 信息 ， 
128 不 会 直接 存 到 


还 能 告诉 你 i 


比如 ， 有 时 单纯 








、 能 ) 


用 提供 好 的 材料 去 








久 级 语 言 如 汇编 ， 给 此 














这 些 材料 想 盖 别 




















越 底层 的 东 











的 











很 丰富 ， 就 用 一 个 寄存 器 来 集中 这 些 信息 ， 这 就 是 flags 寄存 器 。flags 寄存 器 中 存储 
的 特征 ， 即 标志 ， 并 不 是 真正 的 结果 ， 结 果 可 以 存储 在 内 存 中 。 例 如 64*2 的 结果 是 128， 























只 是 结果 








| 





所 以 flags 寄存 器 是 用 于 记录 


于 果 的 特征 标 




















的 














否 有 游 出， 如 果 不 知道 这 些 ， 
但 无 论 逻 辑 多 复杂 ， 















































者 可 以 通 





怎么 确定 


结 末 是 ] 
寸 最 AR 


过 最 简单 



































































































































个 结果 并 不 能 让 我 们 了 
E 确 的 呢 ? 
的 判 





断 和 转移 来 实 























由 于 eflags 寄存 器 兼容 flags 寄存 器 ， 还 是 给 各 位 看 官 呈 上 eflags， 如 图 3-10 所 示 。 
31..21 20 19 18 17 161514 13-12 11 10 9 8 7 6543210 
ID | VIP | VIF | AC | VM | RF NT | IOPL | OF | DF | IF| TF | SF | ZF AF PF CF 
Wiha 一 一 EN 
8086/8088(80186) 
We 一 
80286 
i i 一 
80386 
80486 
Cs i 
80586( 奔 腾 ) 
4 图 3-10 ”eflags 寄存 器 
咱们 不 用 把 所 有 的 标志 位 都 学 了 ， 只 要 把 基本 的 搞 清楚 就 成 。 毕 竟 本 书 不 是 讲 汇编 语言 ， 下 面 给 大 家 
来 个 笼统 地 介绍 








以 下 标志 位 仅 在 8088 以 上 CPU 中 有 效 。 














再 说 点 没 用 的 ， 


-| 








第 0 位 的 是 CF 位 ， 即 Carry Flag， 意 为 i 
位 ， 所 以 carry 表示 这 两 种 状态 。 不 管 
测 无 符号 数 加 减法 是 否 








进位 。 运 算 中 ， 数 值 的 最 





降 最 高 位 是 进位 ， 还 是 借 




















高 位 有 可 能 是 








进位 ， 











位 ，CF 位 都 会 置 1， 否 则 为 0。 它 可 

















第 2 位 为 PF 位 ， 即 Parity Flag， 意 为 奇偶 位 。 









































为 1， 否则 为 0。 六 
险 开 始 时 和 结束 后 的 对 比 ， 判 断 传输 
第 4 位 为 AF 位 ， 即 Auxiliary carry Flag， 意 为 辅助 进位 标志 ， 
即 若 低 半 字 节 
第 6 位 为 ZF 位 ， 即 Zero Flag， 
第 7 位 为 SF 位 ， 即 Sign Flag， 


到 
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FE 意 啦 ， 是 最 低 的 


有 进 、 借 





及 8 位 ， 不 管 操作 数 是 16 位 ，i 
过 程 中 是 否 出 现 错误 。 





























还 是 32 位 。 


奇人 


否 有 游 出， 因为 CF 为 1 时 ， 也 就 是 最 高 位 有 进位 或 借 位 ， 肯 定 是 游 昌 
第 1、3、5、15 位 没有 专门 的 标志 位 ， 空 着 占 位 用 。 


























也 有 可 




















全 已 
月 
上 


起 
| 于 检 








D 
Do 





用 于 标记 结果 低 8 位 中 1 的 个 数 ， 如 果 为 偶数 ，PF 位 
校 验 经 常用 于 数据 传 























位 ，AF 为 1， 否则 为 0。 





















































用 来 记录 运算 结果 低 4 位 的 进 、 借 位 


意 为 零 标志 位 。 若 计算 结果 为 0， 此 标志 为 1， 否则 为 0。 


意 为 符号 标志 位 。 若 运算 结果 为 负 ， 则 SF 位 为 1， 否则 为 0。 


第 8 位 为 TF 位， 即 Trap Flag， 意 为 陷阱 标志 位 。 此 位 若 为 1， 用 于 让 CPU 进入 单 步 运 行 方式 ， 若 为 
0， 则 为 连续 工作 的 方式 。 平 时 我 们 用 的 debug 程序 ， 在 单 步调 试 时 ， 原 理 上 就 是 让 TF 位 为 1。 可 见 ， 软 
件 上 的 很 多 功能 ， 必 须 有 硬件 的 原生 支持 才能 得 以 实现 。 
第 9 位 为 下 位 ， 即 Interrupt Flag， 意 为 中 断 标志 位 。 若 正 位 为 1， 表 示 中 断 开启 ，CPU 可 以 响应 外 
部 可 屏蔽 中 断 。 知 为 0， 表 示 中 断 关 闭 ，CPU 不 再 响应 来 自 CPU 外 部 的 可 屏蔽 中 断 ， 但 CPU 内 部 的 异常 
要 响应 的 ， 因 为 它 关 不 住 。 
第 10 位 为 DF 位 ， 即 Direction Flag， 意 为 方向 标志 位 。 此 标志 位 用 于 字符 串 操作 指令 中 ， 当 DEF 为 
1 时 ， 指 令 中 的 操作 数 地 址 会 自动 减少 一 个 单位 ， 当 DF 为 0 时 ， 指 令 中 的 操作 数 地 址 会 自动 增加 一 个 
单位 ， 意 即 给 地 址 的 变化 提供 个 方向 。 其 中 提 到 的 这 个 单位 的 大 小 ， 取 决 于 用 什么 指令 。 
第 11 位 为 OF 位 ， 即 Overflow Flag， 意 为 溢出 标志 位 。 用 来 标识 计算 的 结果 是 否 超过 了 数据 类 型 可 
表示 的 范围 ， 若 超出 了 范围 ， 就 像 水 从 锅 里 溢出 去 了 一 样 。 若 OF 为 1， 表示 有 溢出 ， 为 0 则 未 发 生 淤 出。 
专门 用 于 检测 有 符号 数 运算 结果 是 否 有 溢出 现象 。 
以 下 标志 位 仅 在 80286 以 上 CPU 中 有 效 。 相 对 于 8088， 它 支持 特权 级 和 多 任务 。 
第 12 一 13 位 为 IOPL， 即 Input Output Privilege Level， 这 用 在 有 特权 级 概念 的 CPU 中 。 有 4 个 任务 
特权 级 ， 即 特权 级 0、 特 权 级 1、 特 权 级 2 和 特权 级 3。 故 IOPL 要 占用 2 位 来 表示 这 4 种 特权 级 。 如 果 您 
对 此 感到 迷茫 ， 不 用 担心 ， 这 些 将 来 咱们 在 保护 模式 下 也 得 实践 。 
第 14 位 为 NT， 即 Nest Task， 意 为 任务 红 套 标志 位 。8088 文 持 多 任务 ， 一 个 任务 就 是 一 个 进程 。 当 
一 个 任务 中 又 檬 套 调用 了 男 一 个 任务 (进程 )》 时 ， 此 NT 位 为 1， 否则 为 0。 
以 下 标志 位 仅 用 于 80386 以 上 的 CPU。 
第 16 位 为 RF 位 ， 即 Resume Flag， 意 即 恢复 标志 位 。 该 标志 位 用 于 程序 调试 ， 指 示 是 否 接 受 调试 故 
障 ， 它 需要 与 调试 寄存 器 一 起 使 用 。 当 RF 为 1 时 忽略 调试 故障 ， 为 0 时 接受 。 
第 17 位 为 VM 位 ， 即 Virtual 8086 Model， 意 为 虚拟 8086 模式 。 这 是 实 模式 向 保护 模式 过 渡 时 的 产物 ， 现 
在 已 经 没有 了 。CPU 有 了 保护 模式 后 ， 功 能 更 加 强大 了 ， 但 为 了 兼容 实 模式 下 的 用 户 程序 ， 人 允许 将 此 位 置 为 1， 
这 样 便 可 以 在 保护 模式 下 运行 实 模式 下 的 程序 了 。 实 模式 下 的 程序 不 支持 多 任务 , 而 且 程 序 中 的 地 址 就 是 真实 的 
物理 地 址 。 所 以 在 保护 模式 下 每 运行 一 个 实 模式 下 的 程序 ， 就 要 为 其 虚拟 一 个 实 模式 环境 ， 故 称 为 虚拟 模式 。 
以 下 标志 位 仅 用 于 80486 以 上 的 CPU。 
第 18 位 为 AC 位 ， 即 Alignment Check， 意 为 对 齐 检查 。 什 么 是 对 齐 呢 ? 是 指 程 序 中 的 数据 或 指令 其 
内 存 地 址 是 否 是 偶数 ， 是 否 是 16、32 的 整数 倍 ， 没 有 余数 ， 这 样 硬 件 每 次 对 地 址 以 自 增 地 方式 〈 每 次 自 
加 2、16、32 等 ) 访问 内 存 时 ， 自 增 后 的 地 址 正好 对 齐 数据 所 在 的 起 始 地 址 上 ， 这 就 是 对 齐 的 原理 。 对 齐 
并 不 是 软件 逻辑 中 的 要 求 ， 而 是 硬件 上 的 偏好 ， 如 果 待 访问 的 内 存 地 址 是 16 或 32 的 整数 倍 , 硬件 上 好 处 
理 ， 所 以 运行 较 快 。 若 AC 位 为 1 时 ， 则 进行 地 址 对 齐 检查 ， 为 0 时 不 检查 。 
以 下 标志 位 只 对 80586 〈 奔 腾 ) 以 上 CPU 有 效 。 
第 19 位 为 VIF 位 ， 即 Virtual Interrupt Flag， 意 为 虚拟 中 断 标志 位 ， 虚 拟 模式 下 的 中 断 标 志 。 
第 20 位 为 VIP 位 ， 即 Virtual Interrupt Pending， 意 为 虚拟 中 断 挂 起 标志 位 。 在 多 任务 情况 下 ， 为 操作 
系统 提供 的 虚拟 中 断 挂 起 信息 ， 需 要 与 VIF 位 配合 。 
第 21 位 为 ID 位 ， 即 Identification， 意 思 为 识别 标志 位 。 系 统 经 常 要 判断 CPU 型 号 ， 若 ID 为 1， 表 
示 当 前 CPU 支持 CPU id 指令 ， 这 样 便 能 获取 CPU 的 型 号 、 厂 商 等 信息 。 若 ID 为 0， 则 表示 当前 CPU 不 
支持 CPU id 指令 。 
其 余 剩 下 的 22 一 31 位 都 没有 实际 用 途 ， 纯 粹 是 占 位 用 ， 为 了 将 来 扩展 。 
了 解 了 这 个 标志 位 后 ， 一 些 “ 和 条件” 指令 便 有 法 可 依 啦 ， 比 如 下 面 要 说 的 ， 有 条 件 转移 。 


3.2.10 有 条 件 转移 
有 条 件 转移 不 是 简单 的 一 个 指令 ， 它 是 一 个 指令 族 ， 我 们 在 此 简单 称 jxx。 如 果 条 件 满足 ，jxx 将 会 跳 
转 到 指定 的 位 置 去 执行 ， 否 则 继续 顺序 地 执行 下 一 条 指令 。 
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第 3 章 MBR 
格式 为 jxx 目标 地 址 。 若 条 件 满 足 则 跳 转 到 目标 地 址 ， 否 则 顺序 执行 下 一 条 指令 。 

标 地 址 只 能 是 段 内 偏 移 地 址 。 在 实 模式 下 ， 由 编译 器 根据 当前 指令 与 目标 地 址 的 偏 移 量 ， 自 
行将 其 编译 成 短 转移 或 近 转 移 。 在 保护 模式 下 ， 寄 存 器 中 宽度 已 经 到 了 32 位 ，32 位 的 偏 移 地 址 可 以 访问 
到 整个 32 位 地 线 总 线 的 4GB 内 存 空间 ， 编 译 器 不 再 区 分 转移 方式 。 

进行 条 件 转移 ， 所 谓 的 条 件 就 是 判断 上 一 条 指令 的 结果 是 否 满足 某 方面 或 某 些 方面 ， 能 够 影响 标志 位 
的 指令 才能 被 其 后 的 条 件 指令 用 作 条 件 。 所 以 条 件 转移 指令 一 定 得 在 某 个 能 够 影响 标志 位 的 指令 之 后 进 
行 。 也 就 是 说 ， 每 执行 一 条 指令 ,标志 寄存 器 中 的 相应 位 都 会 记录 这 条 指令 所 带 来 的 变化 。 所 以 说 ， 条 件 
转移 指令 ， 判 断 的 就 是 上 一 条 指令 对 标志 位 的 “影响 ” 这 些 “影响” 就 是 条 件 。 

条 件 转移 指令 中 所 说 的 条 件 就 是 指标 志 寄 存 器 中 的 标志 位 。jxx 中 的 xx， 就 是 各 种 条 件 的 分 类 ， 每 种 
条 件 有 不 同 的 转移 指令 。 下 面 将 条 件 展开 ， 将 各 指令 实例 化 列 出 ， 见 表 3-12。 

表 3-12 条 件 转移 指令 

转移 指令 条 件 意 义 英文 助 记 
jz/je ZF=1 相 减 结果 等 于 0/ 相 等 时 转移 Jump if Zero/Equal 
jnz/ine ZF=0 不 等 于 0/ 不 相等 时 转移 Jump if Not Zero/ Not Equal 
js SF=1 负数 时 转移 Jump if Sign 
jns SF=0 正 数 时 转移 Jump if Not Sign 
jo OF=1 溢出 时 转移 Jump if Overflow 
jno OF=0 未 溢出 时 转移 Jump if Not Overflow 
jp/jpe PF=1 低 字 节 中 有 偶数 个 1 时 转移 Jump 让 Parity/Parity Even 
jnp/jpo PF=0 低 字 节 中 有 奇数 个 1 时 转移 Jump if Not Parity/Parity Odd 
jbe/jna CF=1 或 ZF=1 小 于 等 于 /不 大 于 时 转移 Jump if Below or Equal/Not Above 
jnbe/ja CF=ZF=0 不 小 于 等 于 /大 于 时 转移 Jump if Not Below or Equal/Above 
jc/jb/jnae CF=1 进位 /小 于 /不 大 于 等 于 时 转移 Jump if Carry/Below/Not Above Equal 
jnc/jnb/jae CF=0 未 进位 /不 小 于 /大 于 等 于 时 转移 Jump if Not Carry/Not Below/Above Equal 
jinge SF!=OF 小 于 /不 大 于 等 于 时 转移 Jump Less/Not Great Equal 
jnl/jge SF=OF 不 小 于 /大 于 等 于 时 转移 Jump if Not Less/Great Equal 
jle/jing ZF!=OF 或 ZF=1 小 于 等 于 /不 大 于 Jump if Less or Equal/Not Great 
jnle/jg SF=OF H ZF=0 不 小 于 等 于 /大 于 时 转移 Jump Not Less Equal/Great 
Jcxz CX 寄存 器 值 =0 cx 寄存 器 值 为 0 时 转移 Jump if register CX’s value is Zero 

有 没有 觉得 好 多 好 乱 好 烦 ? 这 里 面 同 义 的 好 多 啊 ， 比 如 让 L 和 jnge， 直 接 就 理解 为 “小 于 时 转移 ”就 成 
了 ， 何 必 再 弄 个 同义词 nge“ 不 大 于 等 于 时 转移 ” 呢 ? 其 实 不 用 那么 闹 心 ， 经 常用 的 就 两 三 个 。 而 且 ， 这 
些 转移 指令 是 由 意义 明确 的 字符 拼 成 的 。 

a ”表示 above 

b 表示 below 

c ”表示 carry 

e ”表示 equal 

g ”表示 great 

] 表示 jmp 

1 ”表示 less 

n ”表示 not 

0 ”表示 overflow 

pP ”表示 parity 

















中 这 些 缩写 ， 从 字 
会 理所当然 就 这 样 












































看 上 就 大 概 了 解 
， 对 于 新 生 事物 ， 只 是 时 间 问 题 。 

















\ 体 转移 指令 














的 意义 了 。 经 




















验 表 明 ， 即 使 不 理解 的 东西 ， 时 间 一 








好 啦 ， 对 于 条 件 转移 指令 ,上 只 
跟 大 家 建议 ， 如 果 ; 


实 模式 小 结 


3.2.11 





















































们 差不多 就 到 这 了 ， 
[ 编 基础 薄弱 ， 还 是 专门 去 看 看 专 i 





咱们 


4 是 


















































汇编 的 书 ， 本 





作为 您 的 小 伙伴 ， 对 于 汇编 语言 中 的 部 分 ， 我 也 就 能 帮 
其 实 不 深奥 ， 我 尽量 给 大 家 说 ; 


本 书 中 用 到 的 汇编 
我 实在 是 做 不 到 啊 。 
家 曾经 学 过 ， 现 在 只 是 概念 模糊 了 ， 相 当 了 
时 把 本 书 放 一 放 ， 先 找 本 专门 的 ; 
的 内 核 加 载 器 loader， 用 

说 句 展 心 话 ， 学 习作 
































说 句 负 责任 的 i 








新 知识 的 学 习 是 基于 脑子 中 旧 有 的 和 


是 要 找 出 旧 知 识 间 的 相互 关联 ,3 
知识 ， 如 同上 大 学 要 有 高 中 的 基础 一 样 。 
收 ， 知 识 本 映 是 个 不 断 迭 代 的 过 程 。 如 果 
芋 ， 那 也 只 








设计 的 ) 看 








咱们 的 实 横 式 到 这 就 告 一 段落 。 将 来 咱们 还 是 以 保护 横 式 为 主 ， 实 模式 有 很 多 不 靠 谱 的 : 


保护 模式 蔡 代 。 






































租 开 足 马 力 介 绍 操作 系统 啦 。 在 这 里 小 弟 诚 野地 















































真 地 不 能 做 到 从 0 开始 讲 汇编 语言 。 














您 到 这 儿 了 ， 毕 竟 本 书 不 是 









































F 是 给 大 
[- 编 书 看 看 ， 学 得 不 
的 还 都 是 较 浅显 的 指令 ， 有 点 基础 就 能 看 懂 了 。 








三 
系 有 尾 省 


汇 














楚 ， 如 果 汇 编 基 础 实在 薄弱 ， 让 我 从 头 讲 汇编 
舌 ， 即 使 在 这 里 给 大 家 讲解 汇编 语言 ， 也 是 假设 大 家 有 一 定 基础 ， 假 设 大 























汇编 语言 的 。 另 外 
的 话 ， 兄 第 






































编 语言 。 若 























j 太 深 ， 书 中 用 




















E 何 知识 都 没有 真正 从 零 基础 玫 


识 
































F 始 的 ， 这 就 是 本 








点 基础 都 没有 ， 还 是 建议 您 暂 














[ 编 的 地 方 主要 就 是 MBR 和 以 后 要 讲 











体系 ， 它 是 旧 有 知识 的 扩充 与 延 但 




















二 





j 这 种 关联 去 扫 
























































只 有 
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实 模式 被 保护 模式 淘汰 的 原因 ， 最 主要 是 安全 隐患。 




















包括 访问 操作 系统 所 在 的 



































内 存 数 据 。 


这 就 给 程序 员 开 放 了 无 限 的 自 


在 实 模式 下 ,用 户 程序 和 操作 系统 可 以 说 是 同一 特权 的 程序 ， 
作 系 统 平 起 平 坐 ， 所 以 可 以 执行 一 些 具 有 破 ] 


坏 性 的 指令 。 









































由 于 完全 没有 保护 性 可 言 ， 











全 靠 程序 员 的 心 避 























月 。 


用 户 程序 甚至 可 以 覆盖 操作 系统 在 内 存 ! 





导出 新 的 知识 。 这 就 是 学 习 一 门 新 课程 前 所 需要 的 基础 
日 知识 能 够 讲 得 通 ， 新 知识 才能 够 被 理解 ， 被 接受 ， 被 吸 
本 计算 机 书 能 够 让 搞 艺 术 的 人 《如 玩 音乐 的 、 
是 “可 能 ”做 到 了 零 基 础 。 





不 敢 标榜 从 零 基础 学 习 的 原因 。 


日 ， 








我 们 在 学 习 新 知识 之 初 ， 肯 定 


















































画 画 的 、 搞 服装 




















也 方 ， 终 将 被 














大 











为 实 模式 下 没有 特权 级 ， 它 处 处 和 操 








程序 可 以 随意 修改 自己 的 段 基 址 , 这 样 便 在 1MB 的 内 存 空间 内 不 受阻 拦 , 可 以 随意 访问 任意 物理 内 存 ， 























1， 程 序 员 访问 内 存 可 以 说 是 指 哪 打 哪 。 























让 我 们 直接 对 显示 器 说 点 什么 吧 





























在 上 一 章 中 ， 我 们 给 出 了 mbr 的 简 生 
接 通过 显卡 来 输出 字符 ， 

但 由 于 以 下 原 
3.3.1 CPU 如 何 与 外 设 通信 





介绍 显卡 之 前 ， 必 须 得 和 大 家 交待 ; 
大 家 都 学 过 微机 接口 技术 吧 ? 没 学 过 也 没关系 ， 反 站 
按理 说 ， 如 果 硬 件 种 类 较 少 ， 让 CPU 直接 同人 硬 作 
兴盛 ， 是 和 诞生 各 利 





算 机 能 发 展 到 今天 这 相 








因 ， 我 们 不 得 不 向 BIOS 说 拜 汰 

















互 换 信息 ， 外 部 设备 种 类 繁多 ， 




















所 以 我 们 用 的 是 BIOS 提供 的 0x10 





10 接口 


老林 
月 炬 ， 













































































它 还 是 少 点 好 。 


让 CPU 小 朋 





过 执行 jmp $ 这 样 
再 





的 死 循环 语句 
































和 A 人 
自己 的 等 待 时 








在 





民 澳 








无 论 它 
生 不 同 ， 脾 气 迎 异 ” 的 硬 从 
就 能 看 得 日 
说 ， 同 任何 一 个 设备 打交道 ，CPU 
间 ， 还 得 为 低速 设备 准备 数 所 





实现 ， 让 它 飞 了 一 会 。 不 过 由 于 我 当时 还 没有 


的 映像 ， 整 个 计算 机 世界 的 和 平 








和 大 家 介绍 如 何 直 





















































机 械 式 、 电 动 式 、 











断 来 实现 的 滚屏 和 打印 字符 。 
， 是 时 候 打 破 同 硬件 打交道 的 恐惧 














与 神秘 了 。 





那么 多 的 外 部 设备 ，CPU 是 如 何 与 它们 交流 的 。 

E 我 也 只 是 笼统 地 说 说 ， 保 证 大 家 一 定 能 看 得 懂 。 
进行 IO 操作 也 不 是 很 过 分 ， 但 现实 不 是 这 样 的 ， 
各 样 的 硬件 分 不 
原理 各 异 ， 有 








计 





fT 的 。 微 型 计算 机 通过 外 部 设备 与 外 面 的 世界 
电子 式 ， 输 出 的 信号 也 多 种 多 样 ， 有 模拟 




















量 、 数 字 量 、 开 关 量 。 它 们 都 有 自己 的 特性 ， 数 据 格 式 不 相 
诈 且 它们 都 在 自己 的 时 序 下 工 
友 与 每 个 “个 


上 时， 人 家 CPU 





可 是 个 踏实 低 





司 ， 有 的 外 设 


门 的 速度 如 何 ， 在 CPU 看 来 都 太 | 
F 大 大 们 打交道 ， 这 也 太 为 难 CPU 了 ， 您 看 ， 通 
周 的 主 ， 


























局 缓冲 区 。CPU 



































j 串 行 数据 ， 有 的 是 并 行 数据 ， 





466 A 


交际 ” 





所 以 ， 这 类 活动 对 








那么 速度 那么 快 ， 它 不 得 嫌弃 别人 慢 吗 ， 为 了 减少 


























j 的 信号 都 是 TTL 




















EE 平 ， 外 设 大 多 数 都 是 机 


101 





是 





设备 ， 机 电 设备 可 不 能 用 TTL 电 平 驱动 ， 这 还 不 算 完 呢 ，CPU 系统 总 线 上 传送 的 都 是 并 行 数据 (所 以 你 
听 到 的 都 是 8 位 、16 位 、32 位 CPU……)， 外 设 可 是 并 行 、 串 行 都 有 ， 还 得 转换 格式 ， 想 想 就 麻烦 啊 。 
看 来 ， 不 可 能 让 CPU 一 一 适应 它们 ， 否 则 CPU 要 做 的 工作 太 多 了 。 
CPU 面临 的 问题 ， 就 像 校长 面临 一 群 学 生 一 样 ， 让 校长 亲自 管理 每 个 学 生 的 学 习 ， 即 使 是 肌肉 男 施 
瓦 辛 格 也 得 累 倒 ， 于 是 ， 班 主任 的 出 现 帮 了 大 忙 ， 每 个 班主 任 负责 一 批 学 生 ， 由 他 们 了 解 学 生 的 情况 后 再 
向 校长 汇报 ， 这 样 校长 他 不 需要 过 人 的 体格 ， 工 作 起 来 也 会 游 区 有余 了 。 人 创造 出 来 的 东西 必然 脱离 不 了 
人 的 思维 ，CPU 工程 师 们 也 给 CPU 找 了 “班主 任 ” 在 CPU 和 外 设 之 间 加 了 个 代理 ， 总 之 ， 以 后 CPU 有 
什么 事 就 同 它 接触 就 行 了 。 什 么 速度 不 匹配 ， 缓 冲 区 之 类 的 ， 全 都 由 代理 来 搞定 。 举 个 例子 ， 如 果 是 串 行 
设备 ，CPU 就 同 串 行 接口 通信 ， 把 数据 发 给 它 后 ， 数 据 再 经 由 串 行 接口 发 给 串 行 设备 ， 串 行 设备 有 了 反 
馈 后 ， 把 数据 发 送 给 串 行 接口 ， 再 经 串 行 接口 返回 给 CPU， 并 行 设 备 也 是 如 此 。 
任何 不 兼容 的 问题 ， 都 可 以 通过 增加 一 “ 层 ” 来 解决 。 在 CPU 和 外 设 之 间 的 这 一 层 就 是 IO 接口 。IO 
接口 形式 不 限 ， 它 可 以 是 个 电路 板 ， 也 可 以 是 块 芯 片 ， 甚 至 可 以 是 个 插 槽 ， 它 的 作用 就 是 在 CPU 和 外 设 之 
间 相 互 做 协调 转换 ， 如 CPU 和 外 设 速度 不 匹配 ， 它 就 是 变速 箱 ，CPU 和 外 设 信号 不 通用 ， 它 就 是 翻译 机 。 
这 样 通过 加 了 中 间 层 后 , 工作 就 被 划分 成 多 个 部 分 , 每 个 部 分 都 有 专人 负责 , 大 家 都 轻松 了 , 多 好 啊 。 
不 过 ， 说 的 还 是 有 点 抽象 是 吗 ? 那 就 整 点 具体 的 ， 机 箱 里 的 声卡 就 是 驱动 音响 设备 的 IO 接口 ， 本 章 
绍 的 显卡 也 同样 是 一 种 IO 接口 ， 它 是 用 来 驱动 显示 器 的 。 也 许 您 打开 机 箱 后 也 未 发 现 我 说 的 声卡 和 显 
那 是 不 是 就 没有 它们 呢 ? 当 然 不 会 ， 要 是 听 不 到 声音 看 不 到 图 像 ， 人 们 买 电脑 干吗 ? 用 来 学 习 的 ? 其 
， 
| 






















































































































































































































































































































































































































































































































































































































































































] 被 集成 在 主板 芯片 组 中 了 ， 您 用 的 就 是 集成 声卡 和 集成 显卡 。 这 下 清楚 多 了 吧 ， 下 面 咱们 还 是 继续 
抽象 的 。 
IO 接口 是 连接 CPU 与 外 部 设备 的 逻辑 控制 部 件 ， 既 然 称 为 逻辑 ， 就 说 明 可 分 为 硬件 和 软件 两 部 分 。 
硬件 部 分 所 做 的 都 是 一 些 实质 具体 的 工作 ， 其 功能 是 协调 CPU 和 外 设 之 间 的 种 种 不 匹配 ， 如 双方 由 于 速 
度 不 匹配 ， 那 IO 接口 就 实现 数据 缓冲 以 减少 等 待 时 间 ， 数 据 格式 不 匹配 ，IO 接口 就 在 这 两 种 格式 间 互 相 
转换 。IO 接口 内 部 实际 上 也 是 由 软件 来 控制 运作 的 ， 这 就 是 所 谓 的 “逻辑 ”部 分 ， 所 以 软件 是 指 用 来 控 
制 接口 电路 工作 的 驱动 程序 以 及 完成 内 部 数据 传输 所 需要 的 程序 。 

既然 提 到 了 软件 ， 这 就 意味 着 编程 ， 这 样 一 来 ，IO 接口 芯片 又 可 按照 是 否 可 编程 来 分 类 ， 可 分 为 可 
编程 接口 芯片 和 不 可 编程 接口 芯片 。 
接口 的 作用 是 连接 处 理 器 和 外 部 设备 ， 如 果 外 部 设备 很 简单 ， 傻 瓜 型 的 ， 不 需要 设 定 就 直接 能 用 ， 就 
可 以 用 不 可 编程 接口 芯片 与 处 理 器 连接 ， 不 可 编程 接口 芯片 是 种 非常 简单 的 IO 接口 。 

当然 物理 设备 还 是 很 贵重 的 ， 并 且 计 算 机 中 的 IO 接口 数量 也 是 有 限 的 ， 所 以 我 们 当然 希望 IO 接口 功能 
越 多 越 好 ， 可 以 设置 多 种 工作 模式 ， 甚 至 允许 多 个 外 部 设备 通过 同一 个 IO 接口 芯片 与 处 理 器 连接 。 计 算 机 与 
IO 接口 的 通信 是 通过 计算 机 指令 实现 的 , 当 我 们 需要 定制 某 些 功能 时 , 我 们 也 必须 用 计算 机 指令 告诉 IO 接口 : 
哪些 设备 连接 在 此 IO 接 口上， 此 了 O 接口 的 工作 模式 等 。 这 种 通过 软件 指令 选择 IO 接口 上 的 功能 、 工 作 模 式 
的 做 法 ， 称 为 “IO 接口 控制 编程 ” 这 通常 是 用 端口 读 写 指令 in/out 来 实现 的 ， 后 面 会 说 到 。 

CPU 太 忙 了 , 它 的 时 间 特 别 宝贵 ,为 了 简化 CPU 访问 外 部 设备 的 工作 ， 能 够 轻松 地 同 任何 硬件 通信 ， 
大 家 就 约定 好 IO 接口 的 功能 。 

1. 设置 数据 缓冲 ， 解 决 CPU 与 外 设 的 速度 不 匹配 

CPU 和 外 设 速度 上 的 差异 可 以 通过 设置 缓冲 区 来 解决 ， 也 就 是 说 ， 数 
的 时 候 (无 论 缓冲 区 是 否 满 了 〉 就 传送 出 去 。 

2. 设置 信号 电 平 转换 电路 

CPU 和 外 设 的 信号 电 平 不 同 ， 如 CPU 所 用 的 信号 是 TTL 电 平 ， 而 外 设 大 多 数 是 机 电 设 备 ， 故 不 能 使 
用 TTL 电 平 驱动 ， 可 以 在 接口 电路 中 设置 电 平 转换 电路 来 解决 。 

3. 设置 数据 格式 转换 

外 设 是 多 种 多 样 的 ， 输 出 的 信息 可 能 是 数字 信号 、 模 拟 信号 等 ， 而 CPU 只 能 处 理 数 字 信 号 。 数 字 信 
号 需要 经 过 数 / 模 转换 (D/A) 成 模拟 量 才 能 被 送 到 外 设 以 驱动 硬件 ， 模 拟 量 也 同样 需要 经 过 模 / 数 (A/D) 
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E 存 储 在 缓冲 区 里 ， 等 需要 
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转换 成 数字 量 


用 的 都 是 数字 信号 ， 这 也 牵 


外 设 使 用 并 行 或 串 行 数据 者 
4. 设置 时 序 控制 























双方 时 序 不 同 ， 接 口 


能 被 CPU 处 理 。 所 以 接 
涉 到 格式 和 字 长 的 问题 ， 


电路 来 
硬件 的 工作 也 按照 某 种 时 序 ， 
电路 就 























有 可 能 ， 所 以 IO 接 








同步 CPU 和 外 部 设备 


中 必须 能 够 识 














要 | 


它们 都 有 自己 的 
协调 这 两 种 不 同 的 时 


时 序 



































电路，IO 接口 用 它们 来 控 种 




















上 和 名 








管理 











这 样 CPU 先 “ 问 ”硬件 
5. 提供 地 址 译 码 























后 “区 





答 ?” 
哺 ! » 























CPU 同 多 个 硬件 # 





接口 


上 的 寄存 器 ， 来 存储 这 些 信息 





J 交道 ， 每 个 硬件 要 反馈 的 信 
但 同一 时 刻 ， 


内 容 。 





硬件 。 随 后 硬 











牛 有 了 反馈 后 ， 其 








站 





如 CPU 使 用 的 是 8 位 、 


系统 ， 就 像 CPU 工作 在 自 
闻 计 法 。 例 如 ，CPU 发 控制 信号 、 定 时 信号 给 IO 接口 
应 答 信 号 也 需要 通过 接口 


就 实现 了 一 次 握手 ， 之 后 便 可 以 实现 IO 的 同步 操作 。 











全 
个 朋 





个 端口 


电路 中 需要 包括 A/D 转换 器 和 D/A 转换 器 。 


另外 ， 即 使 双方 使 








16 位 或 32 位 并 行 数据 ， 而 











! 别 格式 并 且 转 换 成 对 方 需要 


的 形式 才 行 。 








is | 








口 提供 地 址 译 码 电 路 ， 使 CPU 可 以 选中 茶 个 端口 ， 使 其 可 以 访问 数据 总 线 。 




















在 后 来 新 加 入 的 硬件 
既然 都 说 到 IO 接口 了 ， 





只 要 符合 此 约定 就 能 


不 知道 各 位 有 没有 疑 





司 CPU 数 和 





问 , CPU 是 怎样 访问 到 IO 接 


居 交 换 ， 这 样 CPU 就 可 以 轻松 应 对 种 类 万 了 





己 的 晶振 


时 序 上 一 样 。 





返回 





给 CPU， 


息 很 多 ， 所 以 一 个 IO 接口 必须 包含 多 个 端口 ， 即 IO 
和 CPU 数据 交换 ， 


这 就 需要 IO 接 


的 硬件 啦 。 











呢 ? 肯定 





得 有 个 链 路 吧 ? 








什么 ? 有 隐约 听 到 有 同学 开玩笑 说 : CPU 用 无 线 访问 其 他 设备 。 哈 哈 ， 不 知道 各 位 听 说 过 没有 ， 无 线 的 





端 是 有 线 。 无 论 无 线 设备 上 





终端 是 
物理 链 路 啦 ， 











尔 看 主 板 上 密 I 


























密 麻 麻 的 线路 训 

















组 电线 ,这 条 电线 | 


上 。 由 于 这 条 























就 是 大 家 所 说 的 总 线 。 总 之 ，， 


] 于 传送 信号 ， 故 和 
EE 线 是 供 大 家 使 用 的 公共 线路 ， 属于 所 有 设备 共享 ， 所 以 形象 地 称 


你 为 信号 线 。 


如 何 强大 ， 最 终 在 网 络 的 那 一 头 ， 必 然 是 物理 
ti 知道 为 什么 有 些 人 称 主板 为 线路 板 啦 。 



































那些 想 和 其 他 硬 介 


























总 线 并 不 是 和 








说 ， 
备 ， 可 以 选择 连接 上 总 线 ， 

同一 时 刻 ，CPU 只 能 和 
同时 想 和 CPU 对 话 时 ， 国 


单独 一 叙 呢 ? 




















| 对 众多 接 
这 个 工作 不 应 该 由 CPU 来 做 ， 前 














也 可 以 
一 个 IO 























太 忙 了 ， 





加 一 层 ， 这 一 层 的 责任 是 除了 


种 内 部 总 线 。 由 于 它 的 使 命 ， 


(IO controlhub，ICH)， 也 就 是 南 桥 芯 片 ， 如 图 
说 到 了 南 桥 ， 多 少 还 要 提 一 
其 实 是 散热 片 ， 








上 标 
CPU 
CPU 
北桥 


上 北桥 部 分 
的 主板 中 是 这 样 
内 部 ， 所 以 支持 AMD 


























好 啦 ， 说 完 啦 ， 
部 总 线 是 专用 的 ， 它 


























桥 内 部 集成 了 一 些 IO 接口 ， 
PCI 设备 、 电 源 管 理 等 接 





























还 是 好 钢 使 在 刀刃 上 吧 ， 既 然 分 层 能 解决 问题 ， 











它 的 名 字 就 叫做 输 








在 它 下 二 





















































1 于 这 























不 管 了 吗 ? 必须 得 管 ， 





在 南 桥 内 部 的 接口 对 微型 
这 毕竟 是 它 的 了 
为 了 支持 这 些 非 必要 的 设备 〈 当 然 主要 是 为 了 方便 
向 灭亡 )， 南 桥 提供 了 专门 用 于 扩展 的 接口 ， 这 就 是 PCI 接口 。 


接口 ，pci 设备 可 以 即 插 即 用 。 由 于 它们 延伸 到 了 南 桥 外 面 ， 又 像 公路 一 样 








二 





中 裁 IO 接口 的 竞争 ， 还 要 连接 各 
i 入 输 
3-11 
句 北 桥 蕊 片 的 作用 。 
才 是 北桥 。 日 


续 说 南 桥 。CPU 通过 




















咱们 再 








出 控 种 
所 示 。 
图 3-11 





上 中心 























内 部 总 





说 的 好 





交流 的 设备 就 要 


日 于 南 桥 和 北桥 一 般 是 成 对 
的 (话说 ，AMD 为 了 减少 CPU 同 北桥 交换 数据 的 成 本 ， 
的 板子 上 未 必 有 北桥 蕊 片 )。 南 桥 月 
于 连接 高 速 设备 ， 如 内 存 。 

点 到 为 止 ， 还 得 继 
它 只 ; 通 向 位 于 南 桥 中 的 CPU 接口 。 
看 出 ， 南 桥 二 字 中 的 桥 ， 其 实 对 应 的 是 hub 这 个 单词 ， 它 们 都 意 为 “公共 、 


Ff 粮 ， 其 实 还 是 一 








A 图 











设备 在 支撑 。 所 以 ， 不 如 用 
其 实 这 物理 链 路 就 是 一 
想 办 法 连接 到 这 
之 为 bus， 公 共 汽 车 ， 也 








个 











条 线 





象 出 来 的 东西 ， 它 就 是 把 大 家 连接 到 一 起 的 电线 。 再 形象 一 点 
总 线 就 像 一 条 高 速 公 路 ， 这 公路 上 有 很 多 出 口 可 以 让 汽车 进出 , 汽车 在 计算 机 中 就 相当 于 各 种 硬件 设 
选择 从 总 线 分 离 。 

接口 通信 ， 当 很 多 的 IO 接口 
的 爱慕 ，CPU 会 选择 和 谁 
面 说 过 啦 ，CPU 























3-11 主板 上 的 南 桥 























b 现 的 ， 至 少 在 支持 Intel 
已 经 把 北桥 的 工作 放 到 了 
月 于 连接 pci、pci-express、AGP 等 低速 设备 ， 


线 连接 到 南 桥 蕊 片 中 的 内 部 ， 这 个 内 











条 电线 而 
集合 ”， 所 以 不 难 想像 ， 在 南 





如 并 口 硬盘 PATA《〈 就 是 我 们 平时 所 说 的 IDE 硬盘 )、 串 口 


已 。 从 名 字 上 可 以 














硬盘 SATA、USB、 





些 接 口 对 微型 计算 机 来 说 必 不 可 少 ， 
计算 机 来 说 是 不 可 少 的 ， 除了 这 些 之 外 ， 那 些 可 有 可 无 的 设备 ， 
[ 作 。 南 桥 世 片 内 部 总 线 示 意 如 图 3-12 所 示 。 





它们 就 直接 扎根 在 





南 桥 内 部 啦 。 












































扩展 , 不 易 扩 展 的 产品 意味 着 从 出 生 那 天 就 开始 走 
在 主板 上 有 很 多 插 模 ， 它 们 就 是 预 留 的 pci 
， 很 多 pci 设备 都 可 以 连接 上 来 ， 








难道 南 桥 就 











103 





所 以 这 条 延长 的 PCI 接 
































便 成 了 PCI 总线。 结合 图 3-11 和 图 3-12。 看 到 主板 | 


想到 ， 它 们 其 实 都 “ 骑 ” 在 一 条 电线 上 ， 这 样 理解 总 线 容易 些 吗 ? 



































意义 不 明确 ， 




















看 到 一 个 总 线 又 一 个 总 线 的 ， 如 果 感 觉 烦 乱 的 话 ， 说 明 总 线 这 个 记 








也 许 翻译 成 “公共 线路 ”最 直接 。 简 单 的 东西 通过 术语 搞 






































实现 相互 通信 




































































1 于 用 途 不 同 











以 上 都 是 接口 的 硬件 部 分 ， 咀 们 最 终 是 要 通过 软件 方式 使 / 








得 好 深奥 ， 完 全 一 副 不 明 觉 厉 的 样子 。 其 实 大 家 想 想 看 ， 这 么 多 设备 
， 不 得 用 电线 连接 到 一 起 吗 ? 只 不 过 大 多 数 情况 下 ， 连 接 
到 这 条 电线 上 的 设备 不 止 两 个 ， 总 的 数量 较 多 ， 所 以 称 之 为 “总 ” 线 。 

















女 


， 这 些 电线 有 了 各 种 各 样 的 名 字 ， 如 地 址 总 线 、 数 据 总 线 、 内 部 总 线 
ISA 总 线 等 。 总 之 ， 不 要 被 总 线 这 个 词 吓 到 ， 它 其 实 就 是 电线 。 













































































硬件 ， 下 面 看 看 咱们 为 了 驱动 这 些 硬件 要 做 什么 。 











IO 接口 在 诞生 之 初 ， 就 被 设计 成 要 通过 寄存 器 的 方式 同 CPU 通 





























信 ， 其 内 部 有 

















器 位 于 IO 接 
































器 就 称 为 端 





AN 








器 会 启动 80 端口 ， 这 是 两 码 事 )。 











IO 接口 是 连接 CPU 和 硬件 的 桥梁 , 一 端 是 CPU， 另 一 端 是 硬件 。 
口 开放 给 CPU 的 接口 ， 一 般 的 IO 接口 都 有 一 组 端 








端口 是 IO 接 








专用 于 数据 交互 的 寄存 器 ， 只 不 过 这 里 所 说 的 这 些 寄存 
， 为 了 区 别 于 CPU 内 部 的 寄存 器 , IO 接口 中 的 寄存 
这 可 不 是 网 络 应 用 程序 所 开 的 那 种 端口 ， 如 网 络 


PCI USB 
目 10 接 口 10 接 [ 


服务 















































每 个 端口 都 有 自 











相对 来 说 还 是 很 复杂 的 ， 所 以 ， 当 看 到 某 个 IO 接口 ] 


















































经 为 咱们 极 大 地 简化 了 操作 。 





端口 也 是 寄存 器 ， 寄 存 器 就 有 数据 宽度 ， 有 8 位 、16 位 、32 位 ， 各 个 设备 是 不 一 样 的 ， 看 






































己 的 用 途 ， 甚 至 有 时 ， 一 个 端口 在 不 同情 况 下 有 不 同 的 用 途 。 可 见 IO 接 








上 那些 并 排 的 插 档 时 ， 大 家 要 


USB 

















A 图 3-12 ” 南 桥 芯片 























内 部 总 线 示 意图 


男 一 端的 硬件 ， 
上 那么 多 端口 的 介绍 而 烦 乱 时 ， 停 止 抱 她 ，IO 接口 已 


















































税 











9 己 安排 了 。 








如 何 访问 到 端口 呢 ? 外 设 中 的 rom 既然 可 以 通过 内 存 映 射 来 访问 , 端口 也 可 以 , 确实 有 些微 机 系统 中 


是 这 样 做 的 ， 




















机 系统 把 端 




































































把 一 些 内 存 地 址 作为 端口 的 映射 ,访问 这 些 内 存 地 址 就 相当 于 访问 了 这 些 端口 。 还 有 一 些微 
独立 编 址 ， 把 所 有 端口 从 0 开始 编号 ， 位 于 一 个 IO 接口 上 的 所 有 端口 号 都 是 连续 的 。 以 后 
讲解 硬盘 的 时 候 大 家 就 会 看 到 了 。 





IA32 体系 系统 中 , 因为 用 于 存储 端口 号 的 寄存 器 是 16 位 的 , 所 以 最 大 有 65536 个 端口 , 即 0 一 65535 。 


要 是 通过 内 存 映射 ， 端 口 就 可 以 用 mov 指令 来 操作 。 但 由 于 


内 存 来 操作 ， 


Intel 汇编 语言 的 形式 是 :操作 码 目的 操 






































对 此 CPU 提供 了 专门 的 指令 来 干 这 事 ，in 和 out。 











作 数 ， 源 操作 数 。Intel 采用 这 种 格式 的 原 


表达 “目的 操作 数 ”=“ 源 操作 数 ” 更 形象 ， 如 同 a=6 这 种 形式 。 











P34 





in 指令 用 











于 从 端口 中 读 取 数 据 ， 其 一 般 形式 是 : 








(1) in al dx; 
(2) in ax, dX。 

















其 中 al 和 ax 用 来 存储 从 端口 获取 的 数据 ，dx 是 指 端口 号 。 
这 是 固定 用 法 ， 只 要 用 指令 ， 源 操作 数 《〈 端 口号 ) 必须 是 dx， 而 目 


























决 于 dx 端口 指 代 的 寄存 器 是 8 位 宽度 ， 还 是 16 位 宽度 。 
out 指令 用 于 往 端口 中 写 数据 ， 其 一 般 形 式 是 : 


























(1) out dx, al; 

(2) out dx,ax; 

(3) out 立即 数 , al; 
(4) out 立即 数 , ax。 
注意 啦 ， 这 和 in 指令 相反 ，in 指令 的 源 操 作 数 是 端口 号 ， 而 out 指令 中 的 目的 操作 数 是 端口 号 。 














如 果 上 再 
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i 看 着 有 点 凌乱 ， 给 大 家 总 结 一 下 in 和 out 指令 共性 。 









































六 




















j 的 是 独立 编 址 ， 所 以 就 不 能 把 它 当 作 


的 操作 数 是 用 al， 还 是 ax， 取 























(1) 在 以 上 两 个 指令 中 ，dx 只 做 端口 号 之 用 ， 无 论 其 是 源 操作 数 或 目的 操作 数 。 

(2) in 指令 从 端口 读数 据 ， 可 以 认为 端口 是 数据 源 ， 所 以 端口 出 现在 “ 源 操 作 数 ”的 位 置 。 读 出 来 
的 数据 要 有 个 “目的 地 ”来 存放 ， 所 以 in 指令 中 存放 数据 的 地 方 出 现在 “目的 操作 数 ” 位 置 。 

out 指令 是 把 数据 写 入 端口 指向 的 寄存 器 ， 在 这 里 ， 端 口 是 数 据 的 “目的 地 ”所 以 端口 出 现在 目的 操 
作 数 的 位 置 。 待 写 入 的 数据 总 该 有 个 “来 源 ” 所 以 out 指令 中 的 “ 源 操作 数 ” 是 数据 来 源 。 
在 以 上 的 两 个 指令 中 ， 端 口号 和 数据 的 位 置 ， 取 决 于 它们 各 自 的 角色 是 源 操 作 数 ， 还 是 目的 操作 数 。 

(3) 在 以 上 两 个 指令 的 两 个 操作 数 中 ， 无 论 是 对 于 源 操作 数 ， 还 是 目的 操作 数 ， 除 端口 号 外 ， 那 个 作 
为 数据 的 操作 数 《in 指令 中 作为 数据 目的 地 ，out 指令 中 作为 数据 源 )， 一 律 用 al 寄存 器 存储 8 位 宽度 的 
数据 ， 用 ax 寄存 器 存储 16 位 宽度 的 数据 ， 至 于 用 al， 还 是 ax 存 数据 ， 要 看 端口 指向 的 寄存 器 宽度 是 多 
少 ， 它 要 和 端口 寄存 器 的 位 宽 保 持 一 致 ， 不 能 丢失 数据 精度 。 

(4) in 指令 中 ， 端 口号 只 能 用 dx 寄存 器 。 

(5) out 指令 中 ， 可 以 选用 dx 寄存 器 或 立即 数 充当 端口 号 。 

真心 希望 大 家 看 完 后 不 会 更 乱 了 。 
好 啦 ， 有 了 这 些 硬 件 相 关 的 知识 ， 对 以 后 我 们 操作 其 他 硬件 来 说 足够 了 ， 我 们 不 需要 学 习 得 多 全 ， 够 
用 就 好 。 还 是 那 名 话 ， 以 后 用 到 哪 再 学 不 迟 。 大 家 辛苦 了 ， 祝 大 家 今后 学 习 顺 利 。 
3.3.2 ”显卡 概述 

在 上 一 章 的 mbr 中 我 们 刚刚 向 屏幕 输出 了 “1 MBR” 这 几 个 字符 ， 这 种 喜悦 还 没有 过 去 ， 我 就 要 给 
家 泼冷水 了 : 这 种 打印 字符 的 方法 马上 就 用 不 了 啦 。 

mbr 运行 在 实 模式 下 ， 所 以 在 实 模式 下 也 可 以 用 BIOS 的 0x10 中 断 打 印字 符 串 ， 这 是 因为 : 首先 中 断 
向 量 表 只 在 实 模 式 下 存在 ，BIOS 中 断 是 要 依赖 于 中 断 向 量 表 的 。 可 是 ， 将 来 的 世界 是 由 保护 模式 置 着 的 ， 
保护 模式 下 就 没有 中 断 向 量 表 了 ， 所 以 也 就 无 法 用 BIOS 中 断 。 其 次 ， 不 希望 有 更 多 的 依赖 ， 好 不 容易 脱 
离 了 对 操作 系统 的 依赖 , 又 引入 了 一 个 新 的 依赖 , 这 不 科学 。 最 后 , 难道 大 家 不 想 直接 同 显卡 说 几 句 话 吗 ? 

万 变 不 离 其 宗 ， 肯 定 的 是 BIOS 的 中 断 例 程 中 凡是 涉及 向 屏幕 打印 之 类 的 功能 ， 必 然 也 是 通过 操作 显 
卡 来 实现 的 , 只 是 通过 封装 成 中 断 处 理 程 序 给 大 家 方便 调用 而 已 , 我 们 也 不 用 关心 显卡 操作 的 细节 。 等 下 ， 
往 屏 幕 上 输出 信息 操作 的 对 象 不 是 显示 器 吗 ? 你 这 一 直 说 显卡 是 怎么 回 事 ?如果 您 也 有 这 样 的 疑问 , 我 这 
撒 带 着 说 解释 一 下 。 
某 些 IO 接口 也 叫 适配器 ， 适 配器 是 驱动 某 一 外 部 设备 的 功能 模块 。 显卡 也 称 为 显示 适配器 ， 不 过 归 
根 结 底 它 就 是 IO 接口 ， 专 门 用 来 连接 CPU 和 显示 器 。 我们 想 操 作 显 示 器 ,没有 直接 的 办 法 ， 只 能 通过 它 
的 IO 接口 一 一 显卡 。 

稍微 说 一 下 显卡 。 自 从 几 年 前 AMD 把 ATI 收购 之 后 ， 市 面 上 的 显卡 就 分 为 两 大 类 了 ，A 卡 和 NN 卡 。 
A 卡 是 指 以 AMD 为 阵营 的 显卡 厂商 , N 卡 是 以 nvidia 为 阵营 的 显卡 厂商 。 大 家 平时 见 到 的 七 彩虹 、 技 嘉 、 
昂达 之 类 的 显卡 ， 它 们 用 的 核心 要 么 是 A 卡 ， 要 么 是 N 卡 ， 有 的 厂商 两 个 核心 都 用 ， 开 发 各 自 的 版 本 。 
他 们 不 自己 研发 GPU (显卡 的 CPU 称 为 GPU)， 只 是 在 人 家 的 基础 上 做 本 地 化 开发 。 这 种 关系 就 像 安 晶 
手机 和 安 卓 原生 系统 一 样 。 
话说 我 在 2003 年 的 时 候 见 过 一 块 特别 霸气 的 显卡 ， 这 块 显卡 一 看 就 是 发 烧 级 的 。 为 什么 呢 ? 一般 的 
显卡 是 要 插 在 主板 上 的 ， 由 于 这 块 显卡 做 得 特别 大 ， 看 上 去 感觉 像 是 主板 插 在 了 显卡 上 。 
显卡 是 pci 设备， 所 以 是 安装 在 主板 上 pci 插 槽 上 的 ，pci 总 线 是 共享 并 行 架构 ， 并 行 数据 就 要 保证 数 
据 发 送 后 必须 同时 到 达 目 的 地 ， 因 为 这 关系 到 数据 的 顺序 ， 不 能 发 过 去 后 成 一 团 乱 麻 。 例 如 8 位 并 行 总 线 
就 需要 同时 发 送 这 8 位 ， 接 收 方 也 要 同时 接收 这 8 位 才 行 。 虽然 貌似 并 行 传输 是 高 效 的 ,但 对 于 要 保证 同 
时 接收 n 位 数据 ， 这 是 有 困难 的 ， 随 着 并 行 数 据 的 位 宽 越 来 越 大 ， 这 种 困难 也 越 来 越 明 显 。 于 是 串 行 传输 
很 好 地 解决 了 这 一 问题 ， 一 次 只 发 一 位 ， 这 样 顺 序 问 题解 决 了 ， 数 据 到 目的 地 看 再 组 合 到 一 起 就 成 了 。 于 
是 就 有 了 PCI Express 总 线 ， 这 就 是 串 行 设 备 ， 简 称 pcie。 现 在 的 显卡 都 是 串口 的 了 ， 包 括 上 面 说 的 A 卡 
和 N 卡 。 有 同学 会 问 吧 ， 一 次 一 位 地 传输 ， 那 多 慢 啊 ， 听 上 去 不 如 并 行 传输 快 。 但 大 家 不 要 忘记 了 ， 传 
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输 速 度 一 部 分 取决 于 并 行 的 数据 量 ， 一 部 分 还 要 取决 于 传输 频率 呢 。 串 口 显卡 一 次 虽然 只 传输 1 位 , 但 人 
家 传输 的 频率 快 啊 ， 不 光 是 显卡 ， 现 在 的 硬盘 都 是 串口 的 ， 可 见 串 行 传输 速率 可 是 极 高 的 。 

总 之 以 后 我 们 的 输出 都 是 通过 直接 操作 显卡 来 实现 的 ， 而 显卡 给 我 们 的 输入 接口 是 显存 和 端口 ,我 们 
主要 用 的 是 显存 。 显 存 作 为 接口 ， 说 白 了 ， 就 是 它 把 显存 直接 给 我 们 用 ， 说 :“ 把 你 要 输出 的 内 容 写 到 这 
里 面 ， 我 照 着 往 屏 幕 上 打印 ” 

好 啦 ， 本 节 到 这 儿 结 束 了 。 

3.3.3 显存、 显卡、 显示 器 

为 了 能 够 看 到 图 像 ， 我 们 需要 显示 器 。 无 论 是 哪 种 显示 器 ， 它 都 是 由 显卡 来 控制 的 ， 我 们 没 必要 了 解 液晶 显 
示 器 和 普通 CRT 显示 器 的 差别 。 无 底 是 哪 种 显卡 ， 它 提供 给 我 们 的 可 编程 接口 都 是 一 样 的 ; IO 端口 和 显存 。 

显存 是 由 显卡 提供 的 ， 它 是 位 于 显卡 内 部 的 一 块 内 存 ， 所 以 它 称 为 显存 。 关 注 过 显卡 产品 的 同学 可 能 
会 知道 ， 有 的 标明 了 DDR 512M， 有 的 则 声称 是 DDR2 1G。 这 指 的 就 是 显存 大 小 。 显 卡 的 工作 就 是 不 断 








地 读 取 这 块 内 存 ， 随 后 将 其 内 容 发 送 到 显 
色彩 斑 

















示 右 。 





下 











我 们 能 在 显示 器 上 见 到 的 各 种 1 


器 上 看 到 Linux 终端 上 的 黑 
成 上 


FE 


并 
的 ， 显 存 中 的 每 一 位 都 对 应 
我 们 打开 一 个 网 页 后 ， 上 
应 一 个 像素 ， 该 位 要 么 是 0， 要 么 是 1 
示 彩 色 的 呢 ? 是 啊 ， 一 位 只 能 显示 两 和 














7 
了 















































对 
下 


并 








24 位 真 彩色 吧 ， 没 听 过 也 没关系 ， 就 当 您 








色 


Do 


里 





来 表示 一 种 颜 人 





也 就 是 3 字 节 的 数据 
平时 就 知道 赤 橙 记 
之 前 有 不 少 同学 的 理解 只 是 概念 4 
































六 








， 说 明显 
屏幕 上 的 一 
面 所 加 载 的 图 片 ， 曾 


jax 


夺 绿 青 蓝 紫 7 种 颜色 ， 我 不 是 色盲 ， 不 过 这 么 多 颜 
的 ， 现 在 要 应 


澜 的 图 像 , 说 明显 卡 可 以 让 显示 器 工作 在 


图 形 模式 ， 能 够 在 显示 














FE 可 以 让 显示 器 工 
个 像素 点 。 


是 显示 器 在 























图 


芷 在 字符 模式 。 屏 幕 是 由 密密麻麻 的 


区 模式 下 的 效果 。 按 到 


像素 组 




















说 ， 显 存 中 的 一 位 








， 如 果 让 它 显 示 颜 色 ， 
色 ， 看 来 只 有 增加 
## 


听 过 了 ,哈哈 


口 ， 















































能 表示 多 少 种 颜色 呢 ?”2 的 24 次 方 等 于 16777216 种 。 天 


一 个 像素 顶 多 显示 黑 
立 数 来 达到 彩色 的 效果 了 。 各 位 肯定 
i 实 24 位 真 彩色 就 是 用 24 个 bit 表示 一 个 


四 





白 两 色 啊 ， 它 是 如 何 
听 说 过 
颜色 


啊 ， 我 



































色 让 我 分 类 





























楚 ， 


臣 志 做 不 到 啊 。 























I 实践 中 啦 ， 在 黑白 图 


了 全 



































素 是 1 对 1 的 ， 因 为 只 有 ? 








正 是 在 物理 上 保护 了 显示 器 。 而 在 真 彩 人 

显示 器 分 不 清楚 给 它 的 数据 是 文本 ， 
信息 ， 即 像素 的 位 置 及 像素 的 颜色 。 
的 输出 ， 最 直观 的 想法 是 ， 人 们 想 输 
让 您 心中 仿佛 有 一 万 只 草 泥 马 奔腾 而 过 ? 
看 清 他 的 头发 。 现 在 草 泥 马 是 两 万 只 了 ? 



















































































二 














计算 机 的 发 明 是 为 了 解决 问题 ， 而 不 是 带 来 问题 ， 


砍 种 颜色 ， 所 以 只 要 显 
的 是 白色 。 若 该 位 为 0， 该 像素 就 不 会 被 点 亮 ， 只 
色 中 ， 是 用 


只 有 人 才 
8 什么 图 像 就 是 计算 出 要 将 明 



































存 中 上 
要 不 管 该 像素 就 是 
24 位 对 应 
还 是 图 像 ， 在 它 眼 里 全 者 






































形 模式 中 ， 显 存 位 与 屏幕 像 
的 对 应 位 置 为 1， 屏幕 上 的 相应 像素 就 被 点 亮 ， 呈 现 
划 色 ， 所 以 用 呈 
个 像素 ， 所 以 才 呈 现 H 
是 图 像 ， 粒 度 更 














a 色 壁 纸 当 桌 


[|| 玫 1 
彩色 


] 致 点 来 


田 ， 才 真 
































说 ， 全 是 像素 














那 是 花草 ， 那 是 
Ph 些 像素 点 亮 。 


什么 , 没有 ? 那 您 帮 我 输出 爱 因 斯 坦 的 肖 


能 分 得 出 这 是 文字 ， 



































星空 。 所 以 ， 
这 简短 的 一 句 话 ， 有 没有 





对 于 图 像 




















像 给 我 看 ， 注 意 ， 我 要 




















听 上 去 这 种 用 像素 拼 读 图 像 的 方 























法 真 的 不 ， 


于 加 公 移 山 。 




















攻 明 的 工程 师 当 然 有 


更 人 道 

















式 是 一 个 字符 对 应 一 字 节 的 编码 ， 








编码 本 
是 某 种 固定 关系 ， 如 像 “ 藏 头 诗 ”这 类 ， 


只 要 往 显存 中 写 入 这 
完成 像素 的 拼凑 。 比 如 字符 A 的 编码 就 是 0x41， 在 它 后 国 
质 上 就 是 按照 某 种 约定 生成 一 组 数 














个 

















az 码 谨 


于 付 

















的 B 的 编码 增加 1， 





编码 ， 显 卡 就 知道 这 是 要 打印 此 字符 ， 


的 方法 ,解决 问题 的 方 
1 它 帮 你 























即 0x42 。 


中 ， 这 种 约定 可 以 是 某 种 数学 关系 ， 如 算法 、 公 式 ， 或 者 











关键 字 是 文本 中 





固定 的 位 置 ， 或 者 将 这 种 对 应 关系 事 





E 写 到 表 














格 中 ， 通 过 查 表 得 到 输出 。 解 码 就 是 根 所 














进行 解码 。 

最 常见 的 编码 就 是 交警 指挥 交通 时 的 手势 ， 每 种 手势 的 意义 司机 都 清楚 ， 但 
就 不 明白 了 。 

这 样 ， 大 家 都 约定 好 了 ， 以 后 字符 A 就 用 十 六 进 














居 此 约定 来 做 逆 运 算 。 破 译 就 是 找 出 编码 ! 



















































































a 


认为 这 是 字符 A。 当 然 这 还 是 有 应 
端 把 接收 的 内 容 当 作文 本 来 处 理 时 ，0x4 
定义 的 ， 了 
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] 的 前 提 ， 也 得 分 场合 ， 不 是 说 只 要 0x41 就 


FE 要 是 看 处 理 双 方 如 何 看 待 这 一 


= 


1 才 被 赋予 字符 








使 用 的 是 哪 种 约定 并 





如 果 不 懂 交通 规则 ， 自 然 





制 数字 0x41 来 表示 ， 表 管 是 谁 发 来 的 这 个 数 ， 我 就 
日. 忆 Ai 


起 子 付 A， 
A 的 意义 。 数 字 的 意义 是 被 生产 者 和 消费 者 共 


应 该 说 是 接收 








国 








组 数字 ， 这 就 是 约定 的 体现 。 




















既然 是 约定 ， 大 家 都 要 共同 遵守 才 行 ， 不 能 我 发 0x38 代表 A， 你 认为 0x38 是 delete， 坚 决 不 能 男 起 
山头 自立 门户 。 所 以 为 了 大 家 都 有 据 可 依 ， 一 套 字符 编码 横 空 出 世 ， 这 就 是 名 气 响 当当 的 ASCII 码 。 

美国 信息 互 换 标 准 代 码 (American Standard Code for Information Interchange，ASCII)。 它 是 由 美国 医 
家 标准 学 会 (American National Standard Institute，ANSI) 制定 的 ， 是 标准 单字 节 字 符 编 码 方案 ， 用 于 描 
述 纯 文本 。 标 准 ASCII 码 也 叫 基 本 ASCI 码 ， 用 7 位 二 进 制 数 来 表示 大 、 小 写字 母 ， 数 字 0 一 9、 标 点 符 
号 以 及 一 些 控制 字符 。 标 准 ASCI 表 中 的 字符 分 为 两 大 类 ， 一 类 是 不 可 见 字 符 ， 控制 字符 属于 此 类 ， 其 余 
为 可 见 字符 。 下 面 按 这 两 种 分 类 附 上 标准 ASCII 码 表 ， 见 表 3-13、 表 3-14。 




















































































































































































































































































































































































































































































































表 3-13 ASCI 码 中 的 控制 字符 
ASCII 控制 字符 
十 进 制 十 六 进 制 缩写 名 称 /意义 
0 00 NUL(null) 空 字 符 (Null) 
1 01 SOH(start of headling) 标题 开始 
2 02 STX (start of text) 本 文 开 始 
3 03 ETX (end of text) 本 文 结束 
4 04 EOT (end of transmission) 传输 结束 
5 05 ENQ (enquiry) 请 求 
6 06 ACK (acknowledge) 确认 回应 
7 07 BEL (bell) 响 铃 
8 08 BS (backspace) 退 格 
9 09 HT (horizontal tab) 水 平定 位 符号 
10 0A LF (NL line feed, new line) 换行 
11 0B VT (vertical tab) 垂直 定位 符号 
12 0C FF (NP form feed, new page) 换 页 
13 0D CR (carriage return) 回 车 
14 OE SO (shift out) 取消 变换 Shift out) 
15 OF SI (shift in) 由 用 变换 (Shift in) 
16 10 DLE (data link escape) 跳出 数据 通讯 
17 11 DC1 (device control 1) 设备 控制 一 (XON 启用 软件 速度 控制 ) 
18 12 DC2 (device control 2) 设备 控制 二 
19 13 DC3 (device control 3) 设备 控制 三 (XOFF 停 用 软件 速度 控制 》 
20 14 DC4 (device control 4) 设备 控制 四 
21 15 NAK (negative acknowledge) 拒绝 接收 
22 16 SYN (synchronous idle) 同步 用 暂停 
23 17 ETB (end of trans. block) 区 块 传输 结束 
24 18 CAN (cancel) 取消 
25 19 EM (end of medium) 连接 介质 中 断 
26 1A SUB (substitute) 替换 
27 1B ESC (escape) 跳出 
28 1C FS (file separator) 文件 分 割 符 
29 1D GS (group separator) 组 群 分 隔 符 
30 ]E RS (record separator) 记录 分 隔 符 
31 1F US (unit separator) 单元 分 隔 符 
127 7F DEL(delete) | 除 
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ASCII 码 中 的 可 见 字符 
ASCII 码 可 见 字符 



























































































































































































































































十 进 制 图 形 十 进 制 十 六 进 制 十 进 制 十 六 进 制 图 形 
32 (空格 ) 64 40 @ 96 60 
33 ! 65 41 A 97 61 a 
34 1 66 42 B 98 62 b 
35 67 43 © 99 63 c 
36 68 44 D 100 64 d 
37 % 69 45 E 101 65 e 
38 & 70 46 F 102 66 f 
39 ! 71 47 G 103 67 g 
40 ( 72 48 H 104 68 h 
41 ) 73 49 I 105 69 i 
42 * 74 4A J 106 6A j 
43 + 75 4B K 107 6B k 
44 3 76 4C L 108 6C 1 
45 77 4D M 109 6D m 
46 。 78 4E N 110 6E n 
47 / 79 4F O 111 6F 0 
48 0 80 50 P 112 70 p 
49 1 81 51 Q 113 71 q 
50 2 82 52 R 114 72 r 
51 3 83 53 S 115 73 s 
52 4 84 54 T 116 74 t 
53 5 85 55 U 117 75 u 
54 6 86 56 V 118 76 v 
55 7 87 57 W 119 77 Ww 
56 8 88 58 X 120 78 x 
57 9 89 59 ¥ 121 79 y 
58 90 5A Zz 122 7A z 
59 ; 91 5B [ 123 7B { 
60 < 92 5C \ 124 7C | 
61 = 93 5D ] 125 7D } 
62 > 94 5E ^ 126 7E 一 
63 ? 95 5F 二 
有 了 这 套 标准 ， 任 何 字 处 理 软件 只 要 认真 遵守 ， 就 能 得 到 别人 的 理解 和 认可 。 不 知 您 想 过 没有 ， 在 我 
们 人 类 看 了 ASCII 这 套 标准 后 , 我 们 已 经 变 成 了 字 处 理 软 从 要 想 往 显示 器 或 任何 一 个 文本 处 理 系统 
中 输出 文本 信息 ， 我 们 也 得 必须 按照 这 套 规则 来 编码 了 。 于 是 乎 ， 我 们 往 屏 幕 上 输出 字符 A， 我 们 要 输出 


数字 0x41 。 输出 


字符 a, 我 们 输出 数字 0x61 。 那 我 想 和 




















是 一 套 “字符 ”标准 ， 它 只 会 打 
输出 数字 0x30。 


所 以 想 输 昌 








介绍 了 这 么 多 ， 现 在 衣 














ENH 








符 ， 数 字 0 可 不 是 




















东西 才 行 ， 可 是 显存 在 哪 
在 表 1-1 中 ， 我 们 介绍 了 内 存 的 布局 。 从 中 我 和 
的 内 存 分 布 ， 见 表 3-15。 
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差 体验 一 把 了 ， 之 前 说 过 了 ， 显 存 


有 ， 怎 样 写 ? 












































屏幕 上 输出 0, 直接 输出 数字 0 能 行 吗 ?” 由 于 ASCII 
E 屏 幕 上 输出 的 0， 屏幕 上 的 0 那 可 是 字符 '0'， 



































给 我 们 的 接口 ， 咱 们 得 往 显存 里 写 点 





























与 显存 相关 的 部 分 列 在 了 下 面 ， 大 家 看 下 显卡 各 种 模 







































































表 3-15 显存 地 址 分 布 
起 始 结 束 大 小 用 途 
C0000 C7FFF 32KB 显示 适配器 BIOS 
B8000 BFFFF 32KB 用 于 文本 模式 显示 适配器 
B0000 B7FFF 32KB 用 于 黑白 显示 适配器 
A0000 AFFFF 64KB 于 彩色 显示 适配器 









































各 外 部 设备 都 是 通过 软件 指令 的 形式 与 上 层 接口 通信 的 ， 显卡 (显示 适配器 ) 也 不 例外 ， 所 以 它 也 有 
自己 的 BIOS。 位 置 是 0xC0000 到 0xC7FFF。 显 卡 文 持 三 种 模式 ， 文 本 模式 、 黑 白 图 形 模式 、 彩 色 图 形 
模式 。 我 们 只 关注 文本 模式 就 好 了 ， 最 终 我 们 要 实现 类 似 Linux 终端 那样 的 字符 界面 。 

我 们 平时 看 的 电影 ， 一 秒 24 帧 ， 每 一 帧 都 是 一 幅 图 片 ， 有 的 还 是 高 清 电 影 ， 可 想 而 知 ，1 秒 的 数据 
量 也 是 很 大 的 。 为 了 提速 ， 避 免 视 觉 上 产生 延 时 ， 硬 件 系统 干脆 让 我 们 直接 和 显卡 接触 ， 免 得 数据 再 经 由 
第 三 道 手 而 影响 效率 ， 直 接 把 数据 往 显 存 中 填 就 好 了 。 

之 前 和 大 家 介绍 过 了 ， 地 址 总 线 的 范围 不 只 是 主板 上 插 的 内 存 条 的 容量 ， 内 存 条 只 是 地 址 总 线 所 
能 达到 的 范围 中 的 一 小 部 分 。 指 令 中 所 需 的 任何 一 个 地 址 ， 都 是 地 址 总 线 帮 咱 们 去 寻 址 的 。 地 址 只 是 
个 数字 ， 地 址 总 线 把 此 数字 指向 哪个 存储 介质 ， 此 地 址 就 落 到 哪个 介质 上 的 某 个 存储 单元 中 。 地 址 指 
向 哪里 ， 最 终 是 地 址 总 线 说 了 算 。 如 果 有 同学 误 以 为 访问 某 个 rom 的 地 址 ， 是 先 访问 到 我 们 的 内 存 条 
后 ， 再 由 计算 机 内 的 某 种 神奇 力量 将 其 映射 到 该 rom， 这 就 不 对 了 。 

从 起 始 地 址 0xB8000 到 0xBFFFF, 这 片 32KB 大 小 的 内 存 区 域 是 用 于 文本 显示 。 我 们 往 0xB8000 
处 输出 的 字符 直接 会 落 到 显存 中 ， 显 存 中 有 了 数据 ， 自 然 显卡 就 将 其 搬 到 显示 器 屏幕 上 了 ， 这 后 续 
的 事情 咱们 是 不 需要 处 理 的 ， 咱 们 只 要 保证 写 进 显存 的 数据 是 正确 的 就 可 以 。 
屏幕 上 可 以 显示 多 少 个 字符 呢 ? 这 要 取决 于 要 用 哪 种 文本 模式 了 。 
显卡 的 文本 模式 也 是 分 为 多 种 模式 的 , 用 “ 列 数 * 行 数 ” 来 表示 ,如 80*25, 40*25，80*43 或 者 80*50， 
它们 的 乘积 是 整个 屏幕 上 可 以 容纳 的 字符 数 。 不 同 的 模式 可 容纳 的 字符 数 不 同 ， 如 80*25 表示 一 行 80 个 
字符 ， 共 25 行 。 显 卡 在 加 电 后 ， 默 认 就 置 为 模式 80*25， 也 就 是 一 屏 可 以 打印 2000 个 字符 。 我 们 也 在 这 
个 默认 模式 下 工作 了 。 

即使 在 文本 模式 下 ， 也 可 以 打印 出 彩色 字符 。 可 是 ASCII 码 都 是 1 字 节 大 小 ， 即 使 标准 ASCII 码 也 
要 用 7 位 来 为 一 个 字符 编码 ， 只 剩 下 那 1 位 顶 多 只 能 表示 黑白 两 种 颜色 。 聪 明 的 你 肯定 想到 啦 ， 必 然 是 用 
一 个 字 节 来 表示 字符 本 身 ， 再 用 另外 的 字 节 来 表示 其 属性 。 答 对 啦 ， 事 实 也 是 如 此 。 每 个 字符 在 屏幕 上 都 
是 由 2 个 字 节 来 表示 的 ， 而 且 是 连续 的 2 个 字 节 。 

说 到 这 里 我 们 先 算 一 笔 账 ， 显 存 是 从 0xB8000 到 0xBFFFF， 范 围 是 32KB， 一 屏 可 以 显示 2000 个 字 














NY 
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符 ， 显 示 器 上 的 每 个 字符 占 2 字 节 大 小 ， 故 每 屏 字 符 实际 占用 4000 字 节 。 这 样 ， 我 们 的 32KB 的 显存 可 
以 容纳 32KB/4000B 约 等 于 8 屏 的 数据 。 所 以 您 懂 了 为 什么 Linux 可 过 制 是 二 闪 虹 bit 、 
以 用 alt + Fn 键 实现 tty 的 切换 ， 当 然 这 只 是 原理 ,， 具体 的 实现 要 涉及 一 一 XK | 15 
到 显卡 的 寄存 器 设置 。 显 卡 上 的 寄存 器 还 是 非常 多 的 ， 我 怕 此 时 将 它 广 背 景色 
们 列 出 来 会 打击 大 家 学 习 积极 性 ， 以 后 需要 时 再 说 吧 。 亮度 位 B 12 4 
异 幕 上 每 个 字符 的 低 字 节 是 字符 的 ASCII 码 ， 高 字 节 是 字符 人、 0 
属性 元 信息 。 在 高 字 节 中 ， 低 4 位 是 字符 前 景色 ， 高 4 位 是 字符 区 
的 背景 色 。 颜色 用 RGB 红 绿 蓝 三 种 基色 调和 ,第 4 位 用 来 控制 亮 B | 8 ) 
度 ， 若 置 1 则 呈 高 亮 ， 若 为 0 则 为 一 般 正 常 亮度 值 。 第 7 位 用 来 
控制 字符 是 否 闪烁 《不 是 背景 内 烁 )。 这 两 字 节 如 图 3-13 所 示 。 SET 
大 家 知道 , 用 了 R 红色 、G 绿色 、B 蓝 色 这 三 种 颜色 以 任意 比例 混 码 
合 ， 可 以 搭配 出 其 他 颜色 ， 其 他 颜色 被 认为 都 可 以 由 这 三 种 颜色 组 合 0 
而 成 。 不 过 由 于 在 文本 模式 下 的 颜色 极其 有 限 , RGB 的 各 部 分 比例 要 4 图 3-13 字符 及 其 属性 
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么 是 1 (全 部 )， 要 么 是 0 (没有 )， 所 以 其 组 合 出 的 颜色 届 指 可 数 ， 为 了 让 大 家 测试 字符 颜色 更 加 方便 ， 























































































































给 大 家 提供 这 三 种 颜色 的 组 合 ， 见 表 3-16。 
表 3-16 文本 模式 中 字符 颜色 
R G B 2 
l=0 l=1 

0 0 0 黑 灰 
0 0 1 蓝 浅 蓝 
0 1 0 绿 浅 绿 
0 1 1 青 浅 青 
1 0 0 红 浅 红 
1 0 1 品 红 浅 品 红 
1 1 0 慰 黄 
1 1 1 亮 白 

从 上 面 可 以 看 出 只 要 亮度 位 I 置 1， 颜色 就 是 变 亮 变 浅 。 大 家 可 以 结合 K 位 来 测试 上 面 的 颜色 。 









































3.3.4 改进 MBR， 直 接 操 作 显 卡 


到 目前 为 止 , 说 了 一 部 分 有 关 显 存 的 内 容 ， 这 对 于 一 般 的 输出 来 说 已 经 足够 了 ， 下 面 咱们 可 以 尝试 写 
显存 啦 。 我 们 将 之 前 的 MBR 改造 一 下 ， 保 留 滚屏 的 操作 ， 只 修改 有 关 输出 的 部 分 ， 即 把 通过 BIOS 的 输 
出 改 为 通过 显存 ， 你 会 发 现 ， 其 实 反 而 更 容易 ， 请 见 代码 3-4。 


代码 3-4 (project/c3/a/boot/mbr.S ) 


SS 





























































































































1 ; 主 引 导 程 序 

2 1) 

3 ;LOADER BASE ADDR equ 0xRA000 
4 ;LOADER START SECTOR equ 0x2 
I 
6 SECTION MBR vstart=0x7c00 

7 mov ax,cs 

8 mov ds,ax 

9 mov es,ax 

1 mov ss,ax 

并 站 Mov fs,ax 

12 mov sp, Ox7c00 

内， mov axr Oxb800 

14 mov gs,ax 

二 









































Et 
19 ;INT 0x10 ”功能 号 : 0x06 功能 描述 ， 上 卷 窗 

AO BP 

21 ;输入 : 


22 ;AH 功能 号 = 0x06 
23 ;AL = 上 卷 的 行 数 ( 如 果 为 0， 表示 全 部 ) 
24 ;BH = 上 卷 行 属性 

25 s; (CL,CH) = 左上 角 的 (X,Y) 位 置 
26 ; (DL,DH) = 右 下 角 的 (x, Y) 位 置 
27 ;无 返回 值 : 
































































































































28 mov ax 0600h 

29 mov bx, 0700h 

30 mov | ; 左上 角 : (0，0) 

3 工 mov dx, 184fh ; 右 下 角 : (80,25)， 

32 ; VGA 文本 模式 中 ， 一 行 只 能 容纳 80 个 字符 ， 共 25 行 
33 ; 下 标 从 0 开始 ， 所 以 0x18=24，0x4f=79 

34 int 10h ; int 10h 

35 

36 ; 输出 背景 色 绿色 ， 前 景色 红色 ， 跳动 的 字符 串 "1 MBR" 
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37 mov byte [gs:0x00]，" 
38 mov byte [gs:0x01],0 
39 

40 mov byte [gs:0x02]," 
41 mov byte [gs:0x03],0 
42 

43 mov byte [gs:0x04]," 
44 mov byte [gs:0x05],0 
45 

46 mov byte [gs:0x06]," 
47 mov byte [gs:0x07],0 
48 

49 mov byte [gs:0x08],"' 
50 mov byte [gs:0x09],0 
51 

52 jmp $ 

53 

54 times 510-($-$$) db 
ape) db 0x55, 0xaa 


前 36 行 除 第 13 一 14 行 以 外 ， 和 J 





单 了 解 一 下 就 好 ， 


加 





0 


面 说 过 了 ， 显 存 文 本 模式 中 ，3 











3.3 
; 表示 绿色 背景 内 烁 ，4 表示 前 景色 为 红 
; 通过 和 死 循 环 使 程序 悬 停 在 此 























上 一 版 本 的 MBR 一 样 ， 忘 记 的 话 也 不 用 翻 回 





























剧 透 一 下 ， 以 后 连 滚屏 我 们 都 要 直接 通过 显卡 来 搞定 。 
其 内 存 地 址 是 0xb8000， 忘 记 的 话 可 以 全 





分 布 。 时 刻 要 清楚 ， 
址 ”。 注意 


标 地 二 


我 们 目 育 

















f 是 在 实 模式 下 编程 ， 
要 考虑 到 最 终 地 址 的 段 基 址 要 乘 以 16， 所 以 
止 是 0xb8000， 按 照 以 上 策略 ， 有 多 种 “ 段 基 址 + 段 内 偏 移 地 址 ”的 组 合 
的 段 基 址 为 0xb800， 即 0xb8000 除 以 16， 也 就 是 右 移 4 位 ， 偏 移 地 址 为 0。 
































所 以 第 13 行 和 
都 是 没关系 的 ， 对 于 访问 的 是 数 和 

















个 段 寄存 器 的 值 作 为 段 基 址 。 这 个 “ 
意义 不 明确 。 何 为 超越 ?由 于 有 “ 跨 段 访问 ”的 说 法 ， 所 以 I 
址 + 段 内 偏 移 地 址 ” 堆栈 段 的 寄存 器 是 S$， 代码 段 寄存 器 CS， 这 两 者 不 存 
不 同 ， 默 认 的 寄存 器 是 DS， 但 


解 ， 如 CPU 的 访 存 策略 是 “ 段 地 
在 默 不 默认 之 说 ， 因 为 它们 都 不 外 








瑟 
MN 


EK 变 。 不 过 对 


NTA 





第 14 行 往 gs 寄存 器 中 存 入 段 基 址 。 这 里 和 大 家 说 明 一 
来 说 ， 如 果 不 用 ds 做 段 基 址 寄存 器 ， 就 要 在 寻 址 中 “ 
作 段 跨越 前 

















式 的 ”的 段 寄 存 器 叫 




















看 了 ， 直 接 看 注 克 


























FE 前 翻 翻 “ 表 3-15” 显 存 地 址 








实 模 式 下 内 存 分 段 访问 策略 是 “ 段 基 址 *16+ 段 内 偏 移 地 
们 选择 的 段 基 址 必须 是 除 以 16 以 后 的 值 。 目 











口 


J 以 拼凑 出 此 地 址 。 最 直观 











下 ， 显 存 段 基 址 放 在 哪个 寄存 器 中 

















三 
MN 


显 式 地 ”指明 要 用 哪 

















= 





2 





的 书 中 叫 段 超越 前 级 ， 个 人 觉得 














HM, 

















们 这 上 旨 




















F 数 和 


居 段 来 说 却 有 





此 

































































































































































段 跨越 前 级 。“ 段 跨越 ”相对 好 理 




















其 是 可 以 





以 了 ， 这 是 因为 已 经 存在 了 默认 的 段 寄存 器 DS， 所 以 访 存 中 





上 的 分 

















前 级 ”的 意思 是 在 编译 后 的 机 器 




















字段 , 可 以 参见 表 3-1“IA32 指令 格式 ”。 


改变 的 。 一 般 访 问 数据 时 只 要 给 出 偏 移 地 址 就 可 

给 出 的 偏 移 地 址 便 是 相对 于 DS 的 偏 移 量 ， 也 就 是 说 访问 的 地 址 属于 以 DS 为 起 始 的 段 〈 是 指 一 般 意义 ] 

段 机 制 ， 不 考虑 实 模式 或 保护 模式 )。 但 若 不 想 用 这 个 段 了 ， 或 者 访问 的 地 址 不 属于 这 个 段 ， 想 “跨越 ”这 个 
默认 段 ， 而 用 新 的 段 基 址 ,“ 跨 过 ”DS 的 限制 ， 这 就 是 “跨越 ”的 理解 。 而 “ 

码 中 , 指定 的 这 个 新 的 段 寄存 器 会 出 现在 IA32 指令 格式 中 的 “前 缀 ” 

基于 以 上 两 点 ， 为 代 蔡 默认 段 基 址 寄存 器 而 改 用 的 新 的 段 基 址 寄存 器 ， 称 为 段 跨越 前 级 。 








我 1 
[gs: 0x00]，'1'” 是 分 


门 在 多 








敬 37 一 S0 行 执 行 的 mov 操 











乍 都 是 往 显 存 

















以 gs 为 数据 段 基 址 ， 以 0 为 























写字 符 。 拿 37 行 和 38 行 举 例 , 第 37 行 的 “mov byte 
局 移 地 址 的 内 存 中 写 入 字符 1 的 ASCII 码 。 按 之 前 我 





们 讲 过 的 ， 写 入 1 时 ， 要 写 入 1 的 ASCI 码 0x31。 这 是 最 直接 的 做 法 。 但 编译 器 诞生 的 意义 就 是 为 了 给 


大 家 人 带 来 方便 ， 尽 管 我 们 可 以 把 37 行 的 代码 改 为 mov byte 
的 字符 ， 它 会 自动 将 其 改 为 相应 的 ASCII 码 ， 免 去 了 人 工 查 表 的 过 
经 过 了 一 次 查 表 。 所 以 ， 对 于 字符 的 输 
码 的 转换 。 





ASCII 码 表 。 编 译 器 对 于 出 现在 
程 。 即 使 把 表 整 个 背 下 来 了 ， 本 
应 字符 就 行 了 ， 稍 微 有 点 人 性 化 

















代码 ， 











质 上 也 


三 | 
候 





在 脑子 





pr Ar 
































[gs: 0Ox00]， 











译 器 都 会 自动 完成 








玫 们 





























这 里 还 个 关键 字 byte， 








] 于 指定 


操作 数 所 占 的 空间 。 


到 编 
同类 的 关键 





























| 了 
键 字 指明 了 操作 数 的 数 和 


空 | 


宽度 ( 字 节 数 )， 











[0 必 r Ar 








四。“mov byte [gs:0x00],1 ”表示 的 意思 是 : 所 








ES 


同 C 语言 中 的 变 和 


时 类 型 














区 上 
数据 宽度 ， 在 指令 
是 16 位 的 , 所 以 不 












































的 内 存 中 。word、dword 分 别 表示 2 字 节 和 4 字 节 ， 意 义 同 怕 
就 不 必 “ 显示 地 ”指明 操作 数 所 

















占 的 空间 大 小 了 。 例 如 mov ax, 0x10， 
“显示 地 ”在 ax 前 或 0x10 前 加 个 关键 字 word。 在 我 们 的 代码 “mov byte [gs:0x00],'1'” 


个 道 到 
1 的 ASCII 码 写 入 以 gs: 0x00 为 起 始 ， 大 小 为 1 字 
EE。 如 果 源 操作 数 或 目的 操作 数 已 经 明确 了 


i 











0x31， 但 这 样 毕竟 还 要 自己 查 




















上 二 


Ly 


























接 写 出 相 


We 


字 还 有 word、dword 等 。 这 些 关 
EE， 都 是 指明 数据 所 需要 的 存储 

















的 操作 数 ax 
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由 于 这 里 的 '1' 对 应 的 ASCII 码 是 0x31， 这 是 个 立即 数 ， 对 于 立即 数 是 无 法 判断 它 的 存储 空间 的 。 它 

1 字 节 ， 还 是 2 字 节 ? 将 来 会 不 会 超过 255? 它 现在 是 0x31， 还 是 0x0031? 这 谁 知道 呢 。 可 CPU 需 
要 知道 这 个 0x31 要 用 多 少 字 节 来 存储 ， 因 为 它 不 确定 这 个 数 将 来 会 不 会 超过 255。 要 是 用 一 字 节 来 存储 
0x31， 万 一 哪 天 往 此 处 存 个 大 于 255 的 数 ， 这 一 字 节 是 万 万 不 能 胜任 的 。 

我 们 之 前 说 过 了 ， 一 个 字符 用 2 个 字 节 来 表示 。 低 字 节 是 字符 的 ASCI 码 ， 这 里 的 偏 移 地 址 还 是 0x00，gs 
在 程序 开头 被 赋值 为 0xb800， 故 最 终 地 址 是 0xb8000， 即 显存 的 第 0 个 字 节 。 这 表示 字符 1 会 在 屏幕 的 左上 角 。 
字符 的 高 字 节 是 属性 ， 所 以 我 们 在 第 38 行 用 “mov byte [gs:0x01],0xA4” 为 字符 添加 颜色 。 这 里 的 偏 
移 地 址 已 经 变 成 了 0x01, 是 该 字符 1 的 高 位 ,， 写 入 的 属性 值 是 0xA4, 这 表示 K 位 为 1， 结合 表 3-16 可 知 ， 
其 为 红色 跳动 字符 ， 绿 色 背 景 。 
第 39 一 50 行 分 别 在 显存 中 创建 字符 'M'"，'B'，'R' 及 其 属性 ， 拼 接 字符 串 “MBR”， 原理 同上 。 
第 52 行 还 是 个 死 循 环 ， 程 序 会 卡 在 这 里 不 动 。 其 余 代码 同 之 前 一 样 ， 是 为 了 凌 足 512 字 节 并 写 入 魔 
数 0xaa55。 

代码 不 多 ， 分 析 到 此 为 止 ， 事 不 宜 迟 ， 立 即 编译 。 


| nasm -o mbr.bin mbr.5S 回 车 


下 面 将 生成 的 mbrbin 写 入 我 们 的 虚拟 硬盘 ， 还 是 用 dd 命令 。 


dd if=./mbr.bin \ 
of=/your path/bochs/hd60M.img \ 
bs=512 count=1 conv=notrunc 回 牛 


好 了 ， 按 照 前 面 介绍 的 方法 启动 bochs， 执 行 e 命令 ， 将 会 在 屏幕 的 左上 角 出 现 绿色 背景 、 红 色 跳动 
的 字符 。 效 果 如 图 3-14 所 示 。 





























































































































































































































































































































































































































^ 图 3-14 “屏幕 字符 闪烁 
为 了 表示 文字 确实 是 在 内 烁 ， 所 以 我 分 别 截 了 两 张 图 。 左 半 部 分 标注 为 1 的 部 分 是 字符 闪 没 的 截图 ， 
右 图 标注 为 2 的 部 分 是 字符 再 次 出 现 的 截图 。 
关于 显卡 另外 的 接 ， 我 们 在 之 后 用 到 的 时 人 




























































































吴 再 细 说 ， 大 家 在 此 不 要 慷 记 了 。 





| 
= 
EE 
可 




















局 


区 css 调试 方法 


前 面 第 1 章 中 在 给 大 家 介绍 bochs 的 时 候 ， 我 犹 耶 要 不 要 把 bochs 调试 方法 也 一 块 放 进去 ， 放 在 那里 
似乎 更 显得 “规矩 ”。 但 总 觉得 放 在 那 了 大 家 当时 也 用 不 上 ， 用 的 时 候 还 得 往 回 翻 那么 多 ， 所 以 经 过 考虑 ， 
我 决定 在 本 章 完 成 MBR 的 改进 后 再 介绍 bochs 用 法 ， 这 样 大 家 能 “实习 ”一 把 ， 练 习 用 bochs 调试 上 一 
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节 改 进 后 的 MBR， 有 助 于 理解 bochs 用 法 ， 记 忆 更 深刻 。 









































于 


3.4.1 bochs 一 般 用 法 


bochs 是 一 个 开源 x86 虚拟 机 软件 。 在 它 的 实现 中 定义 了 各 种 数据 结构 来 模拟 硬件 ， 用 软件 模拟 硬件 
缺点 是 速度 比较 慢 ， 上 毕竟 全 是 软件 来 模拟 ， 您 想 ， 虚 拟 机 还 要 在 软件 中 模拟 各 种 中 断 ， 能 不 慢 吗 。 不 过 它 
的 功能 非常 强大 ， 咱 们 应 该 感激 bochs 开发 人 员 所 做 的 贡献 ， 真 的 不 能 抱怨 ， 有 的 用 就 不 错 了 是 不 。 其 优 
点 是 可 移植 性 强 ， 原 则 上 只 要 gcc 支持 某 个 平台 ， 这 个 平台 上 就 可 以 有 bochs， 从 而 保证 了 bochs 在 各 平 
台 上 的 畅通 无 阻 。 由 于 它 是 虚拟 机 ， 所 以 支持 硬件 级 别 上 的 调试 。 

bochs 的 硬件 调试 体现 在 : 

(1) 调试 时 可 以 查看 页 表 、gdt、idt 等 数据 结构 ; 

(2) 可 以 查看 栈 中 数据 ; 

(3) 可 以 反 汇 编 任 意 内 存 ; 

(4) 实 模式 、 保 护 模式 互相 变换 时 提醒 ; 

(5) 中 断 发 生 时 提醒 。 

这 种 在 硬件 级 别 上 的 调试 给 我 们 提供 了 更 大 的 灵活 性 ， 以 后 您 会 发 现 ， 这 种 硬件 调试 有 时 候 会 帮 有 我 们 大 忙 。 

好 在 bochs 的 调试 风格 是 参照 gdb 来 设计 的 ， 这 对 于 习惯 gdb 调试 的 同学 无 疑 减少 了 学 习 成 本 ， 不 熟悉 
gdb 调试 器 的 同学 也 不 必 感 到 诅 丧 ， 我 们 常用 的 调试 命令 并 不 多 ， 而 且 bochs 的 调试 方法 做 得 很 人 性 化 ， 发 挥 
一 下 想像 力也 能 摸索 个 所 以 然 来 ,本 书 中 使 用 的 bochs 版 本 是 2.6.2, 以 下 就 此 版 本 对 bochs 的 使 用 做 大 致 介绍 。 


闲话 少 说 , 咱们 先进 入 bochs, 看 看 大 概 有 哪些 内 容 ， [DWE 着 
” i bochs.out bochsrc.disk hd60M.img 5s 


如 图 3-15 所 示 。 [work@localhost bochs]$ bin/bochs -f bochsrc.disk 

第 一 行 1 命令 后 ， 显 示 的 是 我 安装 的 bochs 下 的 文件 ， Se 
bin 和 share 这 两 个 目录 是 bochs 安装 时 创建 的 ，bochs.out 是 bochs 运行 过 程 中 的 日 志文 件 ， 它 是 在 配置 文件 中 指 
定 的 ， 而 在 本 例 中 ，bochs 的 配置 文件 是 bochsrc.disk。hd60M.img 是 用 bin/bximage 命令 创建 出 来 的 虚拟 硬盘 ， 
它 也 需要 在 bochsrc.disk 中 指定 后 才能 使 用 。 
第 二 行 是 启动 bochs。 由 于 我 们 的 配置 文件 并 不 是 这 三 个 标准 名 称 : .bochsrc、bochsrc、bochsrc.txt， 
所 以 我 们 需要 用 -f 来 指定 我 们 的 配置 在 哪里 。 其 实用 -f 来 指定 是 有 好 处 的 ， 这 样 我 们 清晰 地 知道 哪个 才 是 
我 们 的 配置 。 

如 图 3-16 所 示 ， 进 入 bochs 后 ， 我 们 要 确定 下 一 步 做 什么 ， 由 于 bochs 已 经 将 选项 [6] 作 为 默认 的 行 
为 ， 这 里 直接 回 车 就 好 了 。 

p00000000001[ ] reading configuration from bochsrc.disk 


0000000000el ] bochsrc.disk:30: 'keyboard mapping' will be replaced by new 
‘keyboard' option. 



























































































































































人 一 








































































































































































































































































































































































































his is the Bochs Configuration Interface, where you can describe the 
machine that you want to simulate. Bochs has already searched for a 
configuration file (typically called bochsrc.txt) and loaded it if it 
could be found. When you are satisfied with the configuration, go 
ahead and start the simulation. 


You can also start bochs with the -q option to Skip these menus. 


1. Restore factory default configuration 
2. Read options from... 

3. Edit options 

4. Save options to... 

5. Restore the Bochs state from... 
(1 
LA now 





PLease choose | 








4 图 3-16 ”bochs 启动 画 画 
像 很 多 提供 控制 台 的 软件 一 样 ， 直 接 键入 help 会 显示 帮助 信息 。 进 入 bochs 后 ， 键 入 命令 help 后 区 
车 ， 看 看 bochs 给 我 们 准备 了 什么 礼物 。help 命令 的 输出 如 图 3-17 所 示 。 
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简短 看 一 下 help 信息 就 可 以 了 ， 不 要 细 看 每 个 命令 ， 很 多 是 我 们 不 需要 的 ， 后 面 我 会 讲解 常用 的 部 
分 。 在 这 里 ， 我 本 想 将 所 有 调试 命令 的 说 明 先 搬 到 这 里 ， 然 后 再 带 大 家 做 个 小 例子 。 但 根据 我 以 往 读书 的 
经 验 ， 每 次 将 一 堆 事先 用 不 到 的 东西 一 股 脑 地 塞 过 来 时 ， 我 完全 不 感冒 ， 因 为 不 知道 哪个 重要 ， 而 且 看 到 
哪个 命令 都 是 靠 想 像 力 来 琢磨 这 是 讲 的 什么 ， 甚 至 我 每 次 都 会 翻 过 去 直接 看 后 面 ,没有 经 过 实践 的 东西 是 
` 会 被 真正 理解 的 。 所 以 我 决定 先 带 着 大 家 做 个 小 例子 ， 过 程 中 大 家 有 锋 问 没关系 ， 带 着 问题 去 看 后 面 命 
羊 效果 更 好 。 


































































































































































































































































































令 的 详细 说 明 


证 
[el 
如 





PLease choose one: [6] 

00000000009i[ ] installing x module as the Bochs GUI 
0000000900090i[ ] using log file bochs.out 

Next at t=0 

(0) [9x9000fffffff9] fO00:fffO (unk. ctxt): jmp far f000:e05b 
fo 


- Show list of debugger commands 
hlhelp command - show short command description 
-*- Debugger control -*- 
help, qlquitl|exit, set, instrument, show, trace, trace-reg, 
trace-mem, ul|disasm, ldsym, slist 
- Execution control -*- 
clcont|continue, s|step, pln|lnext, modebp, vmexitbp 
- Breakpoint management -*- 
vb|lvbreak, lb|lbreak, pb|pbreak|b|break, sb, sba, blist, 
bpe, bpd, dldell|delete, watch, unwatch 
- CPU and memory contents -*- 
x, xp, setpmem, writemem, crc, info, 
r|reg|regs|registers，fp|fpu，mmx，sse，sreg，dreg，creg， 
page，set，ptime，print-stack，?|caltLc 
-*- Working with, bochs param tree -*- 
show "param"” restore 
<bochs:2> 目 








六 | 





A 








3-17 ”bochs 帮助 信息 


大 体 上 bochs 的 调试 命令 分 为 “Debugger control” 类 、“Execution control” 类 、“Breakpoint management” 
类 、“CPU and memory contents ”类 。 在 每 个 大 类 别 中 的 关键 字 都 是 一 个 调试 命令 ， 看 上 去 也 不 少 ， 每 个 命令 
的 用 法 不 同 。 不 过 好 在 咱们 今后 用 的 命令 不 多 ， 大 家 不 必 一 下 子 把 这 些 全 部 掌握 ， 咱 们 还 是 本 着 递归 式 学 习 方 
法 ， 用 到 了 再 学 不 迟 。 咱 们 这 里 先 只 做 个 笼统 的 介绍 ， 做 个 小 例子 ， 带 大 家 入 入 门 ， 今 后 可 以 自己 摸索 了 。 
图 3-17 中 ， 根 据 第 二 行 的 提示 ,“help+ 命 令 ” 可 以 显示 命令 的 简短 描述 信息 。 那 咱们 就 试 一 下 。 
在 “CPU and memory contents” 类 中 ， 有 x、xp 命令 。 这 两 个 命令 是 用 来 查看 内 存 的 ， 它 们 的 区 别 是 
x 命令 后 接线 性 地 址 , xp 命令 后 接 physical 物理 地 址 。 在 目前 的 实 模 式 中 , 只 能 通过 物理 地 址 来 查看 内 存 ， 
看 看 xp 命令 是 怎么 用 的 ， 一 会 咱们 用 xp 命令 来 做 个 测试 。 键 入 help xp 回 车 ， 如 图 3-18 所 示 。 


bochs:3> help xp 
/nuf <addr> - examine memory at linear address 
49°/ALTD :Te oe 
nuf is a Sequence of numbers (how much VvaLues to dispLay) 
and one or more of the [mxduotcsibhwg] format specificators: 
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x,d,uy,o,t,c,s,i select the format of the output (they stand for 
hex, decimal, unsigned, octal, binary, char, asciiz, instr) 

b,h,w,g select the size of a data element (for byte, half-word, 
word and giant word) 

EA) 





4 图 3-18 ”xp 指令 帮助 信息 


说 明 一 下 ,bochs 中 用 到 的 “ 字 ” 并 不 是 2 字 节 , 而 是 4 字 节 。 在 图 3-17 的 倒数 第 4 行 , 提示 用 b,h,w,g 
来 选择 一 个 “显示 单元 ”的 大 小 。 例 如 b 是 指 一 字 节 。h 是 指 半 个 字 ，2 个 字 节 。w 是 指 一 个 字 ，4 个 字 
节 。g 是 指 双 字 ，8 字 节 。 用 xp 或 x 指令 查看 内 容 是 以 “显示 单元 ”为 单位 ， 不 是 以 字 节 。 所 以 如 果 不 指 
定数 据 单 位 大 小 ， 默 认 以 4 字 节 为 单位 来 显示 。 例 如 xp0x7c00， 将 显示 从 0x7c00 开始 的 4 个 字 节 。 

bochs 中 支持 八进制 、 十 进 制 、 十 六 进 制 的 数字 。 八 进 制 按照 以 0 开头 的 写法 即 可 ， 十 进 制 自然 不 用 
多 说 ， 对 于 十 六 进 制 却 有 点 限制 ， 只 支持 0x 前 级 的 形式 ， 不 支持 h 后 级 的 形式 。 如 : 

八进制 : 011 
F 进 制 : 11 


六 进 制 : 0x11 
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在 咱们 调试 过 程 中 最 常用 的 还 是 十 六 进 制 ， 它 的 每 一 位 直接 和 字 节 中 的 每 4 
方便 一 些 。 















































位 对 应 ， 观 察 起 来 还 是 较 














继续 看 xp 指令 “xp /nuf <addr> ” nuf 是 指 一 个 数字 序列 ， 这 是 三 个 参数 , n 用 











来 分 别 指定 要 显示 的 “ 显 





























示 单元 ” 数 ，u 指 “显示 单元 ”大 小 , f 是 指 要 用 哪 种 进 制 显示 。 最 终 要 显示 几 个 字 节 ， 是 以 “显示 单元 大 
























































下 我 们 还 会 对 此 命令 细 说 。 用 法 如 图 3-19 所 示 。 EEE 
3-19 中 尝试 了 用 b 和 w 来 显示 内 存 ， 大 家 


































































































可 以 看 出 , 指定 了 显示 单元 后 ， 以 后 的 输出 就 以 此 . 

显示 单元 为 准 ， 不 会 自动 恢复 为 默认 的 4 字 节 。 ; Se 
此 处 的 0x7c00 是 空 值 0, 这 是 因为 MBR 还 没 : 

有 被 加 载 到 此 地 址 ，MBR 是 由 BIOS 来 加 载 的 ， 人 




















BIOS 目前 还 没有 运行 呢 。 
为 了 让 大 家 更 好 地 理解 BIOS 是 怎样 被 执行 
的 , 也 就 是 计算 机 中 第 一 个 软件 是 怎样 开始 的 ， 咱 ee 








<bogus+ 

















hb 







































































示 
小 显示 单元 个 数 n” 来 决定 的 。addr 可 以 是 以 上 三 种 进 制 的 数字 。 即 使 不 明白 ， 看 着 有 点 坚 也 没有 关系 ， 
后 


09xg90 


909x00 


09x00000000 


9x00000000 


xp 指定 显示 单元 

















们 还 是 先 看 图 3-17。 在 图 的 上 面 第 5 行 ， 显 示 的 是 下 一 条 待 执行 的 指令 ， 这 是 程序 计数 器 (PC) 中 的 值 ， 








在 x86 上 的 程序 计数 器 是 指 cs: ip。 大 家 看 ，cs 是 0xf000,ip 是 fff0， 所 以 最 终 

















也 址 是 0xffff0， 这 是 BIOS 

















的 入 口 地 址 ， 即 低 端 1M 内 存 最 顶端 的 16 字 节 。 忘 记 的 同学 往 前 翻 看 表 1-1 实 模式 下 的 内 存 布局 。 在 右边 
的 jmp far f000:e05b， 是 指 此 内 存 0xffff0 处 的 内 容 ， 在 内 存 中 ， 内 容 不 是 普通 数据 ， 就 是 指令 ， 在 此 处 就 是 





















































条 跳 转 指令 。 这 是 咱们 之 前 分 析 BIOS 时 所 说 的 ，1M 内 存 的 最 顶端 只 有 16 字 节 ， 肯 定 容 不 下 完整 的 BIOS 





























代码 ， 必 然 是 条 跳 转 指令 。 由 此 可 见 ， 果 然 没 错 ， 它 是 跳 转 到 0xf000:e05b 的 地 方 了 。 咱 们 需要 验证 一 下 内 











存 0xffff0 处 的 内 容 是 不 是 jmp far f000:e05b。 









































验证 的 方法 有 多 种 ， 不 过 先 来 个 简单 粗暴 可 依赖 的 ， 咱 们 查看 此 处 内 存 的 内 容 是 什么 。 内 容 如 图 3-20 所 示 。 























<bochs:2> xp/2 QOxffff0 
[bochs]: 











0x00eg5bea 0x2f3131f0 





4 图 3-20 通 往 B10S 的 jmp 跳 转 



































由 于 默认 xp 以 4 字 节 来 显示 ， 所 以 xp 中 斜 杠 后 面 指定 的 数字 2， 最 终 会 让 xp 显示 8 个 字 节 。 提 醒 




















一 下 ， 咱 们 bochs 模拟 的 是 x86 平台 ， 它 是 小 端 字 节 序 。 咱 们 只 看 1 个 4 字 节 ， 














先 从 低地 址 看 ， 最 低位 是 


ea， 这 是 直接 绝对 远 转 移 jmp far 的 机 器 码 ， 高 位 的 是 0xe05b， 这 是 jmp far 的 操作 数 ， 待 跳 转 到 的 地 址 ， 
































如 果 忘 记 指 令 格式 的 同学 ， 赶 紧 到 前 面 找 到 IA32 指令 格式 回忆 一 下 。 











这 与 程序 计数 器 (cs:ip) 中 指定 的 内 容 是 吻合 的 , 不 过 咱们 还 是 不 太 放 心 , 也 许 您 说 , 万 一 0x00e05bea 
只 是 普通 数据 呢 ， 我 又 对 机 器 码 不 熟 ， 不 许 忽 修 我。 为 了 打消 您 的 疑虑 ， 那 再 用 一 种 方法 来 验证 一 下 吧 。 

























































































助 。help u 回 车 后 效果 如 图 3-21 所 示 。 


<bochs:12> help u 


在 “Debugger control” 类 中 ， 有 个 命令 U， 它 用 来 将 内 存 数据 反 汇编 成 指令 。 咀 们 看 一 下 此 命令 的 帮 














uldisasm [/count] <start> <end> - disassemble instructions for given Linear addr 


ess 
Optional 'count' is the number of disassembled instructions 


uldisasm switch-mode - Switch between Intel and AT&T disassembler syntax 


uldisasm hex on/off - control disasm offsets and displacements format 
uldisasm size = n - tell debugger what segment size [16|32|64] to use 
when "disassemble" command is used. 


<bochs:13> | 





A 图 3-21 ”bochs 的 反 汇编 指令 









































大 概 意思 是 说 ，u 和 disasm 是 一 样 的 命令 ， 用 哪个 都 行 ， 其 用 法 是 在 后 面 跟 需 要 汇编 的 指令 数 、 起 始 
线性 地 址 、 终 止 线性 地 址 。 由 于 我 们 在 实 模式 下 ， 线 性 地 址 就 是 物理 地 址 。 键 入 w/1 0xffff0 回 车 ， 效 果 如 
































图 3-22 所 示 。 
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: jmp far f000: 

















果然 没有 忽悠 大 家 ， 地 址 0xffff0 处 的 内 容 确 实 是 指令 ， 
BIOS 启动 应 该 更 深刻 一 些 了 。 














这 个 小 例子 完成 了 ， 大 家 如 果 对 此 过 程 有 任何 疑惑 ， 希 望 在 下 





eg5b 


A 图 3-22 ” 反 汇 编 效 果 
并 且 是 





; ea5be000f9 








这 











jmp far f000: e05b。 这 下 大 家 对 理 角 

















在 的 内 容 中 找到 答案 。 























在 bochs 提供 的 命令 中 ， 大 部 分 调试 命令 都 有 简写 和 缩写 ， 它 























都 是 同一 个 功能 ， 只 是 不 同 的 别名 ， 用 哪 一 个 都 可 以 。 下 面 按照 




















门 用 或 运算 字符 彼此 分 隔 ， 所 以 它们 

















上 面 提 到 的 几 大 类 ， 对 常用 的 调试 指令 做 








个 大 概 的 介绍 。 


e “Debugger control” 类 





qlquitlexit， 左 边 三 个 命令 任意 一 个 都 能 退出 调 斌 状态， 关闭 虚 拟 机 ， 一 般 用 gq 最 简单 。 
set 是 指令 族 ， 咱 们 通常 用 set 设置 寄存 器 的 值 ， 这 个 较 和 常用 


































































































也 





























(1) 例如 setreg = val。 可 以 设置 的 寄存 器 包括 通用 寄存 器 和 段 














寄存 器 。 


(2) 也 可 以 设置 每 次 停止 执行 时 ， 是 否 反 汇编 指令 : set u on|loff。 


























show 是 指令 族 ， 有 很 多 子 功能 ， 咱 们 常用 的 就 下 对 


1. show mode 














这 3 个 。 














每 次 CPU 变换 模式 时 就 提示 ， 模 式 是 指 保护 模式 、 实 模式 ， 比 如 从 实 模式 进入 到 保护 模式 时 会 有 提示 。 


2. Show int 








每 次 有 中 断 时 就 提示 ， 同 时 显示 三 种 中 断 类 型 ， 这 三 种 ! 








断 类 











型 包括 “softint” “extint” 和 “iret”。 




















可 以 单独 显示 某 类 中 断 ， 如 执行 show softint 只 显示 软件 主动 触发 的 中 断 ，show extint 则 只 显示 来 后 





外 部 设备 的 中 断 ，show iret 只 显示 iretd 指令 有 关 的 信息 。 
3. show call 
每 次 有 函数 调用 发 生 时 就 会 提示 。 









































traceon|off 如 果 此 项 设 为 on， 每 次 执行 一 条 指令 ，bochs 都 会 将 反 汇 编 的 代码 打印 到 控制 台 ， 这 样 在 


单 步调 试 时 免得 看 源码 了 。 


| ulaisasm [/num] [start] [end] 




































































将 物理 地 址 start 到 end 之 间 的 代码 反 汇 编 ， 如 果 不 指定 地 址 ， 则 反 汇 编 EIP 指向 的 内 存 。num 指定 














反 汇编 的 指令 数 。 
setsize = 16|32|64 在 使 用 



































反 汇 编 命 令 时 ， 用 来 告诉 调试 器 段 





的 大 小 。 


set 指令 也 会 设置 在 停止 时 是 否 反 汇编 命令 。 前 面 set 命令 中 有 说 过 。 




















ctrl+c 中 断 执行 ， 回 到 bochs 控制 台 。 


e。 “Execution control ”类 














clcontlcontinue, 左边 列 出 的 三 个 命令 都 意 为 向 下 持续 执行 , 若 没 断 点 则 一 直 运 行 下 去 。 最 常用 的 是 c。 
s|step [count] 执行 count 条 指令 ，count 是 指定 单 步 执行 的 指令 数 ， 若 不 指定 ，count 默认 为 1。 此 指 











令 若 遇 到 函数 调用 ， 则 会 进入 函数 中 去 执行 。 最 常用 的 是 s。 





























plnlnext 执行 1 条 指令 ， 若 待 执 行 的 指令 是 函数 调用 ， 不 
整体 来 执行 。 最 常用 的 是 n。 
e“Breakpoint management” 类 


以 地 址 打 断 点 : 











管 函 数 内 有 多 少 指令 ， 把 整个 函数 当 作 一 个 





vb|vbreak [seg: off] 以 虚拟 地 址 添加 断 点 ， 程 序 执行 到 此 虚拟 地 址 时 停 下 来 ， 注 意 虚拟 地 址 是 “ 段 : 





段 内 偏 移 ” 的 形式 。 最 常用 的 是 vb。 




















lbllbreak [addo 以 线性 地 址 添加 断 点 ， 程 序 执行 到 此 线性 地 址 时 停 下 来 。 最 常用 的 是 Ib。 
pblpbreak|blbreak [addr] 以 物理 地 址 添加 断 点 。 程 序 执行 到 此 物理 地 址 时 停 下 来 。b 比较 常用 。 
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3.4 ”bochs 调试 方法 
以 指令 数 打 断 点 : 
sb [delta] delta 表示 增 量 ， 意 味 再 执行 delta 条 指令 程序 就 中 断 。 
sba [time] CPU 从 运行 开始 ， 执 行 第 time 条 指令 时 中 断 ， 从 0 开始 的 指令 数 。 
以 读 写 IO 打 断 点 : 
watch 也 有 子 命令 ， 常 用 的 是 这 两 个 。 
watch rlread [phy_addr] 设置 读 断 点 ， 如 果 物 理 地 址 phy_addr 有 读 操 作 则 停止 运行 。 
watch w|write [phy_addr] 设置 写 断 点 ,如 果 物 理 地 址 phy_addr 有 写 操 作 则 停止 运行 。 此 命令 非常 有 用 ， 
如 果 某 块 内 存 不 知 何 时 被 改写 了 ， 可 以 设置 此 中 断 。 
watch 显示 所 有 读 写 断 点 。 
unwatch 清除 所 有 上 断 点 。 
unwatch [phy_addr] 清除 在 此 地 址 上 的 读 写 断 点 。 
blist dk 断 点 信息 ， 功 能 等 同 于 info b。 
bpdlbpe [n] 禁用 断 点 (break point disable) /启用 断 点 〈break point enable)，n 是 断 点 号 ， 可 以 用 blist 


A 


命令 人 
dldelldelete [n] 删除 某 断 点 ，n 是 断 点 号 ， 可 以 用 blist 命令 先 检查 出 来 。D 最 常用 。 
e“CPU and memory contents” 类 
x /nuf [line_addr] 显示 线性 地 址 的 内 容 。n、u、f 是 三 个 参数 ， 都 是 可 选 的 ， 如 果 没 有 指定 ， 则 n 为 1， 

u 是 4 字 节 ,f 是 十 六 进 制 。 解 释 如 下 。 

n 显示 的 单元 数 

u 每 个 显示 单元 的 大 小 ，u 可 以 是 下 列 之 一 : 

(1) b 1 字 节 ; 
(2) h 2 字 节 ; 
(3) w4 字 节 ; 

(4) g 8 字 节 。 

f 显示 格式 , f 可 以 是 下 列 之 一 : 
(1) x 按照 十 六 进 制 显示 ; 

(2) d 十 进 制 显示 ; 

(3) u 按照 无 符号 

(4) o 按照 八进制 显示 ; 
(5)t 按 照 二 进 制 显示 ; 
(6) c 按照 字符 显示 ; 
(7) s 按照 ASCIIz 显示 ; 
(8) i 按照 instr 显示 。 
xp /nuf [phy_addr] 显示 物理 地 址 phy_addr 处 的 内 容 ， 注意 和 x ; x 是 线性 地 址 。 

setpmem [phy_addr] [size] [val] 设置 以 物理 内 存 phy_addr 为 起 始 , 连续 Size 个 字 节 的 内 容 为 val。 此 命令 非常 

有 用 ， 在 某 些 情况 下 不 易 调试 时 ， te ， 需 要 用 setpmem 来 配合 。 

注意 啦 , size 最 多 只 能 设置 4 个 字 节 宽度 的 数据 , 如果 size 大 于 4 便 会 报错 :Error: setpmem: bad length 

value = 8。size 小 于 等 于 4 是 正确 的 ，setpmem 0x7c00 4 0x9。 
rlreglregslregisters 任意 四 个 命令 之 一 便 可 以 显示 8 个 通用 寄存 器 的 值 +eflags 寄存 器 +eip 寄存 器 。Tr 是 

我 常用 的 查看 寄存 器 的 命令 。 

ptime 显示 Bochs 自 启动 之 后 ， 总 执行 指令 数 。 其 实 这 个 命令 不 常用 ， 感 兴趣 的 同学 可 以 用 ptime 和 

“sb 指令 数 ”来 验证 结果 是 否 正确 。 
print-stack [num] 显示 堆栈 ，num 默认 为 16， 表 示 打 印 的 栈 条 目 数 。 输 出 的 栈 内 容 是 栈 顶 在 上 ， 低 地 

址 在 上 ， 高 地 址 在 下 。 这 和 栈 的 实际 扩展 方向 相反 ， 这 一 点 请 注意 。 
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?|calc 内 置 的 计算 器 。 
info 
info pblpbreak|blbreak 查看 断 点 
info CPU 显示 CPU 所 有 寄存 器 的 值 
info fpu 显示 FPU 状态 。 





































































































是 个 指令 族 ， 执行 help info 时 可 查看 其 所 有 支持 的 子 命令 ， 如 下 : 
言 息 ， 等 同 于 blist。 
， 包 括 不 可 见 寄存 器 








































































































































































































































































































































































































info idt 显示 中 断 向量 表 IDT。 
info gdt [num] 显 示 全 局 描述 符 表 GDT， 如 果 加 了 num， 只 显示 gdt 中 第 num 项 描述 符 。 
info ldt 显示 局 部 描述 符 表 LDT。 
info tss 显示 任务 状态 段 TSS 。 
info ivt [num] 显 示 中 断 癌 量 表 IVT。 和 gdt 一 样 ， 如 果 指 定 了 num， 则 只 会 显示 第 num 项 的 中 断 向 量 
如 果 各 位 大 侠 想 知道 BIOS 在 中 断 问 量 表 中 建立 了 哪些 中 断 , 执行 此 命令 就 可 以 看 到 了 , 还 有 相关 说 明 呢 。 
图 3-23 所 示 是 我 的 部 分 截屏 。 
(9x699fff53) DIVIDE ERROR ; dummy iret 
> (9x699fff53) SINGLE STEP ; dummy iret 
三 (OxOO0fff53) NON-MASKABLE INTERRUPT ; dummy iret 
(9x699fff53) BREAKPOINT ; dummy iret 
(9x699fff53) INTO DETECTED OVERFLOW ; dummy iret 
> (9x6909fff53) BOUND RANGE EXCEED ; dummy iret 
> (909x000fff53) INVALID OPCODE ; dummy iret 
4 (9x699fff53) PROCESSOR EXTENSION NOT AVAILABLE ; dummy iret 
S (9x699ffea5) IRQ9 - SYSTEM TIMER 
(9x699fe987) IRQ1 - KEYBOARD DATA READY 
(9x699fe9df) IRQ2 - LPT2 
> (9x699fe9df) IRQ3 - COM2 
a (9x699fe9df) IRQ4 - COM1 
: (9x699fe9df) IRQ5 - FIXED DISK 
> (9x690fef57) IRQ6 - DISKETT 皮 CONTROLLER 
5 (9x690fe9df) IRQ7 - PARALLEL PRINTER 
= (9x996c914a) VIDEO 
> (9x699ff84d) GET EQUIPMENT LIST 
(9x690ff841) GET MEMORY SIZE 
(9x699fe3fe) DISK 
> (9x690fe739) SERIAL 
3 (9x699ff859) SYSTEM 
和 (9x699fe82e) KEYBOARD 
4 图 3-23 中断 向 量 表 ivt 描述 
info flagsleflags 显示 状态 寄存 器 ， 其 实在 用 T 命令 显示 寄存 器 值 时 也 会 输出 eflags 的 状态 ， 还 会 输出 
通用 寄存 器 的 值 ， 我 通常 会 用 r 来 看 。 
sreg 显示 所 有 段 寄 存 器 的 值 。 
dreg 显示 所 有 调试 寄存 器 的 值 。 
creg 显示 所 有 控制 寄存 器 的 值 。 
info tab 显示 页 表 中 线性 地 址 到 物理 地 址 的 映射 。 
page line_addr 显示 线性 地 址 到 物理 地 址 间 的 映射 。 
好 啦 ， 以 上 的 介绍 说 长 不 长 ， 说 短 不 短 ， 希望 对 大 家 有 所 帮助 。 大 家 试 着 在 bochs 中 练习 一 下 ， 一 会 
咱们 就 要 实战 一 把 ， 看 看 如 何 利 用 这 些 调试 利器 解决 实际 问题 。 


















































3.4.2 ”bochs 调试 实例 












































































































































下 面 这 个 例子 是 我 在 实际 开发 过 程 中 遇 到 bug 时 的 调试 思路 , 如 果 您 的 开发 经 验 比较 丰富 可 以 忽略 本 
节 ， 本 节 主 要 针对 非 专业 开发 同学 而 写 。 

下 面 把 这 个 调试 过 程 和 大 家 分 享 ， 和 希望 对 于 开发 经 验 不 足 的 读者 能 起 到 抛砖引玉 的 作用 。 

We 要 : 这 两 张 图 是 多 个 线程 和 一 个 进程 在 并 发 执行 时 的 情况 ， 图 3-24 所 示 是 运行 之 初 正常 的 情 
况 ， 图 3-25 所 示 是 抛 异常 的 结果 ， 大 家 就 不 要 在 这 两 张 图 片 中 玩 “ 找 不 同 ” 了 ， 图 3-25 中 男 线 部 分 以 下 
的 是 开始 抛 异常 的 部 分 。 
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IT| Bochs x86 emulator, http://bochs.sourceforge.net 站 着 
USER Gepy Pogte Resetsusreno power 


UA 





区 民国 











3456u_proc_d u_proc_d 
d u_proc 


d uproc dzal 
d uproc_d al _uv _uvwxuz al_uvwxyz al_uv 


时 z al_ _proc_d al 
abcdef bl_abud u_proc_d al_uvwx 
bi_abcdef bl_abud 
main u_proc d u_proc_d _main al_ uvwxyz al_uvwxyz al_uu 


au_proc_d 1 uvwxyz a bl_abc 
au_proc_d 1 al_ _uvwxy B bl_abc 


al_uvwxu_proc 
wx 


def bl_abcdef bluabcdef bl_abcdef bl_abcdef bl_abcdef u_proc_d hl 

bl_abcdef bil_a oc_d u_proc_d bcdef bl FP bl_abcdef bl_abcdeu bl 

abcdef al_uvu u za1_uwwx al_uu_proc_d u_proc_d 
al_uvwu_proc_d u_proc_d al_ al_uvl_uu_proc_d u_proc_, 
1_uvwu_proc_d u_proc y al uvdef cl_123456 c1_12 





23456 c1 123456 c1 123456 c1 123456 c1 123456 c1 123456 c 
CTRL + 3rd button enables nouse NM [cars Ee 咱 | | | | | 


4 图 3-24 ”多 个 线程 与 进程 并 发 执行 

大 部 分 的 报错 是 逻辑 错误 ， 如 果 程 序 在 运行 开始 时 就 报错 还 比较 好 办 ， 若 像 图 3-24 那 
是 好 好 的 ， 执 行 一 定 次 数 后 ， 运 行 大 概 1 秒 才 报 出 如 图 3-25 所 示 的 一 般 保护 性 异常 ， 这 种 运行 中 的 错误 
似乎 让 人 有 些 无 从 碍 其 是 在 没有 宿主 系统 的 情况 下 。 


IT| Bochs x86 emulator, http://bochs.sourceforge.net ek 


Beet me poke 
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456 
345u_pr 456 cl1_12 
_abcdef bl_abcde _abcdef bl_abcu 


是 al_uvwxyz al_ 
al_uvw alu_proc_d 


1_abcdef bl_abcdef bl_a bl_abcdef bl_abcu_proc_d u_pro 
abcdef bl_abcdef al_ uvwxyz al_ uvwxyz al_uvwxyz al_uvwxyz au 


uvwuyz al_uv al_ uvwxyz al uvwxyz _main maiu proc d up 


A u_proc uain u_proc_d u_prorc 
al_uvwxt 


bcu_proc_d u_proc_da 
up dalu 
ral Pro sption#GP General Prot 
eption#GP Gen Protection Exception#GP General Protection ption#GP 
ieneral Protection tion#GP General P i eption#GP General Protecti 
TR TI 























HO 
斌 
3 





进入 正题 ， 下 面 是 此 报错 的 调试 过 程 ， 注 意 ， 这 个 例子 是 保护 模式 下 的 调试 ， 现在 虽然 还 没 讲 保护 模 
式 ， 但 现在 介绍 的 是 调试 思路 ， 大 家 只 要 有 个 宏观 认识 就 可 以 了 。 
先 打 开 show int， 此 命令 是 让 bochs 在 中 断 发 生 时 输出 提示 ， 因 为 上 面 的 GP 报错 是 某 种 原因 引发 
了 中 断 而 进入 中 断 处 理 程序 时 打印 的 ， 如 果 您 知道 是 某 种 中 断 导 致 的 问题 ， 可 以 直接 用 show extint、show 
softint 或 show iret 针对 某 一 类 中 断 排查 。 不 过 还 是 直接 用 show int 这 种 一 网 打 尽 的 方式 比较 省 心 。 中 断 的 
们 会 在 后 面 讲 ， 这 里 先知 道 这 个 情况 就 行 了 : 屏幕 上 能 够 输出 “#GP General Protection Exception”， 是 
了 异常 ， 我 们 需要 知道 发 生 异 常 之 前 程序 的 状态 。 

好 啦 ， 下 面 开 始 在 bochs 中 调试 。 


<bochs:1> show int 

show interrupts tracing (extint/softint/iret): ON 
show mask is: softint extint iret 

<bochs:2> 总 
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00020182862: iret 002b:c00036cc (0xc00036cc) 

00020182900: softint 0008:c00021le7 (0xc00021e7) 

00020183349: iret 002b:c00036cc (0xc00036cc) 

00020183350: exception (not softint) 0008:c0002029 (0xc0002029) 
00020183503: iret 0008:c000223c (0xc000223c) 
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过 


00020183518: exception (not softint) 0008:c0001lelb (0xc000lelb) 

^CNext at t=38352358 

(0) [Ox000000002246] 0008:c0002246 (unk. ctxt): mov dx, Ox03d5 ; 66bad503 
<bochs:3> 





大 太太 大 类 类 大 大 大 类 类 大大 类 类 大 大 大 以 下 内容 为 解释 说 明 ， 非 程 序 输 出 x****x* 类 类 矿业 火 类 炎炎 

bochs 中 的 输出 会 停 在 此 处 ，mov dx， 0x03d5 是 下 一 条 待 执行 的 指令 不 必 管 它 ， 要 关注 上 面 已 执行 
的 输出 中 的 最 后 一 句 : 

00020183518: exception (not softint) 0008:c0001lelb (0xc000lelb) 


看 上 去 是 执行 到 0008: c0001elb 处 发 生 的 中 断 。 在 它 行 首 的 冒号 左边 一 连 串 数字 00020183518 表示 






































启动 后 执行 了 指令 的 数目 (ptime 指令 也 是 输出 自 启动 后 执行 的 指令 数 )。 
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这 


就 
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人 























这 就 是 关键 的 部 分 了 ， 这 是 程序 运行 过 程 中 最 后 一 个 中 断 ， 初 步 判 断 它 就 是 引发 CPU 抛 GP 异常 的 中 断 。 
那 在 此 中 断 之 前 发 生 了 什么 ? 哪个 语句 引起 了 此 中 断 呢 ? 一 个 可 行 的 想法 是 可 以 在 调试 指令 sba 中 设 
一 个 时 间 点 断 点 ， 而 设置 的 值 便 为 00020183518 的 上 一 条 指令 数 。 

不 过 先 不 急 ， 注 意 看 ， 这 个 中 断 所 调用 的 中 断 处 理 函 数 ， 其 选择 子 是 08， 段 内 地 址 是 0xc0001elb。 因 为 
是 在 保护 模式 下 ， 所 以 段 基 址 寄存 器 中 的 内 容 不 再 是 地 址 ， 而 是 个 选择 子 。 不 过 在 此 大 家 就 先 理解 为 段 基 址 
行 了 ， 这 不 影响 大 家 理解 本 节 后 面 的 内 容 。 我 还 想 看 看 这 个 地 址 是 哪个 函数 ， 再 发 挥 一 下 nm 命令 的 威力 。 

nm 命令 用 来 列 出 可 执行 文件 的 符号 表 及 其 地 址 , 在 不 加 参数 的 情况 下 , 默认 输出 “地 址 ”符号 类 型 ” 




































































































































































































































































“函数 名 ”。 用 法 : nm 二 进 制 可 执行 文件 。 注 意 ， 纯 二 进 制 文件 不 支持 ， 支 持 elf 文件 ， 纯 二 进 制 文件 
包含 符号 表 。 
grep 命令 是 在 输入 信息 中 匹配 出 含有 “参数 ”的 行 并 打印 出 来 。 用 法 ，grep “参数 字符 串 ”输入 文 
或 通过 管道 “|”。 
由 于 nm 会 输出 文件 内 所 有 符号 信息 ， 所 以 用 grep 将 此 地 址 过 滤 出 来 。 


是 
号 
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夺 


条 


到 




















nm build/kernel.bin |grep lelb 回 车 
以 下 是 输出 。 
c0001lelb t intr##0x0d##entry 

ok， 上 面 第 一 列 的 c0001elb 是 地 址 ，t 代表 这 是 位 于 代码 段 的 符号 ，intr##0x0d 枯 entry 是 符号 名 。 这 
我 自 定 义 的 函数 名 ， 规 则 是 intr 检 中 断 号 撩 entry， 以 后 会 介绍 ， 现 在 只 要 关注 中 间 的 中 断 号 就 行 啦 。 符 
名 中 的 0xd， 代 表 13 号 中 断 处 理 函 数 ， 果 然 是 GP 错误 ， 即 "#GP General Protection Exception"。 所 以 证 明 
最 后 一 个 中 断 确实 是 在 报 GP 错误 ， 我 们 可 以 放心 地 继续 调试 
下 面 这 个 调试 步骤 是 多 此 一 举 的 ， 就 是 为 使 用 lb 指令 验证 下 指令 数 是 否 正 确 。 不 过 当代 码 量 大 到 
程度 时 还 是 要 小 心 谨慎 ， 以 一 步 一 回头 的 方式 来 查看 比较 好 。 

先 在 0xc0001elb 处 设置 个 断 点 。 


大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 以 上 说 明 结 束 ， 下 面 是 bochs 控制 台 输 出 xx 大 大 六 大 大 大 大 六 大 

<bochs:1> lb 0xc0001e1lb 

<bochs:2> c 

(0) Breakpoint 1, OxcO000lelb in ?? () 

Next at t=20183518 

(0) [Ox000000001lelb] 0008:c000lelb (unk. ctxt): nop “90 
boctis:3> 

六 大火 大 大 类 类 大 大 大大 大 大 类 大 大 大 以 下 内容 为 解释 说 明 ， 非 程 序 输 出 ****x* 类 类 大米 炎 类 炎 


看 上 面 的 Next att=20183518， 和 上 一 步调 试 中 的 冒号 左边 的 数值 是 一 致 的 。 
也 就 是 说 ， 中 断 是 在 执行 第 20183518 条 指令 执行 的 ， 那 么 发 生 异 常 从 而 引发 中 断 的 指令 一 定 是 在 上 一 
， 即 〈20183518-1) 处 ， 那 我 们 可 放心 地 用 20183517 作为 时 间 点 断 点 的 值 了 ， 下 面 继续 。 

此 时 屏幕 的 输出 可 以 参看 图 3-23， 内 容 差不多 ， 还 没有 开始 打印 "GP General Protection Exception"， 
这 为 止 一 切 貌 似 正常 。 下 面 用 sba 指令 设置 时 间 点 断 点 。 


大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 以 上 说 明 结 束 ， 下 面 是 bochs 控制 台 输 出 xx 六 大 大 大 大 大 大 六 太太 
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bochs 调试 方法 


<bochs:1> sba 20183517 

Time breakpoint inserted. Delta 
<bochs:2> c 

(0) Caught time breakpoint 

Next at t=20183517 


太太 炎 大大 类 类 太太 克 太太 太太 太太 以 下 内 容 为 解释 说 明 ， 非 程 
Next at t=20183517， 下 一 个 要 执行 的 指令 是 


20183517 
亲 续 执行 


大 大 大 大 大 大 乡 
类 类 炎炎 类 大 





U 


Hb 
唔 太太 大 大 大 


0 





序 输 


























提示 捕捉 到 了 断 点 


大 大 大 大 大 大 大 


第 20183517 条 。 也 就 是 下 











i 马上 要 执行 的 指令 是 引发 中 








I 








断 的 祸根 。 
大 大 大大 火炎 大 大 大 大 大 大 xx ”以 上 说 明 结 束 ， 下 面 是 bochs 控制 台 输 出 *r*x 大 大 大大 大 大 大 六 
(0) [Ox00000000225d] 0008:c000225d (unk. ctxt) : 


大大 大 大 大 太太 大 大 大大 大 大 大 大 大 大 大 | 以 下 


CO 3 








内 容 为 解释 说 明 ， 非 程序 输 


U 
过 





Hb 
站 大 大 大 大 大 


























eflags 0x00000283 : 











六 类 大 大 大 类 类 大 大 类 类 大大 大 大大 大 大 以 下 内容 为 解释 说 明 ， 非 程 序 输 4 





Hb 
站 大 大 大 大 大 





mov byte ptr gs: [px]y， 


大 大 大 大 大 大 大 


大 大 大 大 大 大 大 





再 查看 下 gs 的 值 ，gs 值 为 0x0018 。 























大 大 大 大 大 大 大 大 大 大 大 


<bochs:4> s 
es:0x0010, 
Data segmen 
cs:0x0008, 


ss:0x0010, 
Data segmen 
ds:0x0010, 
Data segmen 
fs*0xQQ000y 
gs:0x0018, 
Data segmen 
ldtr:0x0000 
tO0KO020.; 
gdtr:base=0 
idtr:base=0 





大 大 大 大 大 大 大 大 大 大 大 
后 人 
取 间 


大 大 大 大 大 大 大 大 大 大 大 














大 大 大 





义 上 说 明 结 束 , 下 面 是 bochs 控制 台 输 














下 





reg 
dh=0x00cf9300, dl=0x0000ffff, valid=1 
t, base=0x00000000, limit=0xffffffff, 
dh=0x00cf9900, dl=0x0000ffff, valid=1 


Code segment, base=0x00000000, limit=0xffffffff, Ex 


dh=0x00cf9300, dl=0x0000ffff, valid=7 
t, base=0x00000000, limit=0xffffffff, 
dh=0x00cf9300, dl=0x0000ffff, valid=1 
t, base=0x00000000, limit=0xffffffff, 
dh=0x00001000, dl=0x00000000, valid=0 
dh=0x00c0930b, dl=0x80000008, valid=1 
t, base=0x000b8000, limit=0x00008fff, 
dh=0x00008200, dl=0x0000ffff, 
dh=0xc0808b00, dl=0x45a0006b, valid=1 
x00000900, limit=0x37 

x00004180, limit=0x407 


xxxxxxx 以 下 内 容 为 解释 说 明 ， 非 程序 输 


Hb 
站 大 大 大 大 大 











会 可 
口 相 品 





大 大 大 








以 上 说 明 结 束 ， 下 面 是 bochs 控制 











0 





Read/Wri 
ecute-On 
Read/Wri 


Read/Wri 








Read/Wri 


valid=1 


大 大 大 大 大 大 大 


单 排 错 的 方法 是 用 x 命令 查看 该 处 的 内 存 怎么 啦 。 


cl 6567880f 


了 


cl”，bx 作为 偏 移 地 址 。 不 急 ， 先 查看 下 ebx 寄存 器 的 值 。 








注意 看 这 条 morv 指令 ,“mov byte ptr gs: [bx]， 

大 大 炎 大 火炎 大 大 大 大 大 大 xx [以 上 说 明 结束 ， 下 面 是 bochs 控 1 台 输 出 *r 关 大 大 大 六 大大 大 大大 
<bochs :3> 工 

eax: 0xc010caca -1072641334 

ecx: 0x00000031 49 

edx: Oxc00003d5 -1073740843 

ebx: 0xc0009594 -1073703532 bx 为 0x9594 
esp: Oxc0103de4 -1072677404 

ebp: 0xc0103e40 -1072677312 

esi: Ox00000000 0 

edi: 0x00000000 0 

eip: 0xc000225d 


id vip vif ac vm rf nt IOPL=0 of df IF tf SF zf af pf CF 


所 交大 大 大 大 大 大 大 大 大 大 大 


te, Accessed 
ly, Non-Conforming, Accessed, 32-bit 
te, Accessed 


te, Accessed 


te, Accessed 


和 太 才 各 这 大 放 衣 这 训 这 帮 3 


<bochs:5> x gs:ax 




















上 面 果然 报错 啦 ， 提 示 1 





gs 所 指向 的 显存 段 的 limit 是 多 少 呢 ?马上 查看 下 该 段 的 段 描 
时 gs 的 值 0x18， 由 于 低 3 位 是 rpl 和 TI 位 ， 所 以 可 知 选择 索引 值 ， 其 二 进 














根 














WARNING: Offset O000CACA is out of selector 0018 limit 


六 类 大 大 类 类 类 大大 类 类 大大 类 大大 大 大 以 下 内容 为 解释 说 明 ， 非 程 序 输 4 





0 





外 出 了 段 界限 。 








时 


(00000000...00008ffE) 1! 














述 符 。 





三 
和 候 





11， 即 十 进 制 3。 
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| 


上 








直接 查看 gdt 中 索引 为 3 的 段 描述 符 。 


大 大 大 大 大 大 大 大 大 大 大 大 大 大 以 上 说 明 结 束 ， 下 面 是 bochs 控制 台 输 出 ** 关 大大 大 大 大 大 六 大 





























<bochs:6> info gdt 3 
Global Descriptor Table (base=0x00000900, limit=55): 
GDT [0x03]=Data segment, base=0x000b8000, limit=0x00008fff, Read/Write, Accessed 





六 大火 大 大 类 大 大 大 类 类 大大 类 类 大 大 大 以 下 内容 为 解释 说 明 ， 非 程序 输出 **xx 太 大 大 大 大 大 大 六 
果然 limit 为 0x8fftf， 寄 存 器 bx 的 值 为 0x9594， 用 bx 做 偏 移 量 导致 越界 ， 所 以 引发 GP 异常 。 找 到 错 
误 后 ， 为 保险 起 见 再 执行 一 下 是 否 会 引发 异常 。 按 下 s 键 执行 上 面 的 指令 “mov byte ptr gs:[bx], cl ”。 


大 大 大 大 大 大 大 大 大 大 大 大 大 大 以 上 说 明 结 束 ， 下 面 是 bochs 控制 台 给 出 六 大业 类 矿业 米 炎 炎炎 炎炎 










































































<bochs:: 7 8 
Next at t=20183518 





太太 大大 类 大大 大大 大大 大 大 类 大 大 大 以 下 内容 为 解释 说 明 ， 非 程序 输出 **xx 太 大 大大 大 大 太太 


果然 下 面 的 是 中 断 处 理 程序 的 代码 地 址 0008: c0001elb。 


大 大 大 大 大 大 大 大 大 大 大 大 大 大 以 上 说 明 结 束 ， 下 面 是 bochs 控制 台 给 出 六 类 类 类 矿业 炎炎 炎炎 炎炎 









































(0) [Ox000000001lelb] 0008:c0001elb (unk. ctxt): 
nop -90 


<bochs:8> s 

Next at t=20183519 

(0) [Ox000000001lelc] 0008:cO00lelc (unk. ctxt): push 
ds ; le 

<bochs:9> 


问题 定位 后 ， 接 下 来 就 要 检查 下 bx 的 值 为 什么 会 超过 段 界 限 了 ， 因 为 我 们 操作 的 是 gs 寄存 器 ， 此 寄 
存 器 在 我 们 项 目 中 用 来 存储 显存 段 选择 子 ， 所 以 八成 是 字符 串 输 出 函数 中 对 bx 没有 限制 导致 的 。 而 我 们 
的 函数 是 C 写 的 ， 从 汇编 到 C 去 排查 ， 很 多 时 候 并 不 需要 了 解 编译 规则 ， 只 要 定位 了 方向 ， 在 C 代码 ! 
通常 盯 上 一 会 便 能 够 让 bug 显现 出 来 啦 。 好 啦 ， 本 节 到 此 结束 ， 同 学 们 收 摊 儿 啦 。 


硬盘 介绍 


要 了 解 便 盘 ， 也 要 了 解 其 历史 。 硬 盘 属 于 存储 介质 ， 要 说 这 存储 介质 的 发 展 史 ， 还 得 从 甲骨 文 、 山 洞 
壁画 开始 说 起 呢 。 这 是 我 的 老师 当初 讲 硬盘 时 说 的 ， 不 过 咱们 没 那 么 多 精力 ， 直 接 关 注 硬盘 简 史 就 好 啦 。 
3.5.1 硬盘 发 展 简 史 

个 人 觉得 ,在 计算 机 世界 中 ， 实 现 随机 存 取 具 有 划时代 的 意义 ， 程 序 中 的 算法 不 用 再 把 存储 时 间 考 虑 
进去 , 访问 任意 数据 所 用 的 时 间 几 乎 相等 ， 这 一 改 之 前 的 存储 设备 其 存 取 时 间 呈 线性 的 历史 。 而 改变 这 一 
历史 的 时 间 是 1956 年 9 月 , 世界 上 诞生 了 第 一 台 磁 盘存 储 设备 IBM 350 RAMAC (Random Access Method 
of Accounting and Control)， 没 错 ， 又 是 IBM， 这 就 是 蓝 色 巨人 的 魅力 ， 在 几 十 年 前 已 经 为 科技 领航 。 此 
设备 用 磁头 来 读 写 数据 ， 用 盘 片 来 存储 数据 ， 以 后 的 硬盘 都 是 以 这 样 的 模式 发 展 。 这 个 磁头 可 以 直接 移动 
到 盘 片 上 的 任何 一 块 存储 单元 ， 从 而 实现 了 随机 存储 。 虽 然 它 的 总 容量 只 有 5MB， 但 是 限于 当时 的 制造 
工艺 水 平 ， 一 共 使 用 了 50 个 直径 为 24 英寸 的 盘 片 ， 扣 a 起 来 的 体积 相当 于 冰箱 那么 大 。 在 这 些 盘 片 表面 都 
涂 有 用 于 存储 数据 的 磁性 物质 ， 它 们 摆 起 来 被 固定 在 一 起 ， 在 电机 的 带动 下 ， 绕 着 同一 个 轴 旋 转 。 今 天 看 
起 来 它 显 得 过 于 笨重 且 容 量 小 得 以 至 于 没什么 用 , 但 当时 可 是 高 大 上 的 玩意 儿 ， 所 以 它 在 那 时 主要 用 于 高 
精 尖 领域 呢 ， 如 航空 业 、 银 行业 、 医 学 领域 及 太空 领域 。 

1968 年 由 JIJBM 首次 提出 了 “ 温 彻 斯 特 /Winchester” 的 技术 ， 这 可 是 个 了 不 起 的 技术 。“ 温 彻 斯 特 ” 技 
术 的 精髓 是 :“ 镀 磁盘 片 在 密封 空间 中 高 速 自转 , 磁头 悬浮 在 盘 片 上 方 , 固定 在 磁头 臂 上 沿 盘 片 径 向 移动 ” 
磁头 不 与 盘 片 接触 也 不 应 该 接触 ， 这 是 最 容易 想象 的 ， 如 果 磁 头 与 盘 片 接触 ， 在 高 速 转动 下 摩擦， 什 
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么 材料 都 会 磨损 ， 数 据 






































然 就 于 啦 。 另 外 ， 盘 片 自转 速度 是 存 取 数 据 速度 的 关键 ， 如 果 磁 头 与 盘 片 接触， 








受 摩 控 力 的 影响 ， 想 快 也 快 不 了 。 一 个 可 行 的 方案 是 让 磁头 在 盘 片 上 方 “悬浮 ” 与 盘 片 保持 非常 近 的 距离 ， 
类 似 咱们 物理 实验 中 的 气垫 导轨 。 盘 片 高 速 旋 转 会 产生 气流 ， 磁头 在 这 种 气流 下 像 飞 碟 一 样 悬 译 ， 这 样 就 保 





























证 了 不 会 与 盘 片 有 摩 控 。 磁 头 被 固定 在 磁头 臂 上 ， 它 能 治 盘 片 径 向 移动 ， 由 了 











磁头 和 盘 片 各 自 的 运动 ， 再 加 





上 如 此 近 的 距离 ， 所 以 哪怕 一 点 灰尘 都 会 造成 磁盘 的 损伤 。 于 是 ,磁头 、 盘 片 被 密封 在 了 一 个 盒子 里 。 今 天 
的 硬盘 依然 是 这 样 的 结构 ， 如 图 3-26 所 示 。 




















但 这 只 是 提出 了 这 样 的 构想 , 此 时 还 没有 











所 以 制造 还 得 由 人 家 IBM 亲自 来 完成 。 世 界 上 第 一 块 基于 “ 温 
它 就 是 所 有 硬盘 的 源头 IBM 3340， 容 量 60MB ， 由 两 个 30MB 









































呢 。 思 想 是 人 家 提出 的 , 别人 还 真 玩 不 转 ， 












































彻 斯 特 ” 技 术 的 硬盘 ， 在 1973 年 诞生 ， 
的 存储 单元 拼合 而 成 。 从 此 硬盘 技术 的 发 



































展 便 有 了 成 形 的 结构 基础 。 所 以 , 今天 的 硬盘 也 称 为 温 盘 ， 在 一 般 的 可 编程 中 断 控制 器 上 连接 硬盘 的 引 肢 














都 标 有 温 彻 斯 特 硬盘 呢 。 











“ 温 彻 斯 特 ” 这 个 名 字 还 有 个 典故 ， 一 些 习 





字 “30”。 于 是 这 种 硬盘 的 内 音 


彻 斯 特 来 复 枪 ”。 


硬盘 发 展 到 今天 , 这 几 十 年 来 都 是 靠 容 量 不 断 提 天 





















































人 ， 家 用 电脑 10 年 前 硬盘 3 




















的 ， 磁 头 臂 移动 到 目标 位 置 的 时 让 






























































EE 影 《 终 结 者 》 中 施 瓦 辛 格 拿 的 枪 便 是 “ 温 























大 发 明 ， 其 名 字 背 后 大 多 数 都 有 个 小 故事 。 由 于 IBM 3340 
拥有 两 个 30MB 的 存储 单元 ， 而 当时 一 种 很 有 名 的 “ 温 彻 斯 特 来 复 枪 ”的 
代号 就 被 定 为 “ 温 彻 斯 特 ”。 据说 


























径 和 装 药 也 恰好 包含 了 两 个 数 






































手 存活 下 来 的 。 可 是 速度 一 直 是 其 最 大 的 政 




















流转 速 是 7200 转 /分 钟 ， 今 天 依然 如 此 。 硬 盘 的 随机 存 取 是 靠 磁头 臂 不 断 移 动 实现 
] 称 为 寻 道 时 间 ， 如 果 存 储 的 数据 不 连续 ， 这 一 块 那 一 片 的 ,磁头 就 得 不 断 调整 





位 置 ， 这 是 机 械 式 硬 盘 不 可 避免 的 ， 这 便 是 硬盘 的 瓶颈 所 在 ， 所 以 一 般 的 硬盘 都 将 寻 道 时 间作 为 重要 参数 。 








SSD 固态 硬盘 为 我 人 





怎么 样 ， 看 起 来 像 “ 大 块 的 ”内 存 条 ， 看 不 到 机 械 部 从 
样 , 基于 闪存 , 也 就 是 Flash Memory, 它 不 存在 机 械 部 伯 
翻译 过 来 就 是 固态 硬盘 。 不 过 这 个 “ 国 









































> 盘 片 














3-26 硬盘 内 部 结构 








的 ， 而 是 突显 了 其 优势 : 稳定 与 牢固 。 


它 能 存活 下 来 是 有 3 





各 种 优化 寻 道 的 方法 ， 甚 至 接口 已 经 变 成 了 串 
固态 硬盘 的 优势 开始 显 山 露水 ， 其 最 大 的 优点 是 速度 快 ， 但 
人 电脑 中 很 少见 到 ssd 硬盘 ， 目 前 了 












































式 管理 中 心 zookeeper。 


3.5.2 ”硬盘 工作 原理 

















为 了 讲 清楚 硬盘 的 工作 原理 ， 我 有 


请 参看 图 3-28 。 














左边 的 主轴 上 有 两 个 盘 片 ， 其 实 不 止 两 个 , 这 里 示意 性 
































其 道理 的 ， 存 在 即 合理 。 























a 
































站 








在 众多 竞争 对 象 当中 ， 也 有 一 款 顽 强 地 活 了 下 来 ， 它 就 是 SSD 固态 硬盘 ， 人 家 也 有 几 十 年 的 历史 了 。 
带 来 了 全 新 的 解决 方案 ， 如 区 

















3-27 SSD 固态 硬盘 


F 。 传统 硬盘 是 机 械 式 人 硬盘， 而 SSD 同 U 盘 一 
的 原因 .SSD 全 称 是 Solid State Disk， 



































态 ” 和 








































































































“三 态 ” 无 关 ， 不 是 说 其 他 硬盘 是 “液态 ”或 者 是 “气态 ” 


9 温 彻 斯 特 硬盘 为 了 提速 ， 内 部 加 了 很 多 缓存 ， 应 用 了 
日 主 流 磁 盘 转 速 还 是 7200 转 ， 速 度 却 提升 有 限 。 于 是 
缺点 也 明显 ， 容 量 低 ， 价 格 也 很 贵 。 所 以 在 个 
要 还 是 运用 在 要 求 存 储 速度 较 快 的 生产 环境 中 ， 如 数据 库 系 统 、 分 布 














有 画图 板 花 了 1 个 小 时 画 了 这 张 示意 图 , 希望 对 大 家 有 所 帮助 。 大 家 

















画 了 两 个 。 盘 片 固定 在 主轴 上 随 主轴 高 速 
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第 3 





章 完善 MBR 














前 主流 个 人 
由 一 个 磁头 来 












































由 于 








上 与 磁头 是 一 一 对 








面 。 磁 头 编号 从 上 到 下 以 0 开始 计数 ， 所 以 月 
它 需 要 被 固 
， 在 磁头 臂 的 带动 下 ， 沿 着 盘 片 边缘 向 
摆动 的 轨迹 是 个 弧 ， 并 不 是 绝对 径 向 
为 磁头 辟 是 由 步 进 电机 驱动 的 ， 
另 一 端 是 磁头 。 步 进 


= 
边 的 
方向 
地 直 
磁头 
都 会 





弧 


线 ， 

















盘面 。 磁头 不 会 自 
磁头 臂 

来 回 摆动 ， 注 意 ， 
来 直 去 。 一 方面 这 是 因 
臂 一 端 是 步 进 电机 主轴 ， 


己 在 盘 片 上 移动 ， 
























































应 的 关系 ， 故 | 


























定 在 右 
心 的 





[ 吾 | 
由 























电机 每 次 














转动 一 个 角度 ， 所 以 


























状 是 
片 任 


管理 

















i 


带动 磁头 臂 在 “ 夯 
于 磁头 臂 的 另 一 端 ， 所 以 也 跟着 呈 钟 摆 运 动 ， 
并 不 是 直线 。 所 以 ， 图 3-28 中 磁头 臂 中 标注 了 “类 似 于 ” 径 向 和 运动， 
面 ， 磁 头 读 取 数 据 也 不 需要 做 直 来 直 去 的 移动 ， 


百 
由 





” 而 磁头 位 








运动 轨迹 是 个 


台 已 
能 否 











没关系 的 。 所 以 ,一 方面 盘 片 的 
意 位 置 的 数据 。 
说 完了 硬盘 内 音 
磁盘， 这 些 磁性 



































而 形 
上 的 
5 
书 上 
面 的 
转 ， 





两 个 





， 扁 形 与 每 个 同心 环 相交 的 弧 状 
弧 状 








区 域 是 扇形 的 一 部 分 ， 故 称 之 为 请 


转 ， 另 一 方 




















各 部 件 的 运动 ， 再 说 下 存储 逻辑 。 盘 方 表面 是 上 
介质 也 被 “格式 化 ”成 易于 管理 的 格局 ， 即 将 整个 担 硬 
区 域 作为 最 基本 的 数 和 





























我 们 写 入 的 数据 最 终 是 写 进 了 磁道 


上 的 扇 区 中 。 汶 





有 脑 硬 盘 上 的 转速 是 7200 转 / 分 钟 。 每 个 盘 片 分 上 下 两 面 ， 
读 取 数据 , 故 一 个 盘 片上 对 应 2 个 磁头 。 
磁头 号 来 表示 盘 
有 磁头 0 代表 第 


找到 数据 ， 只 跟 它 











都 存储 数据 ， 每 个 盘 


。 盘 片 
/ 

















磁道 





磁头 0 





类 似 于 
径 向 运动 








磁头 各 


主 划 
3-28 ”机 械 式 硬盘 示意 








受 | 


这 就 是 “类 似 ” 的 原因 。 男 
最 终 落 点 有 关 ， 和 中 间 路 径 形 





Pp 
































掉 磁 头 的 摆动 ， 这 两 种 








) 作 的 合成 ， 使 磁头 能 够 读 取 盘 














于 存储 数据 的 磁性 介质 ， 为 了 更 有 交 











A 
FE 意 啦 


， 我 上 国 








介绍 磁道 时 都 简单 画 了 个 
， 数 据 就 存储 这 些 














6 
| 


























就 是 在 磁道 内 定位 扇 区 。 大 家 看 看 




















人 磁道 的 编号 和 磁头 一 样 也 是 从 0 开始 




















j 灰 ; 





se 


盘 片 上 编号 相同 的 磁道 ， 它 们 之 间 




















如 果 


Ey 


图 3-28， 配 合 着 想像 力 理 
的 。 相 同 编号 的 磁道 
,直线 连接 起 来 的 部 分 ， 


























盘 片 非常 多 的 话 ,“ 柱 面 ”就 显得 
柱 面 这 个 看 似 抽象 的 概念 有 什么 用 








可 
































非常 形象 了 。 
呢 ? 前 面 介 绍 过 了 , 机械 式 硬盘 的 寻 道 时 间 是 整个 硬盘 的 瓶颈 ,为 


圆 图， 这 容易 让 人 误解 磁道 是 条 线 ， 线 上 可 无 法 存 


























j 划 分 为 多 个 同心 环 ， 以 圆心 画 














四 存储 单元 。 这 个 同心 环 就 称 为 磁道 ， 而 同心 环 
区 ， 它 作为 我 们 向 硬盘 存储 数据 的 最 基本 单位 ， 大 小 是 512 字 
i 说 的 磁道 是 个 环 ， 不 是 线 ， 很 多 教科 





嵌 数 据 ,“ 环 ”是 有 横 截 




















摆 积 ”中 。 磁 头 臂 带动 磁头 在 盘 片 上 方 移 亏 


由 ， 





就 是 在 找 磁 道 的 位 置 ， 盘 片 高 速 自 

















解 





成 的 管状 


下 。 








区 域 就 称 为 柱 面 。 图 3-28 中 ， 


























了 减 








少 寻 道 时 间 ， 就 尽量 在 存储 上 下 














为 寻 
行 了 
将 来 
盘 速 




















道 时 
。 这 











夫 。 寻 道 ， 简 而 














读 出 来 的 时 候 也 需要 变换 磁道 ,也 就 是 需要 多 次 寻 道 才 








度 影响 较 大 ， 那 原 见 


二 














编号 ， 编 号 相同 则 意味 着 磁道 在 盘面 上 的 位 置 相同 ， 要 定位 到 同一 可 














1 征 





人 磁头 不 用 再 移动 了 。 是 不 是 很 赞 呢 ? 





按照 这 种 想法 写 数 据 : 当 0 面 上 的 某 磁 道 








做 道 
道 ) 


各 个 磁道 间 的 扇 


况 下 

















空间 还 是 不 足 ， 再 
都 不 够 用 时 才 会 写 到 新 的 柱 夯 
扇 区 编号 与 盘面 和 磁道 不 同 ， 
区 编号 都 相同 ， 

































































上 就 尽量 减少 寻 道 次 数 。 于 是 按 柱 画 


全 已 器， 














很 像 柱 子 的 弧 形 表面 ， 所 以 称 柱 面 。 






































言 之 就 是 磁头 在 磁道 间 跳 转 ， 跳 转 所 需要 的 时 间 称 
间 。 如 果 待 写 入 的 数据 小 于 一 个 磁道 的 剩余 容量 ， 将 来 再 读 出 来 的 时 候 ， 磁 头 只 定位 到 该 磁道 就 
时 候 的 寻 道 只 是 一 次 。 如 果 待 写 入 的 数据 要 占用 多 个 磁道 时 ， 

















除了 写 的 时 候 要 变换 磁头 到 新 磁道 ， 








能 完成 数据 的 完整 读 写 。 既 然 寻 道 对 机 械 式 硬 














j 存 取 的 想法 就 诞生 了 : 柱 画 





i 中 的 磁道 是 相同 


























空间 不 足 时 ， 其 他 数据 写 入 第 1 





写 第 2 面相 同 编号 的 磁道 上 ， 直 到 同一 柱 玫 
1 上。 所 以 ， 在 这 一 
各 磁道 内 的 局 


点 上 ， 

















一 个 磁道 中 有 63 个 局 








出 














上 的 磁道 《所 有 一 四 














盘 国 








区 呢 ? 即使 是 按照 纺 





























了 局 区 自身 的 信息 ， 哪 些 信 息 能 唯一 定位 一 个 鹿 
接 下 来 咱们 看 看 ， 目 前 咱们 的 主板 是 怎样 支持 硬盘 的 。 
之 前 和 大 家 讨论 显卡 时 说 过 了 ，CPU 小 朋友 很 低调 ,不 擅长 和 陌生 人 交流 ， 
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又 呢 ? 答案 是 磁头 号 、 磁 道 号 和 局 


越 多 ， 硬 盘 越 快 。 
区 是 以 1 为 起 始 编号 的 ， 并 且 只 限于 本 磁道 内 有 效 ， 所 以 
下 限 都 是 以 0 起 ， 上 限 就 不 一 定 了 ， 取 决 于 各 厂商 的 工艺 ， 不 过 大 多 数 情 
区 。 磁 头 如 何 找到 所 需要 的 
去 比 对 编号 吧 。 原 来 ， 扇 区 是 有 自己 的 “ 头 部 ”， 头 部 之 后 的 部 分 才 是 存储 数据 的 512 字 节 。 头 部 中 包含 





面 中 的 磁道 ， 所 有 磁头 位 置 都 一 样 ， 


























掉 相 同 编号 的 磁道 上 。 若 新 
上 的 编号 相同 的 磁 






































决 


























号 查找 也 得 有 个 地 方 让 磁头 


























区 号 。 











只 和 熟悉 的 IO 接口 通信 ， 














案 就 是 硬盘 控制 器 。 
硬盘 控制 器 同 硬盘 的 关系 























它们 说 话 ， 由 它们 将 CPU 的 话 转译 给 外 部 设备 。 这 是 它们 的 共同 点 ， 但 不 同 的 是 显卡 和 显示 器 是 分 开 的 ， 硬 











盘 控 制 器 和 硬盘 是 连接 在 一 起 





























能 装 在 机 箱 里 呢 ， 当 然 要 和 显 

















是 怎样 和 硬盘 打交道 的 呢 ? 换 名 话说 , 针对 硬盘 的 IO 接口 是 什么 ? 





， 如 同 显卡 和 显示 器 一 样 ， 它 们 都 是 专门 驱动 外 部 设备 的 模块 电路 ，CPU 只 同 









































的 ， 至 少 在 我 接触 计算 机 以 来 一 直 就 是 这 样 的 ， 从 未 变 过 ， 也 不 曾 怀 疑 过 。 

















有 天 被 告知 ,在 很 久 很 久 以 前 ， 硬 盘 控 制 器 和 硬盘 也 是 分 开 的 ， 就 像 显 卡 和 显示 器 一 样 。 显 示 器 太 大 了 ， 怎 儿 




















卡 分 开 了 。 可 硬盘 控制 器 和 硬盘 都 那么 小 ， 为 什么 还 要 分 开 呢 ? 








是 啊 ， 为 什么 呢 ， 我 也 不 知道 ， 可 它们 在 很 久 以 前 就 是 分 开 的 。 后 来 业界 的 几 个 老大 合作 开发 出 一 种 
新 的 接口 ， 这 样 才 将 硬盘 和 硬盘 控制 器 整合 在 一 起 ， 为 了 突显 “整合 ”之 意 ， 硬 盘 控 制 器 和 硬盘 终于 在 一 
起 了 ， 这 种 接口 便 称 为 集成 设备 电路 〈Integrated Drive Electronics，IDE)。 随 着 IDE 接口 标准 的 影响 力 越 
来 越 广泛 , 全球 标准 化 协议 将 此 接口 使 用 的 技术 规范 归纳 成 为 全 球 硬 盘 标 准 , 这 样 就 产生 了 ATA(Advanced 




















Technology Attachment)。 不 过 由 于 IDE 这 个 名 字 已 经 叫 开 了 ， 上 所 以 大 
家 依然 习惯 称 硬盘 为 IDE 硬盘 。 计 算 机 发 展 非常 快 ， 新 老 交 蔡 的 现象 
层出不穷 ， 以 至 于 后 辈 的 出 现 常常 把 前 辈 的 名 字 都 给 改 了 。 这 不 ， 前 











几 年 刚 出 道 的 硬 稳 串 行 接 

















以 之 前 的 ATA 接口 只 好 称 为 并 行 ATA， 即 (Parallel ATA，PATA )。 
以 前 一 般 的 主机 只 支持 4 个 并 口 硬 盘 ， 但 自从 出 现 串 口 硬盘 后 ， 
情况 就 变 了 ， 支 持 多 少 块 和 硬盘， 取决 于 主板 的 能 力 。 有 的 主板 同时 兼 
容 这 两 种 接口 ， 如 图 3-29 所 示 。 
图 中 6 个 并 排 的 小 接口 都 是 SATA, 插 槽 里 面 呈 字符 工 形 , 这 就 是 






























































































































































(Serial ATA，SATA)， 由 于 其 是 串 行 ， 所 










































































4 图 3-29 硬盘 的 与 串口 拱 






























































它 的 标志 。 左 边 的 长 方形 ， 里 





古 有 好 多 针 的 接口 是 PATA 接口 ， 也 就 















































是 之 前 传统 的 硬盘 是 插 在 此 接口 上 面 的 。 下 面 把 两 个 接口 对 应 的 线 缆 贴 出 来 对 比 一 下 ， 如 图 3-30 所 示 。 





主板 插口 4 


从 盘 接口 


PATA 接 口 SATA 接 口 
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这 两 种 线 线 完 全 不 同 ， 左 边 PATA 接口 的 线 缆 也 称 为 IDE 线 ， 一 个 IDE 线 上 可 以 挂 两 块 硬盘 ， 一 个 


是 主 盘 (Master)， 一 个 是 从 盘 〈Slave)。 标 有 “主板 插口 ”的 那 一 头 要 插 在 图 3-29 中 PATA 接口 处 。 在 






































之 前 ， 主 盘 从 盘 的 分 工 很 明显 ， 很 多 工作 都 要 以 主 盘 为 主 ， 比 如 系统 就 要 装 在 主 盘 上 。 到 后 来 系统 兼容 性 

















越 来 越 好 ， 以 至 区 别 不 明显 了 。 前 面 说 过 了 ， 一 个 主板 支持 这 样 的 4 块 IDE (PAIA) 硬盘 ， 所 以 主板 上 提 
供 两 个 IDE 插 槽 。 这 两 个 接口 也 是 以 0 为 起 始 编号 的 ， 一 个 称 为 IDE0， 另 一 个 称 为 IDE1。 不 过 按 ATA 的 
说 法 , 这 两 个 插 槽 称 为 通道 , IDE0 叫 作 Primary 通道 , IDE1 叫 作 Secondary 通道 。 即使 主板 上 安装 的 是 SATA 




































































硬盘 ， 它 也 兼容 PATA 的 编程 














接口 ， 向 上 兼容 是 计算 机 能 源源 不 断 向 前 发 展 的 根基 。 所 以 ， 后 面 给 出 的 端 














号 也 将 按照 PATA 这 两 个 通道 来 分 组 给 出 。 








多 说 一 句 ， 这 里 所 说 的 3 








E 桩 master、 从 盘 slave 别 和 Primary 通道 、Secondary 通道 搞 混 了， 通道 是 








channel， 不 是 disk， 每 个 通道 











上 分 别 有 主 盘 和 从 盘 。 








3.5.3 ”硬盘 控制 器 端口 


差不多 该 说 如 何 控制 硬盘 了 。 硬 盘 控 制 器 属于 IO 接口 ， 前 面 在 讲解 显卡 之 前 有 介绍 过 相关 知识 ， 不 
再 鳌 述 。 
让 硬盘 工作 ， 我 们 需要 通过 读 写 硬盘 控制 器 的 端口 ， 端 口 的 概念 在 此 重复 一 下 ， 端 口 就 是 位 于 IO 控 
制 器 上 的 寄存 器 ， 此 处 的 端口 是 指 硬盘 控制 器 上 的 寄存 器 。 
下 面 列 出 了 部 分 端口 ， 对 于 我 们 今后 的 应 用 ， 这 几 个 端口 足够 了 。 其 实 硬盘 是 很 复杂 的 ， 比 如 如 何 初 
始 化 、 各 种 状态 的 意义 ， 总 之 我 当初 看 AT 手册 的 时 候 就 被 吓 到 了 ， 有 兴趣 的 同学 可 以 下 载 
AT _ Attachment with Packet Interface， 该 手册 一 共 3 卷 。 
表 3-17 中 列 出 的 端口 号 ， 是 咱们 今后 使 用 硬盘 时 的 端口 范围 ， 虽 然 已 经 精简 了 太 多 ， 但 看 上 去 仍然 
有 点 小 芋 惧 ， 一 口吃 不 成 胖子 ， 下 面 各 端口 何 意 ， 容 我 慢 慢 道 来 。 
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表 3-17 硬盘 控制 器 主要 端口 寄存 器 
IO 端口 端口 用 途 
Primary 通道 Secondary 通道 读 操作 时 写 操作 时 

Command Block registers 
Ox1FO Ox170 Data Data 
Ox1F1 Ox171 Error Features 
Ox1F2 Ox172 Sector count Sector count 
Ox1F3 0x173 LBA low LBA low 
Ox1F4 Ox174 LBA mid LBA mid 
Ox1F5 Ox175 LBA high LBA high 
0x1F6 0x176 Device device 
Ox1F7 Ox177 Status Command 
Control Block registers 
0x3F6 0x376 Alternate status Device Control 











端口 可 以 被 分 为 两 组 ，Command Block registers 和 Control Block registers。Command Block registers 
用 于 向 硬盘 驱动 器 写 入 命令 字 或 者 从 硬盘 控制 器 获得 硬盘 状态 ，Control Block registers 用 于 控制 硬盘 工作 
状态 。 在 Control Block registers 组 中 的 寄存 器 已 经 精 减 了 ， 而 且 咱 们 基本 上 用 不 到 ， 不 说 它们 了 ， 下 面 重 
点 介绍 Command Block registers 组 中 的 寄存 器 。 
端口 是 按照 通道 给 出 的 ， 也 就 是 说 ， 大 家 不 要 像 我 当初 那样 误 以 为 端口 是 直接 针对 某 块 硬盘 的 , 不 是 
这 样 的 ， 一 个 通道 上 的 主 、 从 两 块 硬盘 都 用 这 些 端口 号 。 要 想 操作 某 通道 上 的 某 块 硬盘 ， 需 要 单独 指定 。 
瞧 ， 上 面 有 个 叫 device 的 寄存 器 ， 顾 名 思 义 ， 指 的 就 是 驱动 器 设备 ， 也 就 是 和 硬盘 相关 。 不 过 此 寄存 器 是 
8 位 的 ,一 个 通道 上 就 两 块 硬盘 ， 指 定 哪 一 个 硬盘 只 用 1 位 就 够 了 ， 寄 存 器 可 是 很 宝贝 的 资源 ， 不 能 浪费 ， 
所 以 此 寄存 器 是 个 杂项 ， 很 多 设置 都 需 集中 在 此 寄存 器 中 了 ， 其 中 的 第 4 位 ， 便 是 指定 通道 上 的 主 或 从 硬 
盘 ，0 为 主 盘 ，1 为 从 盘 。 一 会 把 device 寄存 器 示意 图 拿 出 来 给 大 家 看 看 就 知道 了 。 

端口 用 途 在 读 硬盘 和 写 硬 盘 时 还 是 有 点 区 别 的 , 比如 拿 Primary 通道 上 的 0x1F1 端口 来 说 , 读 操作 时 ， 
若 读 取 失 败 ， 里 面 存储 的 是 失败 状态 信息 ， 所 以 称 为 error 寄存 器 ， 并且 0x1F2 端口 中 存储 未 读 的 局 区 数 。 
写 操 作 时 就 变 成 了 feauture 寄存 器 ,此 寄存 器 用 于 写 命令 的 参数 。 有 没有 人 这 样 想 , 不 就 是 这 一 个 区 别 吗 ， 
加 个 寄存 器 不 就 行 了 吗 ,何必 还 分 情况 来 表示 两 种 用 途 ? 首先 , 很 久之 前 寄存 器 成 本 很 贵 ， 即 使 在 今天 
也 不 便宜 ， 为 了 节约 成 本 ， 人 是 什么 都 干 得 出 来 的 ， 哈 哈 ， 这 么 说 有 点 吓人 啦 ， 总 之 为 了 省 钱 算是 挖 空 
心思 , 充分 利用 了 有 限 的 资源 。 不 光 硬 盘 控 制 器 是 这 样 , 显卡 也 是 这 样 呢 ， 以 后 用 到 的 时 候 大 家 就 明白 了 。 
其 次 , 为 了 兼容 。 兼 容 是 推动 发 展 的 根基 , 由 于 历史 原因 就 被 设计 成 这 样 了 , 现在 虽然 不 存在 当时 的 问题 ， 
但 若 弃 之 不 理 ， 就 意味 着 抛弃 之 前 的 产业 链 ， 客 户 也 不 会 买单 的 ， 所 以 为 了 自 保 ， 必 须 得 兼容 之 前 的 老 太 
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3.5 ”硬盘 介绍 














品 。 在 CPU 业界 ， 为 什么 Intel 能 发 展 到 今天 一 派 繁 荣 ， 就 是 因为 人 家 每 次 在 设计 新 产品 时 就 要 考虑 兼容 
老 产品 ， 这 样 便 可 以 将 过 去 创造 的 财富 保留 ， 而 不 是 推翻 重 来 。 

按照 表 3-17 我 们 来 逐一 介绍 下 寄存 器 的 作用 。 

data 寄存 器 在 名 字 上 我 们 就 知道 它 是 负责 管理 数据 的 ， 它 相当 于 数据 的 门 ， 数 据 能 进 ， 也 能 出 ， 所 以 其 
作用 是 读 取 或 写 入 数据 。 数 据 的 读 写 还 是 越 快 越 好 ， 所 以 此 寄存 器 较 其 他 寄存 器 宽 一 些 ，16 位 ( 己 经 很 不 
错 了 ， 表 中 其 他 寄存 器 都 是 8 位 的 )。 在 读 硬盘 时 ， 硬 盘 准 备 好 的 数据 后 ， 硬 盘 控 制 器 将 其 放 在 内 部 的 缓冲 
区 中 , 不 断 读 此 寄存 器 便 是 读 出 缓冲 区 中 的 全 部 数据 。 在 写 硬 盘 时 , 我 们 要 把 数据 源源 不 断 地 输送 到 此 端口 ， 
数据 便 被 存 入 缓冲 区 里 ， 硬 盘 控 制 器 发 现 这 个 缓冲 区 中 有 数据 了 ， 便 将 此 处 的 数据 写 入 相应 的 扇 区 中 。 

读 硬 盘 时 ， 端 口 0x171 或 0x1F1 的 寄存 器 名 字 叫 Error 寄存 器 ， 只 在 读 取 硬盘 失败 时 有 用 ， 里 面 才 会 
记录 失败 的 信息 ， 尚 未 读 取 的 扇 区 数 在 Sector count 寄存 器 中 。 在 写 硬 盘 时 ， 此 寄存 器 有 了 别 的 用 途 ， 所 
以 有 了 新 的 名 字 ， 叫 Feature 寄存 器 。 有 些 命令 需要 指定 额外 参数 ， 这 些 参数 就 写 在 Fea ture 寄存 器 中 。 
强调 一 下 ，error 和 feature 这 两 个 名 字 指 的 是 同一 个 寄存 器 ， 只 是 因为 不 同 环境 下 有 不 同 的 用 途 ， 为 了 区 
别 这 两 种 用 途 ， 所 以 在 相应 环境 下 有 不 同 的 名 字 。 这 两 个 寄存 器 都 是 8 位 宽度 。 

Sector count 寄存 器 用 来 指定 待 读 取 或 待 写 入 的 扇 区 数 。 硬 盘 每 完成 一 个 扇 区 ， 就 会 将 此 寄存 器 的 值 
减 1， 所 以 如 果 中 间 失 败 了 ， 此 寄存 器 中 的 值 便 是 尚未 完成 的 扇 区 。 这 是 8 位 寄存 器 ， 最 大 值 为 255， 若 
指定 为 0， 则 表示 要 操作 256 个 扇 区 。 
人 硬盘 中 的 扇 区 在 物理 上 是 用 “ 柱 面 -磁头 - 扇 区 ”来 定位 的 《Cylinder Head Sector)， 简 称 为 CHS， 但 每 
次 我 们 要 事先 算出 扇 区 是 在 哪个 盘面 ， 哪 个 柱 面 上 ， 这 太 麻 烦 了 ， 这 对 于 磁头 来 说 很 直观 ， 它 就 是 根据 这 
些 信 息 来 定位 扇 区 的 。 可 是 咱们 还 是 希望 有 一 套 对 人 来 说 较 直 观 的 寻 址 方法 , 我 们 希望 磁盘 中 扇 区 从 0 开 
始 依次 递增 编号 ， 不 用 考虑 扇 区 所 在 的 物理 结构 。 其 实 我 在 描述 需求 时 已 经 说 出 了 LBA 的 定义 ， 这 是 一 
种 逻辑 上 为 扇 区 址 的 方法 ， 全 称 为 逻辑 块 地 址 〈Logical Block Address )。 

LBA 有 两 种 ， 一 种 是 LBA28， 用 28 位 比特 来 描述 一 个 扇 区 的 地 址 。 最 大 寻 址 范围 是 2 的 28 次 方 等 
于 268435456 个 户 区 ， 每 个 户 区 是 512 字 节 ， 最 大 文 持 128GB 。 我 们 这 里 为 图 简单 ， 采 用 LBA28 模式 。 
1 于 128GB 已 经 不 能 满足 日 益 增 长 的 存储 需求 ， 硬 盘 越 来 越 大 了 ， 得 有 相 匹 配 的 寻 址 方法 与 之 配套 ， 
是 要 介绍 的 另外 一 种 是 LBA48， 用 48 位 比特 来 描述 一 个 肩 区 的 地 址 ， 最 大 可 寻 址 范围 是 2 的 48 次 方 ， 
等 于 281474976710656 个 户 区 ， 乘 以 512 字 节 后 ， 最 大 文 持 131072TB， 即 128PB。 话 说 我 曾经 运 维 过 的 
Hadoop 集群 才 14PB， 看 样子 LBA48 还 是 能 撑 一 阵子 的 。 

介绍 完了 LBA， 现 在 可 以 说 LBA 寄存 器 了 ， 这 里 有 LBAlow、LBAmid、LBAhigh 三 个 ， 它 们 三 个 
都 是 8 位 宽度 的 .LBAlow 寄存 器 用 来 存储 28 位 地 址 的 第 0~7 位 , LBA mid 寄存 器 用 来 存储 第 8 一 15 位 ， 
LBA high 寄存 器 存储 第 16 一 23 位 。 哎 ?三 个 8 位 的 加 起 来 才 24 位 ， 连 LBA28 都 不 够 ， 咱 们 怎么 用 呢 ? 
有 问题 就 有 解决 方案 ， 这 就 引出 了 下 一 个 寄存 器 ，device 寄存 器 。 
在 之 前 说 过 了 ，device 寄存 器 是 个 杂项 ， 它 的 宽度 是 8 位 。 在 此 寄存 器 的 低 4 位 用 来 存储 LBA 地 址 
的 第 24~27 位 。 结 合 上 面 的 三 个 LBA 寄存 器 。 第 4 位 用 来 指定 通道 上 的 主 盘 或 从 盘 ，0 代表 主 盘 ，1 代 
表 从 盘 。 第 6 位 用 来 设置 是 否 启用 LBA 方式 , 1 代表 启用 LBA 模式 , 0 代表 启用 CHS 模式 。 另 外 的 两 位 : 
第 5 位 和 第 7 位 是 固定 为 1 的 ， 称 为 MBS 位 ， 大 家 不 用 关注 啦 。 
在 读 硬盘 时 ， 端 口 0x1F7 或 0x177 的 寄存 器 名 称 是 Status， 它 是 8 位 宽度 的 寄存 器 ， 用 来 给 出 硬盘 的 
状态 信息 。 第 0 位 是 ERR 位 ,如 果 此 位 为 1， 表示 命令 出 错 了 ， 有 具体 原因 可 见 error 寄存 器 。 第 3 位 是 data 
request 位 ， 如 果 此 位 为 1, 表示 硬盘 已 经 把 数据 准备 好 了 , 主机 现在 可 以 把 数据 读 出 来 。 第 6 位 是 DRDY， 
表示 硬盘 就 绕 ， 此 位 是 在 对 硬盘 诊断 时 用 的 ， 表示 硬盘 检测 正常 ， 可 以 继续 执行 一 些 命令 。 第 7 位 是 BSY 
位 ， 表 示人 硬盘 是 否 繁忙 ， 如 果 为 1 表示 硬盘 正 忙 着 ， 此 寄存 器 中 的 其 他 位 都 无 效 。 男 外 的 4 位 暂 不 关注 。 

在 写 人 硬盘 时 , 端口 0x1F7 或 0x177 的 寄存 器 名 称 是 command， 和 上 面 说 过 的 error 和 feature 寄存 器 情况 

样 ， 只 是 用 途 变 了 ， 所 以 换 了 个 名 字 表 示 新 的 用 途 ， 它 和 status 寄存 器 是 同一 个 。 此 寄存 器 用 来 存储 让 硬 

盘 执 行 的 命令 ， 只 要 把 命令 写 进 此 寄存 器 ， 硬 盘 就 开始 工作 了 。 在 咱们 的 系统 中 ， 主 要 使 用 了 三 个 命令 。 

(1) identify: 0xEC， 即 硬盘 识别 。 
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(2 ) read sector: 0x20， 即 读 扇 
(3) write sector: 0x30， 即 写 届 区 。 
在 此 只 列 出 了 本 书 需 要 的 指令 ， 大 家 知 对 此 感 兴趣 ， 还 是 去 看 ATA 手册 ， 您 懂 的 ， 里 面 内 容 丰 富 详 
实 ， 相 信 大 家 一 定 会 一 饱 眼福 。 

总 结 下 寄存 器 error、feature 和 status、command， 大 家 可 以 这 样 来 助 记 : 这 两 组 都 是 同一 寄存 器 (也 
就 是 同一 端口 ) 多 个 用 途 ， 对 同一 端口 写 操作 时 ， 硬盘 控制 器 认为 这 是 个 命令 ， 对 同一 端口 读 操作 时 ， 硬 
盘 控制 器 认为 是 想 获 得 状态 。 

下 面 给 大 家 呈 上 常用 的 寄存 器 (端口 ) 示 意图， 首先 出 场 的 选手 是 device 寄存 器 ， 如 图 3-31 所 示 。 

下 一 位 选手 是 status 寄存 器 ， 如 网 3-32 所 示 。 
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7 7 一 一 一 此 位 为 1 表示 硬盘 正 忙 ， 勿 扰 

6 寻 址 模式 : LBA:1, CHS:0 6 一 此 位 为 1 表示 设备 就 绪 ， 等 待 指令 

5 5 

4 一 一 一 主 盘 或 从 盘 4 
此 位 为 1 表示 硬盘 已 经 

3 2 了 准备 好 数据 ， 随 时 可 以 输出 

2 守 

LBA 地 址 的 第 23~27 位 

1 1 

此 位 为 1 表示 有 错误 发 生 ， 
错误 信息 见 error 寄 存 器 

A 图 3-31 device 寄存 器 和 图 3-32 ”status 寄存 器 




















3.5.4 常用 的 硬盘 操作 方法 


硬盘 中 的 指令 很 多 ， 各 指令 的 用 法 也 不 同 。 有 的 指令 直接 往 command 寄存 器 中 写 就 行 了 ， 有 的 还 要 
在 feature 寄存 器 中 写 入 参数 , 最 权威 的 方法 还 是 要 去 参考 ATA 手册 。 由 于 本 书 中 用 到 的 都 是 简单 的 指令 ， 
所 以 对 此 抽象 出 一 些 公共 的 步 又 仅 供 参考 之 用 。 

不 管 是 读 硬 盘 ， 还 是 写 硬 盘 ， 都 不 是 一 个 指令 就 完事 的 。 相 关 寄 存 器 都 需要 设置 。 要 是 读 硬盘 ， 得 告 
诉 读 哪个 扇 区 ， 读 几 个 扇 区 ， 用 哪 种 模式 对 扇 区 寻 址 ，LBA? CHS? 写 硬盘 也 一 样 ， 写 哪个 ， 写 几 个 ， 还 
要 设置 操作 的 是 哪个 通道 的 哪个 硬盘 …… 讲 了 这 么 多 寄存 器 , 心 想 ,， 我 到 底 先 设置 哪个 寄存 器 呢 ?” 有 没有 
个 一 般 硬 盘 操 作 的 基本 顺序 呢 ? 还 真有 ， 小 弟 马 上 给 大 家 呈 s 上 大 概 步骤 。 最 主要 的 顺序 就 是 command 寄 
存 器 一 定 得 是 最 后 写 ， 因 为 一 旦 command 寄存 器 被 写 入 后 ， 硬 盘 就 开始 干 活 啦 ， 它 才 不 管 其 他 寄存 器 
的 值 对 不 对 ， 一 律 拿 来 就 用 ， 有 问题 的 话 报 错 就 好 啦 。 其 他 寄存 器 顺序 不 是 很 重要 。 

那 咱 们 可 以 约定 个 操作 顺序 ， 免 得 大 家 感到 无 所 适 从 ， 请 原谅 我 这 么 说 ， 因 为 我 就 有 选择 恐惧 症 ， 我 
很 理解 像 我 这 样 的 同学 。 咱 们 还 是 约定 个 步 又 好 。 

(1) 先 选择 通道 ， 往 该 通道 的 sector count 寄存 器 中 写 入 待 操 作 的 扇 区 数 。 

(2) 往 该 通道 上 的 三 个 LBA 寄存 器 写 入 扇 区 起 始 地 址 的 低 24 位 。 

(3) 往 device 寄存 器 中 写 入 LBA 地 址 的 24~27 位 ， 并 置 第 6 位 为 1， 使 其 为 LBA 模式 ， 设 置 第 4 
位 ， 选 择 操 作 的 硬盘 (master 便 盘 或 slave 人 硬盘 )。 

(4) 往 该 通道 上 的 command 寄存 器 写 入 操作 命令 。 

(5) 读 取 该 通道 上 的 status 寄存 器 ， 判 断 便 盘 工作 是 否 完成 。 

(6) 如 果 以 上 步骤 是 读 硬盘 ， 进 入 下 一 个 步 又。 和 否则， 完工 。 

(7) 将 硬盘 数据 读 出 。 
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人 


硬盘 工作 完成 后 ， 它 已 经 准备 好 了 数据 ， 咱 们 该 怎么 获取 呢 ? 一 般 常用 的 数据 传送 方式 如 下 。 

(1) 无 条 件 传送 方式 。 

(2) 查询 传送 方式 。 

(3) 中 断 传 送 方式 。 

(4) 直接 存储 器 存 取 方式 (DMA)。 

(5) VO 处 理 机 传送 方式 。 

对 于 上 面 的 第 1 种 “无 条 件 传送 方式 ” 应 用 此 方式 的 数据 源 设备 一 定 是 随时 准备 好 了 数据 ，CPU 随 
时 取 随 时 拿 都 没 问题 ， 如 寄存 器 、 内 存 就 是 类 似 这 样 的 设备 ，CPU 取 数 据 时 不 用 提前 打招呼 。 
第 2 种 “查询 传送 方式 ” 也 称 为 程序 IO、PIO (Programming Input/Output Model)， 是 指 传输 之 前 ， 
1 程序 先 去 检测 设备 的 状态 。 数 据 源 设备 在 一 定 的 条 件 下 才能 传送 数据 ， 这 类 设备 通常 是 低速 设备 ， 比 
CPU 慢 很 多 。CPU 需要 数据 时 ， 先 检查 该 设备 的 状态 ， 如 果 状 态 为 “准备 好 了 可 以 发 送 ” CPU 再 去 获取 
数据 。 硬 盘 有 status 寄存 器 ， 里 面 保 存 了 工作 状态 ， 所 以 对 硬盘 可 以 用 此 方式 来 获取 数据 。 

第 3 种 “中 断 传送 方式 ” 也 称 为 中 断 驱 动 TO 。 上 面 提 到 的 “查询 传送 方式 ”有 这 样 的 缺陷 ， 由 于 CPU 
需要 不 断 查询 设备 状态 , 所 以 意味 着 只 有 最 后 一 刻 的 查询 才 是 有 意义 的 , 之 前 的 查询 都 是 发 生 在 数据 尚未 准 
备 好 的 时 间 段 里 ， 所 以 说 效率 不 高 ， 仅 对 于 不 要 求 速 度 的 系统 可 以 采用 。 可 以 改进 的 地 方 是 如 果 数 据 源 设 备 
将 数据 准备 好 后 再 通知 CPU 来 取 ， 这 样 效率 就 高 了 。 通 知 CPU 可 以 采用 中 断 的 方式 ， 当 数据 源 设 备 准 备 好 
数据 后 ， 它 通过 发 中 断 来 通知 CPU 来 拿 数据 ， 这 样 避 免 了 CPU 花 在 查询 上 的 时 间 ， 效 率 较 高 。 
第 4 种 “直接 存储 器 存 取 方 式 (DMA)”。 在 中 断 传 送 方式 中 ， 虽 然 极 大 地 提高 了 CPU 的 利用 率 ， 但 
通过 中 断 方式 来 通知 CPU，CPU 就 要 通过 压 栈 来 保护 现场 ， 还 要 执行 传输 指令 ， 最 后 还 要 恢复 现场 。 似 
乎 有 同学 说 此 方式 已 经 很 爽 了 ， 你 还 想 怎样 ? 哈哈 ， 其 实 更 爽 的 是 一 点 都 不 要 浪费 CPU 资源 ， 不 让 CPU 
参与 传输 ， 完 全 由 数据 源 设 备 和 内 存 直接 传输 。CPU 直接 到 内 存 中 拿 数据 就 好 了 。 这 就 是 此 方式 中 “ 直 
接 ” 的 意思 。 不 过 DMA 是 由 硬件 实现 的 ， 不 是 软件 概念 ， 所 以 需要 DMA 控制 器 才 行 。 
第 5 种 “IO 处 理 机 传送 方式 ”。 不知 大 家 发 现 了 没有 , 在 说 上 面 每 一 种 的 时 候 都 把 它们 各 自 说 得 特别 
好 ， 似 乎 完美 不 可 替代 了 ， 就 像 电视 上 的 广告 一 样 ， 每 次 都 把 自己 的 产品 描述 得 无 与 伦比 ， 甚 至 全 宇宙 第 

,但 该 公司 一 出 新 产品 , 就 开始 自曝 曾经 无 与 伦比 的 老 一 代 产 品 的 问题 以 突显 现在 产品 更 胜 一 筹 。 DMA 
已 经 借助 其 他 硬件 了 ，CPU 已 经 很 轻松 了 ， 难 道 还 有 更 碍 的 方式 ?” 是 啊 ，DMA 方式 中 CPU 还 嫌 爽 的 不 
够 ， 毕 竟 数 据 输入 之 后 或 输出 之 前 还 是 有 一 部 分 工作 要 由 CPU 来 完成 的 ， 如 数据 交换 、 组 合 、 校 验 等 。 
如 果 DMA 控制 器 再 强大 一 点 ， 把 这 些 工 作 帮 CPU 做 了 就 好 了 。 也 是 哦 ， 既 然 为 了 解放 CPU， 都 已 经 引 
用 一 个 硬件 (DMA) 了 , 干脆 一 不 做 三 不 休 ， 再 引入 一 个 硬件 吧 。 于 是 ，LO 处 理 机 诞生 啦 ， 听 名 字 就 知 
道 它 专门 用 于 处 理 IJO， 并 且 它 其 实 是 一 种 处 理 器 ， 只 不 过 用 的 是 另 一 套 擅长 IO 的 指令 系统 ， 随 时 可 以 处 
理 数据 。 有 了 LO 处 理 机 的 帮忙 ，CPU 甚至 可 以 不 知道 有 传输 这 回 事 ， 这 下 CPU 才 真 正 更 到 家 啦 。 同 样 ， 
这 也 是 需要 单独 的 硬件 来 支持 。 

综 上 所 述 ,硬盘 不 符合 第 1 种 方法 ， 因 为 它 需 要 在 某 种 条 件 下 才能 传输 。 第 4 种 和 第 5 种 需要 单独 
的 硬件 支持 ， 先 不 说 我 们 的 bochs 能 和 否 模拟 这 两 种 硬件 ， 单 独 学 习 这 两 类 硬件 的 操作 方法 就 很 头疼 ， 大 
家 有 兴趣 的 话 还 是 先 放 一 放 ， 以 后 再 琢磨 吧 。 所 以 在 我 们 的 系统 中 ， 我 们 用 了 第 2、3 这 两 种 软件 传输 
方式 。 

关于 硬盘 的 部 分 介绍 完了 ， 接 下 来 的 工作 是 实践 ,我 记得 当初 自己 做 实验 时 的 心情 是 非常 志 起 的， 总 
是 担心 有 些 东西 不 可 控 ， 有 些 东西 自己 左右 不 了 。 如 果 您 此 时 的 心情 也 是 这 样 ， 那 我 用 “过 来 人 ”的 经 验 
告诉 您 ， 想 太 多 也 没有 用 ， 做 就 是 了 ， 只 有 做 超出 自己 能 力 的 事 才 能 提高 ， 总 做 自己 能 力 内 的 事 ， 咱 们 大 
家 连 走路 都 不 会 呢 。 


让 廊 gx 使 用 硬盘 


到 目前 为 止 , 我 们 的 mbr 其 实 还 没 干什么 正事 呢 。 在 之 前 的 程序 接力 中 ,我 们 的 mbr 从 BIOS 手中 接 
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过 了 这 一 棒 。 但 我 们 的 MBR 只 有 512 字 节 ， 这 人 小 小 的 空间 ， 着 实 




















将 在 本 节 中 给 出 答案 。 
3.6.1 改造 MBR 
本 节 我 们 在 之 前 MBR 的 基础 上 ， 做 个 稍微 大 一 点 的 改进 ， 经 过 这 个 改 i 
硬盘 。 听 上 去 这 可 是 个 大 “手术 ” 呢 ， 我 们 要 将 之 前 学 过 的 知识 都 用 上 啦 。 其 实 没 寻 
读 写 磁盘 的 函数 而 已 ， 喻 哈 。 怀 着 兴奋 与 志 起 的 心情 ， 咱 们 开始 吧 。 
改造 不 是 乱 改 的 , 在 改 之 前 要 有 个 计划 , 对 将 来 的 程序 布局 要 有 个 规划 , 心里 有 


我 们 的 MBR 受 限于 512 字 节 大 小 的 ， 在 那么 小 的 空间 中 ， 没 法 为 内 核准 
功 加 载 到 内 存 并 运行 。 所 以 我 们 要 在 男 一 个 程序 中 完成 初始 化 环境 及 加 载 内 核 
为 loader， 即 加 



























































































































































F 不 了 什么 大 事 ， 从 MBR 接 棒 的 那天 





起 ,我们 就 知道 ， 这 一 棒 早 晚 是 要 交 出 去 的 。 可 是 要 交 给 谁 呢 ? 它 在 哪里 ? 如 何 交 给 它 ? 这 一 系列 的 问题 


进 后 ， 我 们 的 MBR 可 以 读 取 
了 么 大 啦 ， 就 是 加 了 个 


了 数 才 行 。 先 说 说 目前 的 想法 。 

















备 好 环境 ， 更 没 法 将 内 核 成 























载 器 。Loader 会 在 下 一 节 中 实现 。 问 题 来 了 ，loader 在 哪里 ? 如 何 晶 














款 MBR 的 使 命 ， 简 而 言 之 就 是 ， 负 责 从 硬盘 上 把 loader 加 载 到 内 存 ， 并 将 接力 棒 交 给 它 。 


由 于 MBR 是 
区 则 从 1 开始 编号 )， 第 1 扇 区 是 空闲 的 ， 可 以 ) 
区 。MBR 从 外 











让 


loader 放 到 第 2 
了 ， 在 表 1-1“ 实 模式 下 的 内 存 布局 ”! 














占据 了 硬盘 




















2 


的 第 0 扇 





区 (以 逻辑 LBA 方式 ， 



































查看 下 ， 只 要 在 “月 









































0x500 一 0x7BFF 和 0x7E00~9FBFEF 这 两 段 内 存 区 域 都 可 以 。 
是 这 样 的 ， 容 小 弟 分 析 一 下 。 





所 以 ， 我 将 
吧 ， 彼 此 隔 开 远 一 点 心里 才 踏 实 ， 不 差 这 点 空间 了 ， 
用 所 说 的 规划 ， 下 


按照 


















































区 域 的 上 限 ， 





首先 ，loader 中 要 定义 一 些 数据 结构 (如 GDT 全 
构 将 来 的 内 核 还 是 要 
其 次 ， 随 着 1 
难免 会 超过 可 












































说 说 细节 。 





\Do~awm 心 Neooonanw 必 wm 
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Sinclude "boot .incn 
SECTION MBR vstart=0 
mov ax,cs 
mov ds,ax 
mov es,ax 
mov ss,ax 
mov fs,ax 
mov sp, Ox7c00 
mov ax, Oxb800 
mov gs,ax 


; 清 屏 

















一 


局 















































也 址 选 为 0x900。 为 什么 不 是 0x500， 这 个 多 省 




















代码 3-5 


x7c00 











0x06 号 功能 ， 上 卷 如 











;输入 : 
功能 号 = 0x06 





部 行 ， 则 可 清 屏 











一些 空间 


的 任务 ， 这 个 和 














点 心目 








昔 述 符 表 ， 不 懂 没 关系 ， 以 后 会 说 )， 这 些 数 
的 ， 所 以 loader 加 载 到 内 存 后 不 能 被 覆盖 。 
们 不 断 添加 功能 ， 内 核 必然 越 来 越 大 ，] 


给 内 核 。 




















踏实 ， 所 以 把 
上 上 是 找 个 空闲 地 方 就 行 
区 域 ”的 地 方 都 可 以 用 。 


pay > 


旦 序 我 们 称 之 


行 ? 这 就 是 新 

















扇 区 从 0 开始 编号 , 若是 以 物理 CHS 方式 ， 
j， 但 离 得 太 近 总 感觉 不 如 隔 开 
外 2 扇 区 中 把 它 读 出 来 。 读 出 来 放 到 哪里 昵 ? 原由 
日 途 ” 列 中 注 明 “可 用 























Hl 
AN 
QH 





其 所 在 的 内 存 地 址 也 会 向 越 来 越 高 的 地 方 发 展 ， 
咱们 尽量 把 loader 放 在 低 处 ， 多 留 H 
loader 的 加 载 





空间 ? 还 是 预 留 出 一 定 空间 
哈哈 ， 完 全 是 个 人 偏好 ， 大 家 随意 啦 。 








用 代码 3-5 就 是 改头换面 的 新 款 MBR。 代 码 各 


( project/c3/b/boot/mbr.S ) 

































































左 
右 


























直上 角 的 (X,Y) 位 置 
的 (X,Y) 位 置 





增长 到 126 行 ， 下 面 给 大 家 









































































































































26 mov ax, 0600n 

27 mov bxr. O700h 

28 mov cx, 0 ; 左上 角 : (0，0) 

29 mov dx, 184fh ; 右 下 角 : (80,25)， 
30 ; 因为 VGA 文本 模式 中 ， 一 行 只 能 容纳 80 个 字符 ， 共 25 行 
31 ; 下 标 从 0 开始 ， 所 以 0x18=24，0x4f=79 
说 int 10h “Tnt .10k 

33 

34 ; 输出 字符 串 :MBR 

35 mov byte [gs:0x00],"'1" 

36 mov byte [gs:0x01],O0xAd4 

33 

38 mov byte [gs:0x02]，' ' 

39 mov byte [gs:0x03],0xAd4 

40 

41 mov byte [gs:0x04]，'M' 

42 mov byte [gs:0x05],0xAd4 

;A 表示 绿色 背景 闪烁 , 4 表示 前 景色 为 红色 

43 

44 mov byte [gs:0x06],'B"' 

45 mov byte [gs:0x07],0xAd4 

46 

47 mov byte [gs:0x08],'R'"' 

48 mov byte [gs:0x09],0xAd4 

49 

50 mov eax, LOADER START _SECTOR  ”; 起 始 扇 区 lba 地 址 
51 mov bx,LOADER BASE ADDR ; 写 入 的 地 址 

52 mov cx,l1 ; 待 读 入 的 扇 区 数 
53 call rd disk m 16 ; 以 下 读 取 程序 的 起 始 部 分 (一 个 扇 区 ) 
54 

55 jmp LOADER BASE ADDR 

56 

5 EE RE RE ES 











r 
58 ;功能 : 读 取 硬盘 n 个 扇 区 
59 rd disk m 16: 























GU RAR 
61 ; eax=LBA 局 区 与 

62 ; bx= 将 数据 写 入 的 内 存 地 址 

63 ; cx= 读 入 的 扇 区 数 

64 mov esi,eax ;备份 eax 

65 mov di,cx ; 备份 cx 


66 ; 读 写 硬盘 : 
67 ;第 1 步 : 设 读 取 的 扇 区 数 










































































68 mov dx, 0x1Lf2 

69 mov al,cl 

70 out dx,al ; 读 取 的 扇 区 数 
引 

2 mov eax,esi ;恢复 ax 

73 

74 ;第 2 步 :将 LBA 地 址 存 入 0x1f3 ~ 0x1f6 
25 

76 ;LBA 地 址 7~0 位 写 入 端口 0x1f3 

4 mov dx, Oxlf3 

78 out dx,al 

79 

80 ;LBA 地 址 15~ 8 位 写 入 端口 0x1f4 

81 mov cl,8 

82 shr eax,cl 

83 mov dx, Oxlf4 

84 out dx,al 

85 

86 ;LBA 地 址 23 ~16 位 写 入 端口 0x1f5 
87 shr eax,cl 

88 mov dx, 0x1f5 

89 out dx,al 

90 

91 shr eax,cl 

92 and al,OxOf ;lba 第 24~27 位 
93 or al, Oxe0 ; 设置 7~4 位 为 1110, 表示 lba 模式 
94 mov dx, Ox1f6 

95 out dx,al 

96 
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97 ;第 3 步 : 向 0xlf7 端 

















98 mov dx, Oxl1f7 
99 mov al, Ox20 
100 out dx,al 

于 9 和 


102 ;第 4 步 :检测 硬盘 状态 
103 .not ready: 


与 入 读 命令 , 0x20 
















































































104 ; 同一 端口 , 写 时 表示 写 入 命令 字 , 读 时 表示 读 入 硬盘 状态 

105 nop 

106 in al,dx 

107 and al, 0x88 ;第 4 位 为 1 表示 硬盘 控制 器 已 准备 好 数据 传输 
;第 7 位 为 1 表示 硬盘 忙 

108 cmp al,O0x08 

109 jnz .not ready ; 若 未 准备 好 , 继续 等 

.te 

111 ;第 5 步 : 从 0x1f0 端口 读数 据 

业 注 之 mov ax, di 

业 业 学 nov dx 25€ 

114 mul dx 

和 和 mov CX ax 





























一 个 扇 区 有 512 字 节 , 每 次 读 入 一 个 他 











; 共 需 di*512/2 次 ,所 以 di*256 


; di 为 要 读 取 的 扇 区 数 ， 

116 

正二 了 mov dx, 0x1f0 
118 .go0_on read: 

119 in ax,dx 

于 2 人 mov [bx],ax 

121 add bx,2 

于 2 之 loop .go_on read 
123 ret 

寺 必 二 

125 times 510-($-$$) db 0 
126 db Ox55, 0xaa 


程序 最 开始 的 %include "boot.inc"， 这 个 %include 是 nasm 编译 器 中 的 预 处 理 指令 ， 意 思 是 让 编译 器 在 


















































编译 之 前 把 boot.inc 文件 包含 进来 。 任 何 编译 器 都 应 该 有 include 之 类 的 能 够 包含 其 他 文件 的 预 处 理 指令 ， 






































不 要 认为 底层 的 汇编 
便 管理 代码 ， 应 该 加 























人 


2 LOADER BASE ADDR equ 0x900 
3 LOADER START SECTOR equ 0x2 


bootinc 是 我 们 的 配置 文件 ， 我 们 目前 关于 加 载 器 的 配置 信息 就 写 在 里 面 ， 今 后 还 会 在 此 添加 更 多 的 









































配置 信息 。 大 家 看 到 
中 的 语法 是 : 宏 名 equ 值 ， 而 C 语言 中 的 宏 是 由 #define 指令 来 实现 的 。 所 以 LOADER_BASE_ADDR 和 








LOADER START _ SECTOR 是 两 个 宏 名 。 























语言 就 应 该 简陋 到 一 穷 二 白 ， 哈哈 ， 这 和 语言 是 没关系 的 ， 是 编译 器 为 了 开发 人 员 方 
的 。boot.inc 的 内 容 很 简单 ， 目 前 就 两 句 话 ， 文 件 内 容 如 下 。 


loader 和 kernel  ---------- 



















































































的 这 两 名 也 是 预 处 理 命令 , 是 nasm 提供 的 宏 , 和 C 语言 中 的 宏 是 一 回 事 。 只 不 过 nasm 





























LOADER BASE ADDR 定义 了 loader 在 内 存 中 的 位 置 ，MBR 要 把 loader 从 硬盘 读 入 后 放 到 此 处 。 








如 前 所 述 ， 它 的 值 是 0x900， 说 明 将 来 loader 会 在 内 存 地 址 0x900 处 。 
























































LOADER_START_SECTOR 定义 了 loader 在 硬盘 上 的 逻辑 扇 区 地 址 ， 即 LBA 地 址 。 前 面 和 大 家 交待 
过 啦 ， 它 等 于 0x2， 说 明 loader 放 在 了 第 2 块 扇 区 。 
接 下 来 的 第 4 一 48 行 和 上 一 版 本 没 区 别 ， 不 用 多 说 啦 。 

















proc)， 由 于 汇编 语 





























不 能 直接 操作 寄存 器 , 所 以 咱们 这 上 





第 $0 一 52 行为 函数 rd_disk_m_16 传递 参数 。 在 此 说 明 一 下 , 汇编 语言 中 定义 的 函数 (或 者 称 为 例 程 ， 
言 能 够 直接 操作 寄存 器 ， 所 以 其 传递 参数 可 以 用 寄存 器 ， 也 可 以 用 栈 。 由 于 C 语言 中 

















































































































体验 一 回 用 寄存 器 来 传递 参数 的 函数 是 怎样 实现 的 。 另 外 再 说 明 一 下 ， 












































用 寄存 器 传 参数 ， 没 有 固定 的 形式 ， 原 则 上 用 哪个 寄存 器 都 行 ， 只 要 根据 实际 应 用 ， 别 把 还 有 用 的 寄存 器 
值 给 覆盖 就 行 ， 如 果真 需要 用 到 某 个 正在 使 用 中 的 寄存 器 ， 只 要 提前 把 该 寄存 器 备份 好 就 行 了 ， 如 备份 到 
其 他 寄存 器 或 压 入 栈 中 。 此 函数 需要 三 个 参数 ， 我 们 选择 用 eax、bx、cx 寄存 器 来 传递 参数 。 



















































































在 寄存 器 eax : 








的 是 待 读 入 的 








即 Ox2。 
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让 











文 起 始 地 址 ， 赋 值 后 eax 为 定义 的 宏 LOADER_START_ SECTOR， 


寄存 器 cx 是 读 入 的 扇 区 数 ，cx 











来 会 


LOADER BASE ADDR， 
日 们 本 节 的 重点 ， 大 伙 儿 一 定 要 拿 下 。 


第 64 行 的 “mov esi，eax” 是 把 eax : 








一 











响 到 





写 


























值 为 1。 到底 读 入 几 个 
个 简单 的 loader， 其 大 小 肯定 不 会 超过 512 字 节 ， 所 以 此 处 读 入 的 




















又 ， 是 











| 














| 








实际 文件 大 小 来 决定 的 。 由 
区 数 置 为 1 即 可 。 























数据 从 硬盘 读 进来 后 放 在 内 存 中 哪里 呢 ? 这 就 要 用 寄存 器 bx 来 指定 。 在 这 里 ，bx 








民 














eax 的 低 8 位 。 


1 0x900。 函 数 名 rd_disk m 16 的 











es 日 
忆 思 征 








于 将 
寄存 器 值 为 


“在 16 位 模式 下 读 硬盘 ”。 此 函数 是 


























第 65 行 是 备份 读 取 的 扇 


















































































































































































































































的 值 先 备份 到 esi 中 。 因 为 al 在 out 指令 中 会 被 用 到 ， 这 会 影 
区 数 到 di 寄存 器 ，di 寄存 器 是 16 位 的 ， 和 cx 大 小 一 致 。cx 的 值 会 在 读 取 数 







































































据 时 用 到 ， 所 以 在 此 提前 备份 。 

第 67 一 70 行 ， 按 照 咱们 操作 硬盘 的 约定 ， 先 选 定 一 个 通道 ， 再 往 sector count 寄存 器 中 写 扇 区 数 。 往 
端口 中 写 入 数据 用 out 指令 ， 注 意 out 指令 中 dx 寄存 器 是 用 来 存储 端口 号 的 。 其 操作 格式 可 见 3.3.1 节 的 
结尾 部 分 。 先 查看 咱们 bochs 配置 文件 关于 硬盘 的 配置 部 分 ， 如 图 3-33 所 示 。 

人 ## 硬盘 设置 

ata0: enabled=1, ioaddr1-0x1f0, ioaddr2-0x3f0，,irq=14 

atag-master: type-disk, path="hd60M.img", mode=flat, cylinders=121, heads=16, spt=63 
A 图 3-33 ”bochs 中 硬盘 的 配置 

咱们 的 虚拟 硬盘 属于 ata0， 是 Primary 通道 ， 所 以 其 sector count 寄存 器 是 由 0xlf2 端口 来 访问 的 。 顺 
便 再 看 第 二 行 的 ata0-master，path=”hd60M.img”， 这 说 明 hd60M.img 是 主 盘 。 

第 74 一 95 行 是 将 LBA 地 址 写 入 三 个 LBA 寄存 器 和 device 寄存 器 的 低 4 位 ,端口 0x1f3 是 寄存 器 LBA 
low， 端 口 0x1f4 是 寄存 器 LBA mid， 端 口 0x1f5 是 寄存 器 LBA high。shr 指令 是 逻辑 右 移 指令 ,这 里 主要 
通过 此 指令 置换 出 地 址 的 相应 部 分 ， 写 入 相应 的 LBA 寄存 器 。 第 93 行 的 “or al，0xe0”， 用 了 or“ 或 ” 























指令 


令 和 0xe0 做 或 运算 ， 拼 出 device 寄存 器 的 值 。 高 4 位 为 e, 时 
固定 为 1， 第 6 位 为 1 表示 启用 LBA。 大 家 可 以 参考 注释 。 
第 97 一 100 行 便 是 写 入 命令 啦 ， 因 为 我 们 这 里 是 读 操 作 ， 所 以 读 扇 


和 第 


入 command 端 


dx 重新 赋值 。105 行 的 nop 表示 空 操 作 ， 即 什么 也 
的 是 减少 打扰 硬盘 的 工作 。 


盘 的 
第 
着 。 
cmp 


指 





是 个 标号 ， 于 是 跳 


据 读 入 
mul 指令 可 以 做 8 
少 要 有 两 个 数 参 与 才 行 ， 


A 和信 虽 / 
令 会 影 


jnz .not_ready 来 判断 结果 是 否 不 
若 不 等 于 0, 说 明 status 寄存 器 的 第 4 位 为 0, 表 示人 硬盘 正 
111 一 122 行 是 从 硬盘 取 数 据 的 过 程 。 
〈 扇 区 数 *$12 字 节 











7 位 





























Ox1f7 后 ， 便 盘 就 











第 


2 








开始 工作 了 。 





102 一 109 行 检测 status 寄存 器 的 BSY 位 。 























高 4 位 的 二 进 制 表示 为 111 








区 的 命令 是 0x20。 








0， 其 第 5 位 





指令 写 


out 





于 status 寄存 器 依然 是 0x1f7 端 


























x 








国 区 


4 位 和 第 7 位 ， 第 4 位 若 为 1， 表示 数 
4 位 是 否 为 1 就 好 了 ， 用 第 108 行 的 cmp 指令 和 0x08 做 减法 运算 ， 判 断 








只 要 判断 第 

















寸 同一 端 



































指令 并 不 改变 




















A 
二 





























口 





A 


条 























的 数据 总 量 












































成 这 样 
的 值 ， 乘 积 曾 


位 ， 





的 ， 














响 的 标志 位 有 ZF、CF、PF 等 ， 


这 里 的 操作 数 只 是 
于 历史 原因 产生 很 多 奇怪 的 用 六 




















这 里 

















已 经 准备 好 ， 可 以 传输 


操作 数 的 值 ， 只 是 根据 结果 去 设置 标志 位 ， 从 而 


不 做 ， 
在 读 写 两 种 操作 时 有 不 同 的 
和 状态 。 第 106 行 是 将 Status 寄存 器 的 值 读 入 到 al 寄存 器 ， 通 过 第 107 行 的 nd“ 与” 操作， 保留 
7 位 为 1， 表示 硬盘 现在 正 忙 
第 4 位 是 否 为 1。 

















， 所 以 不 需 
只 是 为 了 增加 延迟 ， 相 当 于 sleep 了 一 小 下 ， 








BE 


本 














m 过 


























j 途 ,在 读 硬盘 时 ， 此 端 

















中 的 值 是 硬 











上 上 F 和 记 


了 < 省 第 




















们 根据 标志 位 反 着 去 判 








3 们 
































断 结果 。cmp 





























于 0, 即 若 等 于 0, 则 status 寄存 器 


背 助 ZF 位 来 判断 cmp 的 结果 。 于 是 用 






































) 来 求 


























口 
aN 



































个 乘 数 ， 被 乘 数 隐 含 帮 



































j mul 指令 ， 

































































虽然 我 们 进行 的 是 16 位 的 乘法 , 其 结果 是 32 位 , 但 由 于 我 知道 这 两 个 乘 数 ax 的 值 和 dx 





第 109 行 的 





的 第 4 位 为 1, 这 表示 可 以 读数 据 了 。 
亡 ( 此 时 status 寄存 器 第 7 位 肯定 为 1)。.not ready 
到 硬盘 把 数据 准备 好 才 跳 出 这 个 循环 。 
由 于 data 寄存 器 是 16 位 ， 即 每 次 in 操作 只 读 入 2 字 节 ， 根 
得 执行 in 指令 的 次 数 。 这 里 的 乘法 
立 乘法 和 16 位 乘法 ， 格 式 是 : mul 操作 数 。 操 作 数 可 以 是 寄存 器 或 内 存 。 乘 法 运算 至 
E al 或 ax 寄存 器 中 Cmul 指令 被 设计 
KE， 习惯 就 好 啦 )。 如 果 操 作 数 是 8 位 ， 被 乘 数 就 是 al 寄存 器 
i 是 16 位 ， 位 于 ax 寄存 器 。 如 果 操 作 数 是 16 位 ， 被 乘 数 就 是 ax 寄存 器 的 值 ， 乘 积 就 是 32 
的 高 16 位 在 dx 寄存 器 ， 积 的 低 16 位 在 ax 寄存 器 。 


在 实 模式 下 ， 











的 但 





都 不 大 ， 
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ax 的 实际 的 值 其 实 是 1， 乘 出 


个 结果 的 低 16 位 移入 cx 作为 循环 读 取 的 次 数 。 此 处 月 






































高 位 是 0， 所 以 在 





AAA 


第 115 行 的 “mov cx， 





ax” 我 们 只 将 这 





























日 8 位 乘法 不 合适 ， 因 为 256 超过 了 8 位 寄存 器 表示 


的 范围 。 在 第 118 一 122 行 通 过 循环 来 将 数据 写 入 bx 寄存 器 指向 的 内 存 ， 每 读 入 2 个 字 节 ，bx 所 指 的 地 
































址 便 +2。 值 得 注意 的 是 由 了 

















也 许 有 同学 会 说 ， 把 bx 改 为 ebx 行 吗 ? 也 不 
模式 下 访问 内 存 的 规定 与 缺陷 ， 还 记得 那个 “ 段 基 址 + 段 内 1 





在 实 模式 下 1 












































于 本 mbr 是 用 























扁 移 地 址 为 16 位 ， 所 以 
入 的 地 址 超过 bx 的 范围 时 ， 从 硬盘 上 读 出 的 数据 会 把 0x0000 一 0Oxffff 
超过 64KB， 即 2 的 16 次 方 等 于 65536。 
才 行 。 这 一 点 大 可 以 放心 ， 我 们 最 终 的 loader 不 





















































] bx 只 会 访问 到 0~FFFFh 的 偏 移 。 待 写 
的 覆盖 ， 所 以 此 处 加 载 的 程序 不 能 
来 加 载 loader 的 ， 所 以 loaderbin 要 小 于 64KB 
馈 过 2KB ， 将 来 的 内 核 也 不 会 超过 70KB 。 
行 ， 在 实 模式 下 ，CPU 依然 会 用 16 位 偏 移 地 址 。 这 是 实 
局 移 地 址 ” 吗 ? 段 内 偏 移 地 址 正 因为 是 16 位 ， 


只 能 访问 64KB 的 段 空 间 ， 所 以 才 将 段 基 址 乘 以 16 来 突破 这 64KB， 从 而 实现 访问 低调 1MB 空间 的 。 











第 


第 123 行 返 回 指令 ret， 
代码 相 比 ， 就 是 在 被 调用 时 ， 





























地 址 重新 加 载 到 程序 计数 器 中 ， 如 cs: ip， 这 检 





























I 











CPU 会 将 返 











它 用 来 从 函数 中 返回 。 如 果 我 们 没有 定义 函数 ， 就 不 需要 它 了 。 函 数 和 一 般 
地 址 压 到 栈 中 ， 所 以 在 函数 体 中 ， 要 












































执行 完 第 123 行 后， 程序 便 回 到 了 第 55 行 ， 这 是 个 跳 转 的 指令 。 个 人 觉得 ， 
可 少 的 ，jmp 表示 一 去 不 回头 ，call 表示 去 了 还 回来 。 各 有 各 的 
合适 的 选择 。Jmp 的 操作 数 是 LOADER BASE ADDR， 即 0x900， 这 是 要 跳 到 内 核 加 载 器 的 节奏 。 

















jmp 是 唯 












































程序 便 恢复 到 之 前 的 执行 顺序 了 。 





] ret 指令 将 栈 中 的 返 





be 











jmp 指令 和 call 指令 是 必 不 











j 途 。 这 里 是 MBR 交 出 接力 棒 的 一 刻 ， 采 用 


下 











MBR 到 此 结束 了 使 命 ， 顺 序 完 成 了 第 二 棒 的 拼接 。 复 习 一 下 ， 第 一 棒 是 谁 来 着 ? 是 BIOS 交 给 了 MBR。 





接 下 来 的 工作 是 编译 ， 本 次 的 编译 较 之 前 相 比 ， 多 加 了 一 个 参数 -I。 此 参数 的 意思 还 是 参见 nasm 帮 











助 ，nasm -h 回 车 ， 找 到 -I 的 说 明 。 


“-I<path> 


大 概 意思 是 添加 一 个 包含 文件 的 路 径 ， 其 实 就 是 添加 个 库 目 录 。 为 了 目录 整洁 一 些 ， 我 在 boot 
并 把 boot.inc 放 到 了 include 目录 下 。nasm 要 











了 一 个 子 














也 include， 











nasm -I include/ -o mbrbin mbr.S 回 皇 . 
接 下 来 用 dd 命令 将 mbrbin 写 入 虚拟 人 硬盘: dd if=./mbr.bin of=/ 此 处 
/bochs/hd60M.img bs=512 count=1 


记录 了 1+0 的 读 入 
记录 了 1+0 的 写 出 








512 字 节 (512 B) 己 复 第 


adds a pathname to the include file path” 





















































录 下 建立 














左 


























conv=notrunc 回 车 ， 下 邱 











|，0.0265972 秒 ，19.3 kB/ 秒 









































寺 换 成 你 的 

















i 是 dd 命令 的 三 行 输出 。 


dd 命令 输出 的 第 三 行 显 示 了 实际 写 入 硬盘 的 数据 大 小 ， 是 512 字 市 。 
所 以 目前 不 宜 执行 。 如 果 好 奇 心 实 在 太 大 了 ， 可 以 运行 一 下 试 试 ， 反正 只 是 





现在 还 没有 准备 好 loader， 
虚拟 机 ， 对 物理 机 不 会 有 伤害 
说 了 半天 咱 











































































































， 也 许 会 CPU 使 

















程序 的 运行 不 可 预测 。 难为 大 家 
MBR 大 致 就 说 到 这 ， 大 家 若是 不 理解 ， 









































们 还 没有 loader 呢 ， 若 此 时 执行 此 MBR，CPU 会 直接 跳 到 0x900 的 地 方 ， 非 舌 
直 跟 我 在 这 假想 这 个 虚幻 的 loader, 下 一 节 我 们 要 实现 个 真 的 


















































-I 指定 库 目 录 ， 所 以 在 boot 目录 下 输入 : 


安装 目录 





] 率 过 高 。 记 得 用 Ctrl+C 在 bochs 控制 台中 断 运 行 就 好 了 。 


L 了 不 可 ， 


loader 啦 。 

















也 不 要 糊弄 EE 














为 止 。 代 码 写 得 不 完美 ， 请 大 家 多 多 包涵 。 


3.6.2 ”实现 内 核 加载 器 





这 一 节 的 内 容 并 不 长 ， 因 




















己 ， 还 是 建议 大 家 一 行 一 行 地 看 ， 直 到 和 弄 清楚 











为 在 进入 保护 模式 之 前 ， 我 们 能 做 的 不 多 ，loader 是 要 经 过 实 模式 到 保护 模 





式 的 过 渡 ， 并 最 终 在 保护 模式 下 加 载 内 核 。 本 节 只 实现 一 个 简单 的 l0ader， 本 loader 只 许 




















等 学 习 了 保护 模式 后 ， 我 们 再 来 个 真 格 的 。 











由 于 本 节 较 容易 ， 没 有 





| 1 g%includqe "boot .incn 








新 知识 ， 直 接 上 沫 啦 ， 见 代码 3-6。 


代码 3-6 


2 section loader vstart=LOADER BASE ADDR 
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( project/c3/b/boot/loader.S ) 


E 实 模式 下 工作 ， 








; 输出 背景 色 绿 色 , 前 景色 红色 


3 
4 
5 mov byte [gs:0x00],'2" 
6 
7 
8 




















2 跳动 的 字符 串 "1 MBR" 
































mov byte [gs:0x01],，0xA4 ; 表示 绿色 背景 闪烁 ，4 表示 前 景色 为 红色 








mov byte [gs:0x02]," ' 
9 mov byte [gs:0x03],0xA4 


11 mov byte [gs:0x04],'L" 
12 mov byte [gs:0x05],0xA4 


14 mov byte [gs:0x06],'0O" 
15 mov byte [gs:0x07],0xAd4 


17 mov byte [gs:0x08],'A"' 
18 mov byte [gs:0x09],0xAd4 


20 mov byte [gs:0x0a],'D' 
21 mov byte [gs:0x0b],O0xA4 


23 mov byte [gs:0x0c],'E" 
24 mov byte [gs:0x0d],0xAd4 


26 mov byte [gs:0x0e],'R"' 
27 mov byte [gs:0x0f],0xA4 











29 jmp $ ; 通过 死 循 环 使 程序 悬 停 在 此 
对 这 个 loader 中 的 代码 ， 大 家 是 否 觉得 好 亲切 、 毫 无 压力 呢 ? 这 和 咱们 最 初 的 那个 MBR 好 接近 ， 不 
同 的 是 在 这 个 loader 中 ， 打 印 的 字符 串 是 “2 loader”。 
本 loader 程序 第 2 行 代码 用 到 了 LOADER BASE ADDR， 所 以 在 第 1 行 中 把 boot.inc 包含 进来 了 ， 
其 值 是 0x900。 其 他 代码 就 不 用 讲 啦 。 
编译 nasm -I include/ -o loader.bin loader.S 回 车 
将 生成 的 loaderbin 写 入 硬盘 第 2 个 扇 区 。 第 0 个 扇 区 是 MBR， 第 1 个 记 区 是 空 的 未 使 用 ， 原 因 如 前 
所 述 ， 纯 粹 个 人 喜好 。 
dd f=./loader.bin of=/ 此 处 替换 成 你 的 安装 目录 /bochs 人 hd60M.img bs=512 count=1 seek=2 conv=notrunc 
可 车 ， 下 面 是 dd 命令 的 三 行 输出 。 
记录 了 0+1 的 读 入 
记录 了 0+1 的 写 出 
98 字 节 〈98B) 已 复制 ，8.9113e-05 秒 ，1.1 MB/s 
可 见 ， 我 们 的 loaderbin 只 有 98 字 节 ， 远 远 小 于 64KB 。 
小 激动 的 时 刻 到 了 ， 我 们 该 运行 bochs 来 验证 了 。 如 果 程 序 正 确 的 话 ，MBR 会 跳 转 到 loaderbin 去 运 
行 ， 屏 幕 上 会 显示 “2 loader”。 加 | 
启动 虚拟 机 ， 执 行 。 效 果 如 图 3-34 所 示 。 局， 
这 次 我 只 抓 了 一 张 图 ， 但 我 人 格 保证 这 是 跳 
动 的 字符 ， 大 家 在 自己 的 虚拟 机 上 体验 体验 吧 。 
Loader 刚刚 开 了 个 头 ， 马 上 就 要 和 大 家 暂 别 
了 。 因 为 这 个 loader 目前 还 没有 实际 意义 ， 目 前 
只 是 来 验证 MBR 和 loader 的 接力 是 否 成 功 ， 它 
最 终 的 任务 是 要 加 载 内 核 。 可 是 内 核 运 行 在 32 
位 保护 模式 环境 下 ， 我 们 当前 还 在 实 模式 下 呢 。 
首先 咱们 得 知道 什么 是 保护 模式 ， 其 次 还 得 想 办 
法 进入 到 保护 模式 ， 前 面 的 路 还 很 远 。 0 人 
好 啦 ， 本 章 到 此 告 一 段落 ， 等 我 们 学 习 保护 ee 
模式 后 ， 我 们 还 会 回来 继续 改进 loader。 
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馈 4 


家 

































































草 ”保护 模式 人 门 


在 第 3 章 里 我 们 介绍 实 模式 的 时 候 ， 有 提 过 一 两 句 保护 模式 ， 而 且 我 们 也 说 了 下 实 模式 存在 的 问题 。 





到 了 本 章 ， 问 题 便 在 这 里 结束 了 ， 我 们 看 看 CPU 工程 师 是 怎样 解决 这 些 问 题 的 。 随 后 我 们 要 把 内 核 加 载 








器 载 入 内 存 ， 体 验 一 把 保护 模式 带 来 的 爽快 。 
下 面 欢迎 保护 模式 登场 。 


保护 模式 概述 
































在 保护 模式 下 ， 我 们 将 见 到 很 多 在 实 模 式 下 没有 的 新 概念 ， 很 多 都 是 CPU 硬件 原生 提供 ， 并 且 要 求 的 





























东西 ， 也 就 是 说 按照 CPU 的 设计 ， 必 须 有 这 些 东 西 CPU 才能 运行 。 咱 们 
行 了 ， 不 用 深入 到 硬件 之 中 挖掘 其 工作 原理 ， 咱 们 虽然 是 在 做 底层 开发 ， 












































je 







































































只 要 了 解 它们 是 什么 并 且 怎 么 用 就 








晶 依 然 是 应 用 型 开发 ,我们 能 开发 











出 什么 样 的 软件 ， 取 决 于 CPU 给 咱们 提供 什么 样 的 功能 。 就 像 能 做 出 什么 样 的 动画 ， 主 要 取决 于 动画 设计 








软件 的 功能 是 否 强大 , 动画 设计 师 的 聪明 才智 虽然 是 无 限 的 , 但 其 驾驭 能 力 还 是 很 大 程度 上 受 限于 软件 本 身 























的 功能 。 今 后 大 家 会 见 到 全 局 描述 符 表 、 中 断 描述 符 表 、 各 种 门 结构 等 ， 









































所 以 ， 大 家 不 用 对 这 些 硬件 相关 的 


概念 感到 慌乱 ， 这 些 是 CPU 提供 给 咱们 应 用 的 ， 咱 们 用 好 就 行 了 ， 还 记得 之 前 说 过 的 公设 吗 ? 这 也 是 。 

















保护 模式 强调 的 是 “保护 ” 它 是 在 Intel 80286 CPU 中 首次 出 现 的 ， 这 是 继 8086 之 后 ，Intel 紧 接 着 





be 


出 的 一 款 产品 。 可 见 ， 当 时 的 8086 是 多 么 地 缺乏 安全 感 。 










































































是 笠 福 ? ”哈哈 ， 玩 笑 ， 您 懂 的 。 









































保护 模式 中 的 “保护 ”体现 在 哪里 ? 怎么 就 安全 了 ? 这 个 问题 就 像 垃 福 的 人 问 什 么 是 幸福 一 样 ， 还 记 
得 以 前 在 百度 工作 时 ， 我 的 技术 经 理 李 智 勇 问 我 :“ 你 幸福 吗 ? ”这 时 候 我 的 项 目 经 理 货 亚 涛 抢答 :“ 什 么 




































































“ 想 要 喻 就 有 喻 ”并 不 是 真正 的 幸福 ， 而 是 发 自 内 心地 感恩 、 珍 惜 目前 所 拥有 的 一 切 。 其 实 咱 们 已 经 























被 保护 很 入 了 ， 所 以 咀 们 才 可 以 自由 自在 地 享受 计算 机 带 来 的 便利 。 
4.1.1 为 什么 要 有 保护 模式 
































笠 福 是 比 出 来 的 ， 这 一 点 不 假 。 让 我 们 看 看 CPU 实 模 式 的 不 幸 ， 


























大 家 就 清楚 保护 模式 的 幸福 了 。 


(1) 实 模式 下 操作 系统 和 用 户 程序 属于 同一 特权 级 ， 这 哥 俩 平起平坐 ， 没 有 区 别 对 待 。 
(2) 用 户 程序 所 引用 的 地 址 都 是 指向 真实 的 物理 地 址 ， 也 就 是 说 逻辑 地 址 等 于 物理 地 址 ， 实 实在 在 地 






























































间 哪 打 哪 。 
































(3) 用 户 程序 可 以 自由 修改 段 基 址 ， 可 以 不 亦 乐 乎 地 访问 所 有 内 存 ， 没 人 拦 得 住 。 

以 上 3 个 原因 属于 安全 缺陷 ， 没 有 安全 可 言 的 CPU 注定 是 不 可 依赖 的 ， 这 从 基因 上 决定 了 用 户 程 
序 乃 至 操作 系统 的 数据 都 可 以 被 随意 地 删改 ， 一 旦 出 事 往 往 都 是 灾难 性 的 ， 而 且 不 容易 排查 。 

(4) 访问 超过 64KB 的 内 存 区 域 时 要 切换 段 基 址 ， 转 来 转 去 容易 晕 乎 。 



















































































(5) 一 次 只 能 运行 一 个 程序 ， 无 法 充分 利用 计算 机 资源 。 
































(6) 共 20 条 地 址 线 ， 最 大 可 用 内 存 为 1MB， 这 即使 在 20 年 前 也 不 够 用 。 
第 (4)、(5) 条 是 使 用 方面 的 缺陷 ， 似 乎 当时 (20 年 前 〉 还 可 以 忍受 ， 但 第 (6) 条 简直 就 是 硬 伤 ， 




























































































随 着 计算 机 事业 的 发 展 ， 程 序 对 内 存 的 需求 必然 是 越 来 越 大 ， 如 果 还 是 1MB 内 存 ， 真 地 太 束 手 束 脚 。 
为 了 克服 这 种 低劣 的 内 存 管 理 方式 ， 处 理 器 三 商 开 发 出 保护 模式 。 这 样 ， 物 理 内 存 地址 不 能 直接 被 程 
序 访问 ， 程 序 内 部 的 地 址 〈 虚 拟 地 址 ) 需要 被 转化 为 物理 地 址 后 再 去 访问 ， 程 序 对 此 一 无 所 知 。 顺 便 说 











































































































句 ， 地 址 转换 是 由 处 理 器 和 操作 系统 共同 协作 完成 的 ， 处 




















转换 过 程 中 所 需要 的 页 表 。 





4.1.2” 实 模式 不 是 32 位 CPU， 变 成 了 16 位 





















































里 器 在 硬件 上 提供 地 址 转换 部 件 ， 操 作 系 统 提供 




















32 位 CPU 具有 保护 模式 和 实 模 式 两 种 运行 模式 ， 可 以 阐 






































容 实 模式 下 的 程序 。 兼 容 实 模式 ， 是 指 能 够 

















正确 处 理 好 实 模 式 下 的 程序 ， 并 不 是 说 在 实 模式 下 运行 时 就 完全 变 成 了 纯 16 位 的 CPU。 就 像 中 学 生 做 小 
学 生 的 题 一 样 ， 可 以 用 小 学 生 的 知识 方法 来 做 , 但 并 不 要 求 自己 退化 成 小 学 生 的 知识 水 平 。 如 果 不 强 调 方 



































法 ， 甚 至 可 以 用 中 学 知识 来 解 小 学 生 问 题 。 























我 发 现 部 分 同学 可 能 对 实 模式 的 



































理解 不 太 清 楚 ， 特 专 天 








F 此 节 予 以 溢 清 。 





当年 CPU 在 以 8086 为 首 的 16 位 天 下 时 ， 根 本 没有 实 模式 的 概念 ， 它 们 不 觉得 自己 习惯 己 久 的 模式 











(运行 环境 、 运 行 方式 ) 还 需要 被 命名 。 
怎样 发 展 ，CPU 一 定 要 以 兼容 为 大 ， 它 还 得 兼容 之 前 16 位 的 运行 模式 。 




















到 CPU 发 展 到 了 32 位 ， 新 日 





























概念 ， 和 纯粹 的 16 


实 模式 的 CPU i 


种 运行 模式 ， 为 区 别 这 两 种 模式 ， 根 据 之 前 8086 的 16 位 模式 特性 ， 将 大 
的 优势 ， 称 新 模式 为 保护 模式 。 可 以 这 人 么 到 








CPU， 如 8086 等 无 关 。 








当 它 以 16 位 的 实 模式 运行 时 ， 不 是 说 变 成 纯粹 的 16 
实 模式 下 运行 时 ， 虽 说 相当 于 更 为 强大 的 16 位 的 CPU， 但 其 
在 16 位 的 实 模式 中 , 依然 具备 处 理 32 位 操作 数 的 能 力 。 就 像 一 个 厨师 既 会 做 ; 
他 还 是 可 以 用 中 和 餐 的 厨具 来 京 鱼 西餐 的 ， 因 为 他 两 种 工具 都 会 用 。 厨 师 关注 的 重点 是 只 要 把 西餐 做 出 来 就 行 。 
同样 对 操作 数 来 说 , 纯粹 的 16 位 CPU， 其 操作 数 默 认 也 是 16 
而 是 它 不 能 ， 纯 粹 16 位 的 CPU 不 具备 处 至 

















备 32 位 数据 处 理 能 
们 所 提 到 的 实 模式 ， 





















































ER 











的 运行 模式 和 之 前 不 同 了 ， 但 不 管 























也 就 是 说 ，32 位 的 CPU 具备 两 





























称 为 实 模式 ， 为 突显 现在 新 模式 











运行 环境 16 位 ， 保 护 模 式 的 运行 环境 是 32 位 。 
位 的 CPU 了 〔〈 硬 从 











解 ， 实 模式 是 在 有 32 位 CPU 时 才 提 出 的 ， 它 是 32 位 CPU 的 





F 不 会 变 身 )，32 位 CPU 在 16 位 的 
本质 可 是 32 位 的 ， 这 是 天 生 的 能 力 。 所 以 ， 当 它 


























餐 ， 又 会 做 西餐 当 他 做 西餐 时 ， 












































































































































就 不 知道 自己 的 运行 模式 居然 被 后 者 起 了 个 名 字 。 














所 以 ， 再 次 强调 ， 我 们 说 实 模 式 时 ， 指 的 是 32 位 的 CPU 运行 在 16 位 模式 下 的 状态 ， 不 是 CPU 变 身 





成 纯粹 的 16 位 啦 ， 大 家 不 要 感到 迷惑 。 


您 想 , 开机 时 , 32 位 的 CPU 是 



































和 都会。 所 以 ， 大 家 要 了 解 ， 本 书 我 

















位 。 不 是 说 它 不 想 处 理 32 位 的 操作 数 ， 
32 位 数据 的 能 力 。32 位 的 CPU 本 身 具 备 处 理 32 位 数据 的 能 
力 ， 现 在 我 们 所 说 的 情况 是 当 它 处 于 16 位 的 实 模式 下 时 ， 不 是 完全 退化 到 16 位 CPU 了 ， 它 依然 可 以 具 
， 就 像 刚 才 说 过 厨师 的 例子 一 样 ，CPU 也 是 两 利 
不 是 指 纯粹 的 16 位 的 CPU， 这 种 纯粹 的 16 位 CPU 没有 实 模式 之 说 ， 甚 至 ， 它 一 直 





































































































E 处 于 实 模 式 , 之 后 再 进入 保护 模式 的 。 如 果 它 处 于 实 模 式 时 , 是 和 8086 


等 16 位 的 CPU 完全 一 样 ， 是 个 纯粹 的 16 位 CPU， 那 么 它 该 如 何 进入 到 32 位 的 保护 模式 呢 ? 纯粹 的 16 位 


CPU 可 不 知道 什么 是 保护 模式 啊 。 
行 模式 下 的 状态 ， 其 本 质 上 还 是 32 位 的 CPU， 就 像 大 学 生 


























1 此 可 见 ， 实 模式 是 32 位 CPU 中 的 概念 ， 指 32 位 的 CPU 处 于 16 位 运 














初 见 保护 模式 




















前 面 说 过 啦 ， 





做 小 学 生 的 题 一 样 ， 无 非 是 大 马 拉 小 车 了 。 








1 于 计算 机 发 展 、 进 化 到 了 更 强大 的 阶段 后 ， 为 了 区 别 之 前 的 “远古 时 代 ” 将 之 前 的 











阶段 称 为 实 模式 ， 为 了 突显 现 阶段 的 “安全 ”优势 ， 称 现 阶 段 为 保护 模式 。 划 时 代 往 往 出 现在 巨大 的 变革 





之 后 ， 由 于 变革 带 来 的 巨大 优势 ， 从 此 一 笔 和 从 前 划 开 了 界限 。 

















计算 机 是 如 何 进化 的 ? 保护 模式 的 哪些 方面 
4.2.1 保护 模式 之 寄存 器 扩展 
计算 机 无 论 怎么 发 展 ， 向 下 






























































兼容 ， 指 令 格式 等 都 要 兼容 才 行 ， 否 则 ， 新 产品 衣 定 没 人 愿意 用 。 没 人 ) 





为 最 大 的 失败 。 

































































值得 称 为 “进化 ”? 让 我 们 参观 一 下 保护 模式 的 世界 吧 。 











容 ， 这 都 是 最 起 码 的 要 求 。 原 来 16 位 的 寄存 器 要 兼容 ， 访 存 方式 也 要 
的 产品 ， 无 论 如 何 优秀 ， 都 将 成 
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CPU 发 展 到 32 位 后 ， 地 址 总 线 和 数据 总 线 也 发 展 到 32 位 ， 其 寻 址 空间 更 达到 了 2 的 32 次 方 , 4GB 。 
内 存 寻 址 空间 上 去 了 ， 内 存 寻 址 方式 还 得 兼容 老 办 法 ， 即 “ 段 基 址 ; 段 内 偏 移 地 址 ” 寄存 器 可 以 用 来 指 
定 段 内 偏 移 地 址 ， 还 是 16 位 的 话 ， 如 何 承担 4GB 寻 址 的 重任 ? 所以， 寄存 器 宽度 也 要 跟 上 才 行 。 

也 许 有 同学 会 说 ， 寄 存 器 不 用 变 ， 还 是 16 位 就 行 ， 还 是 按照 老 思路 段 基 址 再 乘 以 一 个 数 吕 。 

这 个 方案 行 倒是 行 ， 但 段 基 址 可 不 能 再 左 移 4 位 啦 ， 得 左 移 16 位 才 行 ， 注 意 是 左 移 16 位 ， 不 是 乘 以 16， 
要 是 变 成 乘法 ， 得 乘 以 65536， 即 2 的 16 次 方 。 这 样 才能 拼凑 出 32 位 地 址 ， 才 能 访问 32 位 的 地 址 空间 。 

不 过 呢 ， 按 理 说 ， 段 基 址 就 应 该 是 内 存 段 的 起 始 地 址 ， 不 应 该 先 经 过 处 理 才 能 用 。 之 前 实 模式 下 的 段 其 址 
之 所 以 先 要 乘 以 16， 那 是 因为 单独 的 一 个 16 位 寄存 器 无 法 访问 全 部 的 1MB 空间 ， 限 于 当时 的 CPU 已 经 成 型 
了 ， 为 了 避免 “推翻 重 做 ”的 重大 损失 ， 修 改 一 下 电路 ， 悄 悄 地 在 背后 给 段 基 址 乘 以 16， 这 起 码 就 能 用 了 ， 
相当 于 给 CPU 打 个 硬件 补丁 ， 就 是 传说 中 的 patch， 但 这 上 毕竟 只 是 一 种 亡羊补牢 的 作法 。 到 了 32 位 的 天 下 ， 
应 该 洗 心 革 面 ， 重 新 做 CPU， 彻底 将 此 整 脚 的 方式 修正 ， 而 不 是 带 着 这 个 补丁 一 痪 一 拐 地 走 下 去 。 

所 以 ， 为 了 让 一 个 寄存 器 就 能 访问 4GB 空间 ， 需 要 寄存 器 宽度 提升 到 32 位 。 

除 段 寄存 器 外 ， 通 用 寄存 器 、 指 令 指针 寄存 器 、 标 志 寄 存 器 都 由 原来 的 16 位 扩展 到 了 32 位 。 为 什么 
段 寄存 器 还 是 16 位 ? 因为 段 寄存 器 用 16 位 就 够 用 了 ， 很 奇怪 是 吗 ， 答 案 以 后 揭晓 。 

寄存 器 要 保持 向 下 兼容 ， 不 能 推翻 之 前 的 方案 从 头 再 来 ， 必 须 在 原 有 的 基础 上 扩展 〈extend)， 各 寄 
存 器 在 原 有 16 位 的 基础 上 ， 再 次 向 高 位 扩展 了 16 位， 成 为 了 32 位 寄存 器 。 经 过 extend 后 的 寄存 器 ， 统 
一 在 名 字 前 加 了 e 表示 扩展 ， 如 图 4-1 所 示 。 










































































































































































































































































































































































EAX 
EBX 
ECX 
EDX 
ESI 
EDI 
EBP 
ESP 
EFLAGS 
EIP 





通用 寄存 器 


段 寄存 器 


32 位 寄存 器 

















4 图 4-1 保护 模式 下 的 被 扩展 成 32 位 寄存 器 

图 4-1 中 ， 左 边 已 经 标注 名 字 的 寄存 器 有 通用 寄存 器 组 ， 名 字 前 统一 加 了 字符 E 表示 扩展 ， 同 样 ， 
EFLAGS 寄存 器 和 EIP 分 别 在 FLAGS 和 1IP 基础 上 扩展 而 成 。 图 下 边 的 6 个 段 寄 存 器 ,依然 是 16 位 。 

寄存 器 中 低 16 位 的 部 分 是 为 了 兼容 实 模式 ， 可 以 单独 使 用 。 高 16 位 没 办 法 单独 使 用 ， 只 能 在 用 32 
位 寄存 器 时 才 有 机 会 用 到 它们 。 

另外 ， 之 前 咱们 所 讲 的 实 模式 是 和 CPU 8086 运行 模式 一 样 的 。 但 在 其 下 一 个 产品 80286 之 后 ， 便 开 
始 有 了 保护 模式 。 保 护 模 式 中 大 大 提高 了 安全 性 ， 其 中 很 大 一 部 分 的 安全 就 体现 在 了 内 存 段 的 描述 方面 。 
偏 移 地 址 还 和 实 模式 下 的 一 样 ,但 段 基 址 可 不 是 简单 的 一 个 地 址 的 事 了 。 为 了 更 加 安全 ， 怎 么 也 得 多 
添加 点 约束 条 件 才 靠 谱 。 这 些 “ 约 束 条 件 ” 便 是 对 内 存 段 的 描述 信息 。 由 于 信息 太 多 了 ， 肯 定 用 一 个 寄存 
器 是 放 不 下 了 ， 所 以 专门 找 了 个 数据 结构 一 一 全 局 描述 符 表 。 既 然 叫 表 ， 就 说 明 里 面 有 表 项 ， 表 中 至 少 有 
一 个 表 项 ， 其 中 每 一 个 表 项 称 为 段 描 述 符 ， 其 大 小 为 64 字 节 ， 用 来 描述 各 个 内 存 段 的 起 始 地 址 、 大 小 、 
权限 等 信息 (由 于 本 节 不 是 在 讨论 全 局 描述 符 表 ， 故 这 部 分 会 在 以 后 章节 中 细 说 )。 该 全 局 描述 符 表 很 大 ， 
所 以 放 在 了 内 存 中 ， 由 GDTR 寄存 器 指向 它 就 行 。 
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这 样 ， 段 寄存 器 中 保存 的 再 也 不 是 段 基 址 了 ， 里 面 保存 的 内 容 叫 “选择 子 ”，selector， 该 选择 子 其 实 
就 是 个 数 ， 用 这 个 数 来 索引 全 局 描述 符 表 中 的 段 描述 符 ， 把 全 局 描述 符 表 当成 数组 ， 选 择 子 就 像 数组 下 标 
一 样 。 

到 了 这 份 上 ， 两 件 事 要 和 大 家 说 清楚 。 

(1) 段 描述 符 是 在 内 存 中 ， 访 问 内 存 对 CPU 来 说 是 比较 慢 的 动作 ， 效 率 不 高 。 

(2) 段 描述 符 的 格式 很 奇怪 ， 一 个 数据 要 分 三 个 地 方 存 ， 所 以 CPU 要 把 这 些 七 零 八 落 的 数 拼合 成 一 
个 完整 数据 也 是 要 花 时 间 的 。 

关于 段 描述 符 格 式 ， 咱 们 也 会 在 讲述 全 局 描述 符 表 时 细 说 ， 现 在 先 收 起 好 奇 的 心 ， 我 要 说 重点 啦 。 

既然 访问 内 存 中 的 段 描述 符 如 此 地 耗费 时 间 , 这 在 CPU 中 是 实在 等 不 了 的 , 所 以 , 重点 来 啦 , 在 80286 














的 保护 模式 中 ， 为 了 提高 获取 段 信息 的 效率 ， 对 段 寄 存 器 率先 应 有 
缓存 ， 这 就 是 段 指 述 符 缓 冲 寄存 器 〈Descriptor Cache Registers ) 。 














将 干 六 万 苦 获取 到 的 内 存 段 信息 ， 整 理 成 “完整 的 、 














通顺 、 不 鉴 

















以 后 每 次 访问 相同 的 段 时 ， 就 直接 读 取 该 段 寄存 器 对 
虽然 段 描述 符 缓冲 寄存 





男 外 ， 
式 下 内 存 访问 时 ， 段 大 寺 





上 











器 是 保护 模式 下 的 产物 ， 
要 左 移 4 位 后 变 成 20 位 地 址 ， 再 与 段 内 偏 移 




















为 目标 地 址 访问 内 存 。 











也 遍 






































既然 已 经 有 了 上段 





述 符 缓 ; 























是 说 ， 每 次 引用 
大 的 。 由 于 切换 段 基 址 并 不 是 特别 频繁 , 所 以 有 必要 将 段 基 
寄存 器 ， 虽 然 它 
CPU 只 是 兼容 实 模式 ， 不 管 CPU 用 什么 资源 ，5 




















0 段 基 











符 缓冲 寄存 器 ， 直 到 该 段 寄 存 器 被 
既然 是 缓存 ,就 一 定 要 有 个 失效 时 间 。 段 描述 符 缓冲 寄存 器 的 失效 时 间 是 多 少 ? 





























址 左 移 4 位 后 的 结果 就 被 放 入 段 描述 
































明了 缓存 技术 ， 将 段 信 息 用 一 个 寄存 器 来 
对 程序 员 而 言 它 是 不 可 见 的 。CPU 每 次 





膨 























个 段 内 地 址 时 




















在 实 模式 下 。 








也 






































ee 
要 能 把 实 模式 下 的 程序 处 到 








本 符 缓冲 寄存 器 | 








重新 赋值 。 









































造 的 ， 但 并 























E 好 就 行 啦 。 














站， 以 后 每 次 引 ) 







































































































































































































































































”的 形式 后 ， 存 入 段 描述 
应 的 段 描述 符 缓 冲 寄存 器 。 
但 它 也 可 以 用 


符 缓冲 寄存 器 ， 


您 想 ， 在 16 位 模 
址 相 加 求 和 ， 最 后 用 所 求 的 和 作 
， 段 基 址 都 要 先 左 移 4 位 ， 这 个 计算 量 还 是 蛮 
址 左 移 4 位 后 的 结果 缓存 起 来 , 避免 重复 计算 。 
\ 是 说 它 不 能 用 在 实 模式 下 ， 
所 以 ， 在 实 模式 




















就 直接 走 段 描 

















其 实 这 个 时 间 还 真 没 



































“ 准 ” 原则 上 ， 只 要 往 段 寄存 器 中 赋值 ，CPU 就 会 更 新 段 描 述 符 缓冲 寄存 器 。 例 如 ， 在 保护 模式 下 加 载 
选择 子 《 即 便 新 选择 子 的 值 和 之 前 段 寄存 器 中 老 的 选择 子 相同 )，CPU 就 会 重新 访问 全 局 描述 符 表 ， 再 将 
获取 的 段 信 息 重新 放 回 段 描述 符 缓冲 寄存 器 , 或 在 实 模式 下 为 段 寄存 器 赋予 段 基 址 , 无 论 是 否 与 之 前 段 基 
址 相同 ， 段 基 址 左 移 4 位 后 的 结果 就 被 送 入 段 描 述 符 缓 冲 寄存 器 
下 面 列 出 三 种 段 描述 符 缓冲 寄存 器 结构 ， 如 图 4-2 所 示 。 
80286 处 理 器 
47~32 | 31 30~29 | 28 | 27~24 23~0 偏 移 量 
Limit | Pp DPL | SS | Type base 字段 
80386/80486 处 理 器 
偏 
95~64 | 63~32 | 31~24 | 23 | 22~21| 20 | 19~16| 15 | 14 |13~0 | 移 
量 
limit base 0 | | DPL | S Type 0 |D/B 0 EE 
奔腾 处 理 器 
95~79 到 | 77~72| 71| 70~69| 68| 67~64| 63~32| 31~0 | 偏 移 量 
0 | D/B| 0 P| DPL | S| type | base | Limit | 字段 
4 图 4-2 ”上段 描 述 符 缓 冲 寄存 器 结构 
80286 虽然 有 了 保护 模式 ， 但 其 依然 是 16 位 的 CPU， 其 通用 寄存 器 还 是 16 位 宽 。 但 其 与 8086 不 同 
的 是 其 地 址 线 由 20 位 变 为 了 24 位 ， 即 寻 址 空间 变 成 了 2 的 24 次 方 ， 等 于 16MB 大 小 。 
之 前 8086 也 是 16 位 CPU, 其 通用 寄存 器 也 是 16 位 , 它 好 不 容易 才能 够 访问 1MB 内 存 空间 。 同样 “ 硬 
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件 配置 ”的 80286 如 何 突破 1MB 空间 ， 能 够 访问 16MB 的 呢 ? 大 家 看 图 4-2 












































器 结构 图 ， 原 因 就 是 段 描述 符 中 ， 段 基 址 
































度 ， 不 用 再 左 移 多 少 位 或 乘 以 某 个 数 了 。 这 就 保证 了 地 址 是 24 





不 要 忘记 啦 ，IA32 体系 架构 的 CPU， 
的 形式 是 无 法 改变 的 。 上 面 说 到 



































访 存 方式 还 是 分 段 策略 ， 即 “ 段 基 址 ， 段 内 相对 偏 移 地 
的 是 24 位 段 基 址 ， 段 内 相对 偏 移 地 址 还 是 必 不 可 少 的 。 用 于 寻 址 的 通用 




















80286 的 段 描 述 符 缓冲 寄存 


























24 位 来 表示 ， 字 段 名 称 为 base 的 部 分 就 是 该 描述 符 所 描述 的 内 
存 段 的 起 始 地 址 ， 占 用 了 0 一 23 位 。 由 于 80286 的 地 址 总 线 是 24 位 ， 所 以 此 处 的 段 基 址 已 经 符合 




















了 地 址 宽 
位 的 ， 所 以 可 以 访问 的 空间 是 16MB 。 












































寄存 器 还 是 16 位 ， 即 单独 的 一 个 寄存 器 还 是 只 能 访问 64KB 的 空间 。 如 果 用 寄存 器 作为 段 内 偏 移 地 址 ， 

















白白 ; 


只 能 


段 的 大 小 还 是 64KB， 这 就 

地 变换 段 基 址 ， 所 以 80286 

代 之 的 是 80386。 
80286 的 问题 是 : 









































9， 食 











费 了 24 位 段 基 址 的 优势 ， 要 是 想 访问 完整 的 16MB 内 存 ， 依 然 要 不 断 
算 个 鸡肋 产品 ， 弃 之 可 性 





之 无 味 ， 所 以 80286 很 快 就 被 淘汰 了 ， 取 而 








单独 的 一 个 寄存 器 无 法 访问 到 全 部 内 存 空间 ， 也 误 











只 能 


访问 到 64KB 大 小 的 段 。 还 有 另外 




















个 问题 ， 每 次 CPU 变革 的 原 














是 若 用 寄存 器 存储 段 内 偏 移 地 址 ， 
因 几 乎 都 是 地 址 总 线 宽度 不 够 导致 





























的 ， 即 内 存 需 求 越 来 越 大 ， 干 脆 ，Intel 直接 将 地 址 线 改 为 32 位 《毕竟 24 位 的 地 址 线 也 显得 不 伦 不 类 )， 
































于 是 ，1985 年 
80286 段 描述 符 组 ; 















































段 基 址 是 32 位 ， 单 独 的 一 个 寄存 器 也 是 32 位 ， 价 






































址 了 。 甚 至 段 基 址 可 以 是 0, 光 
代 ， 大 大 方便 了 开发 人 员 的 工作 。 





























] 段 内 偏 移 就 可 


在 当时 那个 年 代 ，32 位 的 地 址 空间 4GB 可 以 算是 一 步 到 位 啦 。 
推出 了 首 款 32 位 处 理 器 80386， 它 的 地 址 总 线 和 寄存 器 都 是 32 位 的 。 结 果 图 4-2 中 的 
寄存 器 结构 的 base 部 分 ， 这 是 个 32 位 的 段 基 址 ， 位 于 该 结构 的 第 32~63 位 。 这 样 
E 意 一 个 段 都 可 









































以 访问 到 4GB 空间 啦 ， 不 用 再 变化 段 基 





























有 了 保护 模式 ， 之 六 



































3 和 的 实 模式 下 的 程序 还 得 
道 此 虚拟 模式 为 什么 包含 “8086” 了 吧 ， 就 是 
是 只 有 实 模式 ， 最 有 代表 性 的 、 应 用 最 广 的 CPU 是 8086。 





以 指向 4GB 空 


间 任 意 角落 。 这 就 开局 了 “平坦 模式 ”的 时 











兼容 ， 所 以 便 有 了 个 “过 渡 模 式 ” 即 虚拟 8086 模式 。 知 








大 





为 80286 是 





和 款 有 具备 保护 模式 的 CPU， 而 之 前 的 CPU 都 




















综 上 所 述 ，CPU 有 三 种 模式 ， 实 模式 、 虚 拟 8086 模式 、 保 护 模式 。 














4.2.2 保护 模式 之 寻 址 扩展 


进入 保护 模式 后 
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体形 式 如 下 代码 。 


mov 
IOV 
IOV 
mov 
mov 
IOV 
IOV 








[si] 

[di] 

[bx] 

[bx+si] 
[bx+si+0x1234] 
[bx+di] 
[bx+di+0x1234] 


axy 
ax, 
-ba 
ax, 
ax, 
ax, 
Aaxy 


OODP 


以 上 这 七 种 方式 都 是 在 进行 内 存 寻 址 ， 不 甸 


I 道 各 位 是 否 看 











寻 址 方式 也 有 了 很 大 进步 ， 基 址 、 变 址 、 寻 址 变 得 更 加 灵活 了 。 











不 知道 大 家 是 否 已 经 将 实 模式 下 的 基 址 、 变 址 寻 址 方式 起 记 啦 ? 给 大 家 简短 复习 下 , 它 的 形式 如 图 4-3 所 示 。 























中 的 基 址 寻 址 、 变 址 寻 址 、 基 址 变 址 寻 址 ， 这 三 种 形式 中 的 基 
这 4 个 寄存 器 。 其 中 bx 默认 的 段 寄 存 器 是 ds， 它 经 常用 于 访问 数据 段 ，bp 

















是 si、di， 也 就 是 说 ， 只 能 
默认 的 段 寄 存 器 是 ss， 它 经 常 
总 之 实 模式 下 的 寄存 器 有 


EN 








用 于 访问 栈 。 














古 





编译 这 关 都 过 不 了 ， 如 这 人 句 代码 “mov ax，[dx]” nasm 乡 











定 的 使 命 ， 对 于 寻 址 来 说 ， 若 想 用 其 他 的 寄存 器 ， 甫 说 CPU 报 不 报错 ， 就 连 


会 报 : eITOT: 





























出 点 端倪 ， 实 模式 下 对 于 内 存 寻 址 来 说 ， 其 
址 寄存 器 只 能 是 bx、bp， 变 址 寄存 器 只 能 








高 译 器 


invalid effective address。 




















对 于 寻 址 中 的 偏 移 量 ， 只 能 是 1 个 字 以 内 的 立即 数 ， 即 不 能 超过 16 位 。 如 果 超 过 了 16 位 ,编译 器 会 








报 : warning: word data exceeds bounds。 








灵活 是 比 出 来 的 ， 在 保护 模式 下 ， 这 一 切 都 不 同 了 ， 
j 寄 存 器 ， 变 址 寄存 器 也 是 一 样 ， 不 再 只 是 si、di， 而 是 除 esp 之 外 的 所 有 32 位 
用 寄存 器 ， 偶 移 量 由 实 模式 的 16 位 变 成 了 32 位 。 并 且 ， 还 可 以 对 变 址 寄存 器 乘 以 一 个 比例 因子 ， 注 意 











而 是 所 有 32 位 的 通 / 



























































同 夫 





























fF 是 内 存 寻 址 中 ， 基 址 寄存 器 不 再 只 是 bx、 





























比例 因子 ， 只 能 是 1、2、4、8， 如 图 4-4 所 示 。 
基 址 寄存 器 。” 变 址 寄存 器 ”16 位 的 偏 移 量 基 址 寄存 器 。 变 址 寄存 器 ”比例 因子 ”32 位 的 偏 移 量 
BX S| 立 eax esi eax esi 1 
ebx edi ebx edi 
上 ecCXx e| ecx el 即 
| 岂 j+ |+ 慢 | oe 十 Ex| :+| 间 | 
4 图 4-3” 实 模式 的 内 存 寻 址 方式 4 图 4-4 ”保护 模式 的 寻 址 方式 












































体形 式 如 下 代码 。 


1 mov eax, [eaxtedx*8+0x12345678] 
2 mov eax, [eaxtedx*2+0x8] 
3 mov eax, [ecx*4+0x1234] 


虽然 esp 无 法 用 作 变 址 寄存 器 ， 但 其 可 用 于 基 址 寄存 器 。 所 以 ， 如 下 代码 是 正确 的 。 


1 mov eax, [esp] 
2 mov eax, [esp+2 









































保护 模式 下 有 关 寻 址 方式 的 变化 就 讲 这 些 啦 。 
4.2.3 保护 模式 之 运行 模式 反 转 

我 们 当前 使 用 的 CPU 运行 模式 有 实 模式 和 保护 模式 两 种 。 恰 恰 是 要 兼顾 这 两 种 模式 ， 才 让 CPU 设计 
者 变 得 更 加 辛苦 。 

前 面 说 过 啦 ，CPU 处 于 实 模式 下 时 ， 并 不 是 变 成 了 纯粹 的 16 位 CPU， 它 相当 于 8086 的 加 强 版 ， 依 
然 可 以 使 用 32 位 下 的 资源 。 也 就 是 说 ， 资 源 是 共通 的 ， 无 论 哪 种 模式 都 可 以 在 指令 中 使 用 它们 ， 问 题 就 
来 了 ， 同 样 一 名 汇编 代码 ， 它 总 该 隶属 于 某 种 模式 之 下 ， 但 它 到 底 是 属于 实 模式 ， 还 是 属于 保护 模式 呢 ? 
也 许 有 同学 说 啦 ,“ 管 它 干 吗 呢 ， 只 要 编译 器 帮 有 我 把 语句 编译 成 合适 的 机 器 码 就 行 啦 ， 这 一 切 不 用 我 操心 ， 
这 是 编译 器 的 事 ” 其 实 ， 编 译 器 没有 那么 强大 ， 很 多 时 候 需要 人 为 告诉 编译 器 一 些 信息 ， 编 译 器 才 知 道 
如 何 生成 机 器 码 。 另 外 , 用 汇编 语言 编程 ,其 最 大 的 魅力 就 是 实时 了 解 机 器 的 状况 , 实时 清楚 你 在 做 什么 ， 
实时 掌控 机 器 的 一 举 一 动 ， 实 时 将 自己 置身 于 CPU 的 角色 。 难 道 您 不 想 拥 有 这 种 掌控 力 吗 ? 

容 给 CPU 的 发 展 带 来 了 不 少 困难 ， 想 想 CPU 真是 不 容易 啊 ， 一 方面 要 发 展 自身 功能 ， 另 一 方面 还 
要 使 过 去 的 一 些 “古董 设 计 ” 继 续 可 用 ,简直 就 是 背 着 个 大 包 裕 扑 山 。 前 面 和 大 家 说 过 啦 ， 保 护 模式 下 的 
寻 址 方式 有 很 大 进步 ， 通 用 寄存 器 几乎 都 可 以 用 于 寻 址 ， 这 些 寻 址 上 的 差异 如 何 让 CPU 辨认 呢 ? 底层 的 
路 是 很 死板 的 ， 一 种 功能 就 对 应 一 种 电路 ， 因 此 物理 上 的 实现 往往 是 有 限 的 ,在 人 看 来 逻辑 上 相同 的 东 
西 ， 在 底层 硬件 中 却 是 完全 不 同 的 电路 设计 。 

为 了 兼容 ， 当 初 为 实 模式 设计 的 指令 格式 ， 如 今 还 得 沿用 这 一 套 ， 如 何 让 两 种 运行 模式 套用 同样 的 指 
令 格 式 呢 ? 哈哈 ， 虽 然 是 个 问号 ， 但 也 没 想 让 大 家 帮 着 思考 ， 大 家 不 用 操心 了 ， 人 家 早已 经 解决 啦 。 
还 记得 指令 格式 吗 ? 前 面 有 介绍 过 ， 其 格式 是 : 

前 缀 操作 码 寻 址 方式 、 操 作 数 类 型 立即 数 偏 移 量 


在 这 个 格式 中 第 3 个 字段 用 于 指定 寻 址 方式 和 操作 数 类 型 ,在 指令 格式 不 变 的 情况 下 , 为 了 兼容 保护 
模式 ,一 种 方案 是 重新 定义 各 寻 址 方式 、 寄 存 器 的 编码 。 由 于 保护 模式 中 的 寻 址 方式 和 操作 数 类 型 同 实 模 
式 下 完全 不 同 ， 故 相应 的 编码 也 不 同 。 比 如 在 实 模式 下 ， 用 二 进 制 010 表示 dx 寄存 器 ， 在 保护 模式 下 的 
010 就 表示 edx 寄存 器 (根据 编码 确定 指令 、 寻 址 方式 、 寄 存 器 ， 这 是 译 码 器 的 工作 )。 操 作 dx 寄存 器 和 
edx 寄存 器 ， 对 于 硬件 来 说 是 完全 不 同 的 ， 所 以 编译 器 必须 明确 操作 对 象 是 哪个 。 

在 实 模式 下 ,指令 和 操作 数 都 是 16 位 的 ， 但 我 们 也 说 过 啦 ， 它 可 以 使 用 32 位 的 资源 。 同 样 在 保护 模 
式 下 ， 指 令 和 操作 数 都 是 32 位 的 ， 它 也 可 以 使 用 16 位 的 资源 。 也 就 是 说 ， 在 某 个 模式 下 ， 可 以 使 用 另 一 
模式 下 的 资源 。 

兼容 性 带 来 了 好 处 ， 也 带 来 了 坏处 ， 好 处 是 CPU 很 强大 ， 可 以 同时 支持 16 位 指令 和 32 位 指令 ， 运 行 新 
老 程序 畅通 无 阻 。 但 坏处 就 是 CPU 也 不 知道 您 想 生 成 16 位 ， 还 是 32 位 机 器 码 ， 这 就 是 前 面 说 过 的 ， 需 要 明 
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确 告诉 编译 器 一 些 信息 。 为 此 ， 光 














有 译 器 提供 了 伪 指 令 bits， 





























位 的 ， 因 为 我 知道 下 面 的 代码 的 运行 环 


























要 将 代码 编译 成 16 位 的 指令 。 在 实 模式 下 + 




















伍 备 好 了 保护 模式 所 需要 上 








是 32 位 指令 。 也 就 是 ， 同 一 段 程序 
bits 的 指令 格式 是 [bits 16] 或 [bits 32]。 








掉 的 代码 





[bits 16] 是 告诉 编译 器 ， 下 








[bits 32] 是 告诉 编译 器 ， 下 





再 的 代码 








“下 面 的 代码 ”是 哪里 昵 ? bits 指令 的 范围 是 从 当前 bits 标签 直到 下 一 个 bits 标签 的 范围 , 这 个 范围 














的 代码 将 被 编译 成 相应 字 长 的 机 











默认 是 [bits 16]。 








器 码 。bits 外 


要 经 历 两 种 模式 ， 所 以 


帮 我 纺 


























帮 我 纺 
































哆 哑 一 下 , 使 





j bits 指令 的 情况 是 : 您 ; 




















境 是 xx 模式 。 比 如 在 实 模式 下 ，i 








有 译 器 传达 :我 下 面 的 指令 都 要 编译 成 xx 

















了 的 指令 都 是 16 位 的 ， 所 以 编译 器 

















的 环境 








后 ， 进 入 保护 模式 后 的 代码 就 应 该 





























译 成 16 位 的 机 器 码 。 
译 成 32 位 的 机 器 码 。 











司 一 段 程 / J 中 有 








珊 种 模式 的 机 器 码 。 


















































看 的 中 括号 是 可 以 省 略 的 ， 另 外 , 在 未 使 用 bits 指令 的 地 方 ， 














楚 所 写 的 代码 是 运行 在 哪 种 模式 下 ， 您 需 











编译 成 哪 种 模式 的 机 器 码 。 也 许 有 











司 学 有 疑惑 ， 折 











于 保 护 模 式 的 步骤 是 清晰 且 有 限 的 ， 看 上 去 ， 编 译 器 根据 代码 














要 向 编译 器 明确 指出 将 其 



































似乎 能 猜测 出 是 否 是 打开 了 保护 模式 ， 当 前 代码 所 处 在 的 模式 也 能 猜 出 ， 应 该 能 自动 识别 编译 成 哪 类 机 器 码 。 











可 是 ,虽然 人 能 做 到 这 一 点 














， 但 编 











不 统一 。 比 如 进入 保护 模式 需要 三 个 步骤 。 





(1) 打开 A20。 
(2) 加 载 gdt。 
(3) 将 cr0 的 pe 位 置 1。 








这 三 个 步骤 可 以 不 顺序 ， 也 可 以 不 连续 ， 并 且 
不 是 固定 的 ， 如 果 这 些 组 合 是 有 穷 的 还 好 ,但 面 对 





























道 何 时 进入 了 保护 模式 。 但 这 样 也 不 现实 ， 依 然 不 能 保 i 
于 兼容 的 原因 ， 并 不 是 说 在 茶 模 式 下 一 定 都 是 茶 模 式 的 指令 。 因 为 前 面 说 过 啦 ，16 位 环境 下 可 以 用 32 位 环 





























境 的 资源 ， 而 32 位 下 也 可 以 用 




















16 位 的 资源 ( 乡 
器 不 容易 猜 出 代码 所 在 的 运行 模式 ， 用 bits 指令 明确 指 日 
说 得 再 形象 也 不 如 举例 子 ， 见 代码 lbits.S。 


代码 1bits.S 


每 个 步骤 又 是 
[如 此 无 穷 多 的 组 合 ， 
俩 。 除 非 编 译 器 提供 一 个 打开 保护 模式 的 方法 ， 并 有 办 法 强 和 
























































译 器 却 不 容易 做 到 。 进 入 保护 模式 的 代码 却 是 千奇百怪 的 ， 形 式 可 





多 个 小 步骤 完成 的 ， 每 个 小 步 又 的 形式 又 
最 聪明 的 编译 器 的 设计 者 也 会 束 手 天 
开发 人 员 合 
































j， 这 样 一 来 ， 编 译 器 器 自然 就 知 












































FE 开发 人 员 不 上 





己 写 进入 保护 模式 的 代码 。 另 外 ,由 






































时 | 











用 译 后 的 二 进 制 文件 中 








可 以 有 两 种 不 同 的 机 器 码 )。 所 以 编译 
运行 模式 ， 这 是 最 简单 省 事 的 办 法 。 






















































































国志 长 = 和 
2 mov ax, Ox1234 
3 mov dx, 0x1234 
4 
5 [bits 32 
6 mov eax, Ox1234 
7 mov edx, Ox1234 
代码 很 简单 ， 解 释 无 需 多 言 ， 表 4-1 是 此 代码 编译 后 的 指令 ， 请 大 家 过 日 
表 4-1 bits 使 用 
行 号 指 机 器 码 
1 [bits 16] 伪 指 令 ， 无 机 器 码 
2 mov ax, 0X1234 B83412 
3 mov dx, 0x1234 BA3412 
4 [bits 32] 伪 指 令 ， 无 机 器 码 
5 mov eax, Ox1234 B834120000 
6 mov edx, Ox1234 BA34120000 








大 家 看 表 4-1 第 2 行 ,， 在 16 位 模式 ，mov ax, 0x1234 的 机 器 码 B83412， 第 5 行 32 位 模式 下 mov eax， 














0Ox1234， 
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其 机 器 码 是 B834120000,， 这 两 者 都 是 同样 的 操作 码 B8。 不 同 的 模式 下 都 是 同样 的 操作 码 ， 可 见 ， 








寻 址 方式 和 操作 数 类 型 相同 

由 于 在 两 种 模式 下 ， 同 相 
执行 的 是 哪 种 模式 下 的 指令 ， 到底 指 令 
这 么 做 应 该 是 极 好 的 ， 
其 实 上 段 文字 的 铺垫 ， 


标识 。 


























， 但 意义 是 不 同 的 ， 在 这 里 
















































































的 操作 码 和 操作 数 乡 
的 多 
所 以 在 指令 的 最 前 面 
是 我 要 在 这 里 介绍 反 转 前 级 。 

















在 指令 格式 中 ， 有 个 “前 




















级 ”字段 ， 里 

















跨越 前 级 “上 段 寄 存 器 : ”， 还 有 


























我 们 已 经 知道 了 ,在 不 同 的 
保护 模式 下 的 操作 数 大 小 是 32 














式 和 





果 护 模式 在 寻 址 方面 




















要 说 段 跨越 前 级 这 个 好 慌 ， 操 作 数 反 转 前 组 这 个 
间 可 以 互相 使 用 对 方 环境 下 的 资源 。 比 如 ，16 位 实 模式 下 可 以 








个 是 ax 寄存 器 ， 男 一 个 是 eax 寄存 器 。 
码 ， 却 有 着 不 同 的 解释 ， 为 了 让 CPU 能 够 在 第 一 时 间 了 解 要 














人 码 对 应 哪些 寄存 器 ,在 机 器 码 的 最 前 本 
有 个 前 绥 字 段 ， 用 来 率 4 
反 转 前 











| 就 应 该 存放 一 些 用 于 识别 的 











告诉 CPU 应 用 此 指令 的 模式 。 


级 是 干吗 的 呢 ? 


外 存放 的 是 指令 选项 之 类 的 东 东 ， 比 如 指令 重复 前 缀 rep、 
们 马上 要 介绍 的 操作 数 反 转 前 
模式 下 ， 操 作 数 和 寻 址 方式 都 各 不 相同 。 实 模式 下 的 操作 数 大 小 是 16 位 ， 
立 。 而 我 们 在 介绍 保护 模式 的 寻 址 模式 时 ， 通 过 对 比 ， 大 家 也 看 出 了 实 模 


[的 差别 。 


0x66 和 寻 址 





段 
方式 反 转 前 缀 0x67。 








是 干吗 的 呢 ? 我 们 之 前 其 实说 过 N 多 次 了 ， 模 式 之 























] 32 位 保护 模式 下 的 寄存 器 。 但 这 种 福利 











的 得 来 却 是 稍 费 功夫 的 ， 如 果 要 用 另 一 模式 下 的 操作 数 大 小 ， 需 要 在 指令 前 添加 指令 前 缀 0x66， 将 当前 


模式 








一 < 











区 时 改变 成 男 一 模式 。 这 就 是 反 转 的 意义 ， 不 管 是 当前 模式 是 什么 ， 
比如 ， 在 指令 中 添加 了 0x66 反 转 前 级 之 后 : 
段 设 当 前 运行 模式 是 16 位 实 模式 ， 操 作 数 大 小 将 变 为 32 位 。 
段 设 当 前 运行 模式 是 32 位 保护 模式 ， 操 作 数 大 小 将 变 为 16 位 。 
主意 啦 ， 这 个 转换 只 是 临时 的 ， 只 在 当前 指令 有 效 。 
还 是 实际 例子 更 能 说 明 问 题 ， 见 代码 2bits.S。 





| 








总 是 转变 成 相反 的 运行 模式 。 






















































































代码 2bits.S 
1 [bits 16] 
2 mov ax, Ox1234 
3 mov eax, 0x1234 
4 
5 [BitS "32 
6 mov ax, Ox1234 
7 mov eax, 0x1234 
表 4-2 是 上 述 代码 编译 后 的 机 器 指令 。 
表 4-2 0x66 反 转 
行 号 指 令 机 器 码 
1 [bits 16] 伪 指 令 ， 无 机 器 码 
2 mov ax, Ox1234 B83412 
3 mov eax, Ox1234 66B834120000 
4 [bits 32] 伪 指 令 ， 无 机 器 码 
5 mov ax, OxX1234 66B83412 
6 mov eax, Ox1234 B834120000 
第 1 行 表示 让 编译 器 将 第 2、3 行 编译 成 16 位 机 器 码 。 
第 2 行 就 是 16 位 模式 的 指令 ， 所 以 直接 编译 ， 机 器 码 为 B83412。 
第 3 行 用 到 了 32 位 寄存 器 eax， 属 于 32 位 操作 数 ， 由 于 当前 模式 是 16 位 ， 要 用 0x66 将 操作 数 大 小 转 为 


32 位 ， 


故 机 器 码 是 66B834120000。 其 中 34120000 是 另 一 ] 























A 


条 


分 别 是 操作 码 和 操作 数 。 


条 





5 行 是 16 位 指令 ， 
32 位 操作 数 反 转 成 16 位 大 小 的 操作 数 ， 故 机 器 码 是 66B83412。 最 前 


1 











第 4 行 表示 让 编译 器 将 第 4、5 行 编译 成 32 位 机 器 码 。 





























日 当前 已 在 32 位 模式 下 ， 所 以 要 

































































操作 数 ，B8 是 操作 码 ，0x66 便 是 操作 数 反 转 前 级 。 





| 操作 数 反 转 前 级 0x66 来 临时 将 当前 模式 的 
面 的 0x66 正 是 反 转 前 绥 ， 


b8、3412 


6 行 就 是 32 位 指令 ， 所 以 符合 当前 模式 。B8 是 操作 码 ，34120000 是 操作 数 。 


143 


以 上 是 反 转 操作 数 大 小 前 











又 
组 


不 同 模式 之 间 不 仅 可 以 使 用 对 方 模式 下 的 











0x66 的 应 用 。 下 面 再 介 








绍 个 前 





又 
绥 : 


寻 址 方式 反 转 前 级 0x67 。 
操作 数 ， 还 可 以 使 用 对 方 模式 下 的 寻 址 方式 。 猛 一 看 这 人 句 话 ,似乎 
























































































































































不 容易 接受 ， 其 实感 性 一 点 想 想 ，32 位 CPU 两 种 模式 都 兼容 ， 无 论 它 处 于 哪个 模式 ， 都 是 它 自 己 。 就 像 孙悟空 
变 成 马 时 ， 难 道 它 最 爱 吃 的 就 是 草料 吗 ? 当然 不 ， 即 使 变 成 了 马 ， 它 本 质 还 是 猴子 ， 它 的 最 爱 还 是 桃子 。 
上 代码 ， 实 践 出 真知 ， 见 文件 0x67.S。 
文件 0x67.S 
1 [bits 16] 
2 mov word [bx], Ox1234 
3 mov word [eax], 0x1234 
4 mov dword [eax], 0xl1234 
5-_[BitSs,32] 
6 mov dword [eax], 0x1234 
7 mov word [eax], 0x1234 
8 mov dword [bx], 0x1234 
以 上 并 不 是 每 句 代 码 都 会 用 到 反 转 寻 址 方式 前 缀 0x67。 只 有 3、4、8 这 三 行 牵扯 到 寻 址 方式 反 转 。 
其 余 的 “正常 ”代码 都 是 为 了 “ 反 转 寻 址 ”对 比 。 
表 4-3 是 上 述 代码 编译 后 的 机 器 指令 
表 4-3 寻 址 方式 反 转 前 缀 0x67 
行 号 指 令 机 器 码 
1 [bits 16] 伪 指 令 ， 无 机 器 码 
2 mov word [bx], Ox1234 C7073412 
3 mov word [eax], 0x1234 67C7003412 
4 mov dword [eax], Ox1234 6667C70034120000 
5 [bits 32] 伪 指 令 ， 无 机 器 码 
6 mov dword [eax], Ox1234 C70034120000 
7 mov word [eax], 0x1234 66C7003412 
8 mov dword [bx], Ox1234 67C70734120000 
以 上 我 们 是 用 的 内 存 寻 址 中 的 基 址 寻 址 ， 注 意 啦 ， 为 什么 实例 中 用 了 eax 和 bx 两 种 寄存 器 ， 而 不 是 

















ebx 和 bx? 因为 实 模式 下 的 基 址 只 
见 表 4-3， 第 1 行 的 [bits 16] 指 示 编 译 器 : 把 下 
2 行 的 指令 ， 从 操作 数 和 寻 址 方式 来 看 ， 本 身 符 合 16 位 模式 ， 无 需 添加 人 外 
属于 实 模式 ， 所 以 在 机 器 码 前 添加 了 寻 址 方式 反 转 前 缀 0x67。 灸 
表示 在 eax 所 表示 的 内 存 处 ， 





全 


条 





eaX 





4 行 同 相 
4 字 节 大 小 的 数据 

















有 用 寄存 器 bx、bp。 









































寄存 器 作为 基 址 寻 址 ，eax 寄存 器 不 
是 用 eax 寄存 器 作为 基 址 寻 址 ， 
。 操 作 数 大 小 也 由 默认 的 2 























并 且 / 














码 是 6667C70034120000， 前 面 














往往 


2 字 节 是 前 缀 0x66、0x67。 








5 行 指示 编译 器 ， 将 下 





条 

















再 指令 编译 成 32 位 。 








往往 


生 
何 反 转 前 级 。 


第 7 行 / 





























又 
级 











j 操 作 数 大 小 反 转 前 


三 和 


条 











是 32 位 保护 模式 ， 所 以 在 机 器 码 中 





到 了 伪 指 令 word， 这 是 一 种 数据 类 型 
处 连续 写 入 2 字 节 。 这 就 改变 了 操作 数 的 大 小 ， 
要 | 0x66， 见 机 器 码 


6 行 的 指令 ， 无 论 从 操作 数 ， 还 是 寻 址 方式 来 看 ， 








当前 已 经 是 


j 到 了 伪 指 令 
字 节 变 成 了 4 字 节 ， 就 会 添加 0x66 的 前 绥 。 


它 都 是 


32 位 机 器 码 了 ， 


dword， 


而 2、3、4 行 的 代码 编译 成 16 位 代码 。 











E 何 反 转 前 级 。 











第 3 行 把 
第 











纯粹 





Par ee mE 


第 1 字 节 。 

















要 用 寻 址 方式 反 转 前 



































关于 CPU 在 两 个 模式 下 的 运行 原 到 
而 且 ， 





又 少 ， 


关于 模式 的 部 分 少 之 





， 本 节 只 是 ! 
前 组 ， 这 又 是 乡 

















添加 指令 











在 。 
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更 为 要 命 的 是 兄弟 我 水 平实 在 有 限 ， 只 有 i 























8 行 的 指令 使 用 的 寻 址 方式 是 实 模式 下 的 基 址 寻 址 ， 寄 存 器 是 bx (只 外 
级 0x67。 
哺 凤 点 水 般 地 讲述 了 一 些 浅 表 知识 。 
译 上 器 的 工作 ， 所 以 大 家 有 
出 这 么 多 啦 ， 所 以 本 书 关 于 运行 模式 的 介 








所 以 


的 32 位 指令 ， 所 以 机 器 码 不 包含 





， 表 示 2 字 节 。 在 本 行 代码 中 表示 从 eax 指定 的 内 存 
默认 操作 数 也 是 32 位 ， 所 以 


连续 写 
其 机 器 


a 








EE 是 bx 或 bp)， 但 | 
































于 咱们 项 


























可 能 都 不 会 察觉 到 它 前 
绍 就 到 这 里 。 











总 结 一 下 ，bits 伪 指 令 用 于 指定 运行 模式 ， 操 作 数 大 小 反 转 前 缀 0x66 和 寻 址 方式 反 转 前 缀 0x67， 用 
于 临时 将 当前 运行 模式 下 的 操作 数 大 小 和 寻 址 方式 转变 成 另外 一 种 模式 下 的 操作 数 大 小 及 寻 址 方式 。 
以 上 两 点 便 是 本 节 的 精华 所 在 。 


4.2.4 保护 模式 之 指令 扩展 
在 16 位 的 实 模式 下 ，CPU 的 操作 数 是 16 位 。 在 32 位 的 保护 模式 下 ， 操 作 数 扩展 到 了 32 位 ， 于 是 


涉及 到 操作 数 变化 的 指令 也 要 跟着 扩展 ， 既 要 兼容 16 的 操作 数 ， 也 要 支持 32 位 的 操作 数 ， 想 想 处 理 器 的 
设计 者 真 不 容易 啊 。 




























































































比如 add， 大 家 知道 于 加 法 运算 的 指令 ， 实 模式 下 时 ， 它 的 操作 数 可 以 为 8 位 、16 位 ， 在 如 今 
的 保护 模式 中 ， ee 16 位 ， 还 得 支持 32 位 的 操作 数 ， 如 : 

1 add al, cl ;支持 8 位 操作 数 

2 add ax, cx ;支持 16 位 操作 数 
3 add eax, ecx ;支持 32 位 操作 数 





对 于 减法 指令 sub 也 是 一 样 。 








1 sub al,cl ;支持 8 位 操作 数 

2 sub axy cx ;支持 16 位 操作 数 
3 sub eax,ecx ;支持 32 位 操作 数 

同一 指令 在 不 同 的 模式 中 要 做 出 不 同 的 行为 ， 可 见 CPU 精密 的 设计 。 

以 上 说 的 是 双 操 作 数 的 指令 ， 还 有 一 些 单 操作 数 指令 ， 如 inc、dec 等 ， 也 是 同时 支持 8 位 、16 位 、 
32 位 寄存 器 
并 不 是 所 有 的 指令 都 要 支持 以 上 3 种 宽度 的 操作 数 ， 比 如 对 于 loop 指令 ， 实 模式 下 要 用 cx 寄存 器 来 
存储 循环 次 数 ， 在 保护 模式 下 ， 要 用 ecx。 

以 上 这 些 还 好 ， 至 少 操作 数 还 只 是 在 一 个 寄存 器 中 。 下 面 要 说 的 这 两 个 指令 ,为 了 支持 32 位 操作 数 ， 
不 得 不 增加 了 额外 的 寄存 器 。 

mul 指令 是 无 符号 数 相 乘 指令 ， 指 令 格式 是 mul 寄存 器 /内 存 。 
其 中 “寄存 器 /内 存 ” 是 乘 数 。 

如 果 乘 数 是 8 位 ， 则 把 寄存 器 al 当 作 另 一 个 乘 数 ， 结 果 便 是 16 位 ， 存 入 寄存 器 ax。 

如 果 乘 数 是 16 位 ， 则 把 寄存 器 ax 当 作 另 一 个 乘 数 ， 结 果 便 是 32 位 ， 存 入 寄存 器 eax。 

如 果 乘 数 是 32 位 ， 则 把 寄存 器 eax 当 作 另 一 个 乘 数 ， 结 果 便 是 64 位 ， 存 入 edx: eax， 其 中 edx 是 积 
的 高 32 位 ，eax 是 积 的 低 32 位 。 
有 符号 数 相 乘 指令 imul 也 是 一 样 ， 不 再 说 明 。 

对 于 无 符号 数 除法 指令 div， 其 格式 是 div 寄存 器 /内 存 ， 其 中 的 “寄存 器 /内 存 ” 是 除法 计算 中 的 除数 。 

如 果 除 数 是 8 位 ， 被 除数 就 是 16 位 ， 位 于 寄存 器 ax。 所 得 的 结果 ， 商 在 寄存 器 al， 余数 在 寄存 器 ah。 

如 果 除 数 是 16 位 ， 被 除数 就 是 32 位 ， 被 除数 的 高 16 位 则 位 于 寄存 器 dx， 被 除数 的 低 16 位 则 位 于 
寄存 器 ax。 所 得 的 结果 ， 商 在 寄存 器 ax， 余 数 在 寄存 器 dx。 

如 果 除 数 是 32 位 ， 被 除数 就 是 64 位 ， 被 除数 的 高 32 位 则 位 于 寄存 器 edx， 被 除数 的 低 32 位 则 位 于 
寄存 器 eax， 所 得 的 结果 ， 商 在 寄存 器 eax， 余 数 在 寄存 器 edx。 

本 章 前 面部 分 已 经 说 过 了 ， 由 于 已 经 是 32 位 的 CPU 了 ， 它 同时 具备 处 理 16 位 和 32 位 数据 的 能 
当 它 以 16 位 的 模式 运行 时 ， 不 是 说 变 成 纯粹 的 16 位 的 CPU 了 (纯粹 16 位 CPU 是 无 法 进入 到 32 位 保护 
模式 的 ), 32 位 CPU 在 16 位 的 实 模式 下 运行 时 , 可 以 理解 为 16 位 CPU 的 加 强 版 。 但 其 本 身 是 32 位 CPU， 
它 天 生 就 具备 处 理 32 位 数据 的 能 力 。 我 再 次 重申 此 内 容 的 目的 是 想 告 诉 大 家 , 在 16 位 的 实 模式 下 ，CPU 
照样 可 以 处 理 32 位 的 数据 ， 大 家 不 要 感到 奇怪 。 
这 方面 最 典型 的 例子 就 是 push， 这 是 往 栈 中 添加 数据 的 指令 。 同 样 的 指令 , 在 实 模式 和 保护 模式 下 都 
可 以 同时 处 理 16 位 和 32 位 的 数据 ， 让 咱们 看 看 push 是 怎样 应 对 这 两 种 局 面 的 。 
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对 于 push 指令 ， 需 要 根据 其 操作 数 的 类 型 ， 分 别 讨 论 ， 操 作 数 类 型 如 下 。 
(1) 立即 数 。 

(2) 寄存 器 。 

(3) 内 存 。 

下 面 咱们 看 看 各 方面 的 内 容 。 

先 看 第 1 种 情况 ， 对 于 立即 数 来 说 ， 可 以 分 别 压 入 8 位 、16 位 、32 位 数据 。 
指令 格式 是 : 

push 8 位 立即 数 





push 16 位 立即 数 























push 32 位 立即 数 
虽说 可 以 压 入 8 位 立即 数 ， 但 实际 上 ， 对 于 CPU 来 说 ， 出 卫 

















六 对齐 的 考虑 ， 操 作 数 要 么 是 16 位 ， 要 么 








是 32 位 , 所 以 8 位 立即 数 会 被 扩展 成 各 模式 下 的 默认 操作 数 宽 度 ,， 即 实 模式 下 8 位 立即 数 扩展 成 为 16 位 


















































































































































后 再 入 栈 ， 保 护 模 式 下 扩展 成 为 32 位 后 再 入 栈 。 
在 实 模式 环境 下 : 
当 压 入 8 位 立即 数 时 , 由 于 实 模式 下 默认 操作 数 是 16 位 ,CPU 会 将 其 扩展 为 16 位 后 再 将 其 入 栈 ,sp-2。 
当 压 入 16 位 立即 数 时 ，CPU 会 将 其 直接 入 栈 ，sp-2。 
当 压 入 32 位 立即 数 时 ，CPU 会 将 其 直接 入 栈 ，sp-4。 
见 示例 代码 16push.S。 
16push.S 
1 section loader vstart=0x900 
2 mov SP，0x900 
3 push byte 0x7 
4 push word 0x8 
5 push dword 0x9 
6 jmp $ 
表 4-4 实 模式 下 push 指令 操作 数 
行 号 下 一 条 指令 下 一 条 的 指令 的 机 器 码 当前 esp 值 
1 mov sp, 0x0900 bc0009 Ox00007c00 
2 push Ox0007 6a07 Ox00000900 
3 push Ox0008 6a08 0x000008fe 
4 push Ox00000009 666a09 Ox000008fc 
5 jmp .-2 ebfe Ox000008f8 
大 家 看 表 4-4， 以 上 信息 是 我 在 bochs 虚拟 机 中 摘录 整理 的 。 如 果 您 目前 还 没有 用 过 虚拟 机 ， 或 者 不 








给 你 


一 口 /CA 





熟悉 调试 的 话 ， 有 必要 
故 “ 当 前 esp 值 ” 与 它 无 关 。“ 当 前 esp 值 ” 列 是 当 


将 改变 第 n+l 行 的 “当前 esp 值 ”。 
























































的 指令 ， 而 是 编译 器 提供 的 伪 指 令 ， 它 给 编译 器 指出 数 志 
这 正 是 push 0x0007 对 sp 指针 的 影响 ，0x900-0x8fe=2， 可 见 ，sp 的 
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大 概 说 一 下 。“ 下 一 条 指令 ” 列 是 尚未 执行 
前 系统 的 栈 指针 。 


3 行 要 执行 的 指令 是 push 0x0008， 对 照 源 文件 16push.S 忒 








的 指令 ， 是 下 一 次 要 执行 的 指令 ， 
网 中 ， 第 n 行 的 “下 一 条 指令 ” 
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第 1 行 的 当前 esp 是 0x7c00。 为 了 更 清楚 地 观察 到 栈 指针 变化 ， 准 备用 mov sp， 0x900 指令 将 sp 赋 
值 为 0x900。 所 以 ， 在 第 2 行 的 “当前 esp 值 ” 列 已 经 更 新 成 了 0x900。 

第 2 行 的 下 一 条 指令 是 push 0x0007， 其 操作 码 是 0x6a， 这 是 压 入 一 个 字 的 操作 码 。 大 伙 儿 可 以 对 照 下 源 文 
牛 16push.S 的 第 3 行 ， 原 本 是 push byte 0x7。 可 见 ， 如 前 所 述 ，CPU 并 不 是 真 地 压 入 1 工 字 节 。byte 并 不 是 CPU 








外 的 宽度 。 第 3 行 的 “当前 esp 值 ” 列 ， 其 值 为 0x8fe， 





值 减 了 2， 即 向 栈 中 压 入 了 2 字 节 的 数据 。 
i 直接 压 入 














大 所 


第 4 行 ，push word 0x8， 这 是 


本 











一 个 字 , 其 操作 码 是 0x6a。 此 指令 执行 后 会 是 什么 效果 呢 ? 贞 





第 4 行 的 “当前 esp 值 ” 列 , esp 值 为 0x8fc， 












































0x8fe-Ox8fc=2。 说 明 sp 的 值 减 了 2， 即 向 栈 中 压 入 了 2 字 节 的 数据 。 
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第 4 行 要 执行 的 指令 是 push 0x00000009， 其 机 器 码 是 666a09， 其 中 机 器 码 可 以 拆 分 成 三 个 部 分 ，09 
是 操作 数 ，6a 是 操作 码 ，66 是 操作 数 大 小 反 转 前 级 ， 当 前 是 16 位 的 实 模式 ， 但 要 操作 的 是 32 位 环境 下 
的 操作 数 ， 所 以 编译 器 在 指令 前 添加 了 指令 前 级 0x66 将 当前 的 默认 操作 数 反 转 成 32 位 ， 当 然 这 只 是 临时 
的 ， 仅 在 当前 指令 有 效 。 操 作 数 由 源 文件 中 的 0x9 变 成 了 32 位 的 0x00000009。 这 分 明 是 要 压 入 4 字 节 的 
节奏 ， 其 对 栈 指针 sp 的 影响 体现 在 第 5 行 的 “当前 esp 值 ” 为 0x8f8。0x8fc-0x8f8=4， 说 明 sp 的 值 减 了 
4， 即 向 栈 中 压 入 了 4 字 节 的 数据 。 
在 保护 模式 下 ， 同 样 是 这 些 压 入 立即 数 的 指令 ， 栈 指针 会 有 怎样 的 变化 呢 ? 

当 压 入 8 位 立即 数 时 ， 由 于 保护 模式 下 默认 操作 数 是 32 位 ，CPU 将 其 扩展 为 32 位 后 入 栈 ，esp 指针 
减 4。 

当 压 入 16 位 立即 数 时 ，CPU 直接 压 入 2 字 节 ，esp 指针 减 2。 

当 压 入 32 位 立即 数 时 ，CPU 直接 压 入 4 字 节 ，esp 指针 减 4。 

本 书 的 特色 就 是 理论 结合 实践 ， 要 上 CPU 验证 一 下 才 放 心 。 

见 示例 代码 32push.S， 为 了 避免 吓 到 部 分 同学 ， 前 46 行 暂时 不 需要 阅读 。 




















































































































































































































32push.S 

1 Sinclude "boot.inc" 

2 section push32 test vstart=0x900 

3 jmp loader start 

4 gdt addr: 

5 

6 ;构建 gqt 及 其 内 部 的 描述 符 

中 GDT_BASE: dd 0x00000000 

8 dd 0x00000000 

9 
10 CODE DESC: dd Ox0000FFFF 
王 沁 dq DESC_ CODE HIGH4 
下 2 
he: DATA STACK DESC: dd Ox0000FFFF 
14 dq DESC DATA HIGH4 
1 
16 VIDEO DESC: dd 0x80000008 
17 dd DESC_VIDEO HIGH4 ; 此 时 dpl 已 改 为 0 
18 
19 GDT_SIZE equ $ - GDT BASE 
20 GDT_LIMIT equ GDT_SIZE - 1 
21 SELECTOR CODE equ (0x0001<<3) + TI _GDT + RPLO 
22 SELECTOR DATA equ (0x0002<<3) + TI_GDT + RPLO 
23 SELECTOR VIDEO equ (0x0003<<3) + TI_GDT + RPLO 
24 
25 gdt ptr: dw GDT LIMIT 
26 dd gdt addr 
27 
28 loader start: 
29 
3 0 准备 进入 保护 模式 。”---------------- 
31 ;1 打开 A20 
32 ;2 加 载 gqt 
33 ;3 将 cr0 的 pe 位 置 1 
4 
39 ;一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 打开 A20 一 -一 一 -一 一 一 一 一 
36 in alr0x92 
337 or al,0000_0010B 
38 out Ox92,al 
39: 
40 ;一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 加 载 GDT ---------------- 
41 lgdt [gdt ptr] 
42 
43 ;一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 cr0 第 0 位 置 1 --------------- 一 
44 mov eax, cr0 
45 or eax, 0x00000001 
46 mov cr0, eax 
47 
48 ; 刷新 流水 线 ， 避 免 分 支 预测 的 影响 ， 这 种 CPU 优化 策略 ， 最 怕 jmp 跳 转 ， 
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49 ; 这 将 导致 之 前 做 的 预测 失效 ， 从 而 起 到 了 刷新 的 作 
50 jmp SELECTOR CODE:p mode start 




















592. TDbEEtSs "32 
53 P mode start: 


54 mov ax, SELECTOR DATA 
3 mov ds, ax 

56 mov es, ax 

SF mov ss, ax 

58 mov esp, 0x900 

59 push byte 0x7 

60 push word 0x8 

61 push dword 0x9 

62 jmp $ 





代码 似乎 有 点 长 ， 在 第 46 行 之 前 都 是 在 为 进入 保护 模式 做 准备 ， 虽 然 我 们 目前 还 没有 讲 ， 但 还 是 给 
大 家 呈 上 来 了 ， 先 有 个 感性 认识 也 好 ， 实 在 没 兴趣 的 话 ， 请 移 步 第 59 行 ， 第 $9 一 62 行 同样 是 对 三 种 操作 





























































































































数 的 入 栈 操作 。 表 4-5 是 文件 32push.S 编译 后 上 CPU 的 效果 ， 表 中 信息 同样 是 从 bochs 中 摘录 的 重点 。 
表 4-5 保护 模式 下 push 指令 操作 数 
行 号 下 一 条 指令 下 一 条 的 指令 的 机 器 码 当前 esp 值 
1 push Ox00000007 6a07 Ox00000900 
2 push Ox0008 666a08 Ox000008fc 
3 push Ox00000009 6a09 Ox000008fa 
4 jmp .-2 ebfe Ox000008f6 





























同 实 模式 的 例子 相 比 ， 表 4-5 中 直接 将 更 新 esp 值 的 步 又 省 了 ， 这 里 也 是 将 栈 指针 置 为 0x900， 还 是 
为 了 方便 大 家 检验 栈 指针 的 变化 ， 不 过 这 里 是 32 位 栈 指针 esp。 
在 表 4-5 第 1 行 中 ,下 一 条 指令 是 push 0x00000007, 对 应 于 文件 32push.S 的 第 59 行 push byte 0x7Cbyte 
是 伪 指 令 , 表示 1 字 节 大 小 的 数据 类 型 , 由 编译 器 处 理 ), 通过 对 比 大 家 看 到 , 原本 是 压 入 1 个 字 节 的 0x7， 
现在 变 成 了 4 个 字 节 的 0x00000007， 这 同样 也 是 压 入 4 字 节 数据 的 节奏 。 果 然 , 在 第 2 行 的 当前 esp 值 为 
0x8fc， 这 是 0x900 减 4 的 结果 ， 也 就 是 说 栈 指 针 esp 减 4。 
第 2 行 的 下 一 条 指令 是 push 0x0008， 对 应 文件 32push.S 的 第 60 行 push word 0x8 (word 是 伪 指 令 ， 
表示 2 字 节 大 小 的 数据 类 型 ， 由 编译 器 处 理 )。 其 机 器 码 为 666a08， 其 中 低 1 字 节 是 0x66， 这 是 操作 数 大 
小 反 转 前 级 。 编 译 器 添加 此 反 转 前 级 的 原因 是 在 32 位 下 的 操作 数 是 4 字 节 ， 此 处 要 压 入 2 字 节 ， 这 是 16 
位 模式 下 的 操作 数 尺 寸 。 到 底 是 不 是 会 压 入 2 字 节 呢 ? 让 我 们 看 看 第 三 行 的 当前 esp 值 ， 果 然 是 0x8fa， 
它 是 由 上 一 次 的 栈 指针 0x8fc 减 2 得 来 的 。 
第 3 行 的 指令 对 应 文件 32push.S 的 第 61 行 push dword 0x9 (dword 是 伪 指 令 ， 表 示 4 字 节 大 小 的 数 
据 类 型 ， 由 编译 器 处 理 )， 这 是 本 身 是 32 位 大 小 的 操作 数 ， 所 以 直接 入 栈 ， 栈 指针 应 该 减 4。 到 第 4 行 的 
当前 esp 值 验证 ， 果 然 是 0x8f6， 它 是 由 0x8fa 减 4 得 到 的 。 

对 于 段 寄 存 器 的 入 栈 ， 即 cs、ds、es、fs、gs、ss， 无 论 在 哪 种 模式 下 ， 都 是 按 当 前 模式 的 默认 操作 
数 大 小 压 入 的 。 例 如 ， 在 16 位 模式 下 ，CPU 直接 压 入 2 字 节 ， 栈 指针 sp 减 2。 在 32 位 模式 下 ，CPU 直 
接 压 入 4 字 节 ， 栈 指针 esp 减 4。 

好 啦 ， 你 知道 我 总 会 用 行动 表示 ， 直 接 上 菜 。 

先 看 下 实 模式 下 压 入 段 寄 存 器 时 CPU 的 表现 ， 见 代码 16sreg_push.S。 






















































































































































































































































































































































































16sreg push.S 
section loader vstart=0x900 
mov sp, 0x900 
push cs 
push ds 
push es 
jmp $ 


本 程序 在 实 模 式 下 运行 ， 闲 话 少 说 ， 直 接 上 CPU。 
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表 4-6 实 模式 下 段 寡 存 器 压 栈 
行 号 下 一 条 指令 下 一 条 的 指令 的 机 器 码 当前 esp 值 
1 push cs 0x0e 0x900 
2 push ds Oxle Ox8fe 
3 push es Ox06 Ox8fc 
4 jmp .-2 Oxebfe Ox8fa 











实 模 式 下 每 次 压 入 一 个 段 寄存 器 ， 栈 指针 sp 都 会 减 2。 表 4-6 和 之 前 的 表 4-4、 表 4-5 一 样 ， 大 家 自 


行 验证 吧 。 


























2 push cs 
60 push ds 
61 push es 





























再 看 下 保护 模式 下 CPU 压 入 段 寄 存 器 的 情况 。 
用 于 演示 的 代码 文件 32sreg_push.S 大 部 分 与 32push.S 一 样 ， 


baza 


区 别 是 第 














以 上 是 32sreg_push.S 的 部 分 内 容 。 真 枪 实弹 上 CPU 后 ， 见 表 4-7。 


59 一 61 行 








寺 换 为 以 下 三 句 。 


































































































表 4-7 保护 模式 下 段 寄 存 器 压 栈 
行 号 下 一 条 指令 下 一 条 的 指令 的 机 器 码 当前 esp 值 

1 push cs 0x0e 0x900 
2 push ds Oxle Ox8fc 
3 push es Ox06 Ox8f8 
4 jmp .-2 Oxebfe Ox8f4 

保护 模式 下 每 次 压 入 一 个 段 寄 存 器 ， 栈 指针 esp 都 会 减 4。 大 伙 自 行 验证 表 4-7 吧 ， 哥 们 儿 啥 都 不 说 
了 ， 无 需 解释 您 懂 的 。 

对 于 通用 寄存 器 和 内 存 ， 无 论 是 在 实 模式 或 保护 模式 : 

。 如 果 压 入 的 是 16 位 数据 ， 栈 指针 减 2。 

。 如 果 压 入 的 是 32 位 数据 ， 栈 指针 减 4。 

咱们 先 验证 下 实 模式 压 入 16 位 、32 位 数据 后 栈 指针 的 变化 ， 测 试 文件 16general reg mem push.S。 

16general reg mem push.S 

1 section loader vstart=0x900 

2 mov sp, 0x900 

3 push ax 

4 push eax 

5 push word [0x1234] 

6 push dword [0x1234] 

7 jmp $ 





本 文件 在 第 3、4 行 测试 寄存 器 入 栈 ， 第 5、6 行 是 测试 内 存 入 栈 。 文 件 中 第 2 行 依然 是 将 本 指针 sp 









































指向 0x900， 方 便 大 伙 儿 查看 。 表 4-8 是 上 CPU 后 的 真实 情况 。 





























表 4-8 实 模 式 下 通用 寄存 器 和 内 存 压 栈 
行 号 下 一 条 指令 下 一 条 的 指令 的 机 器 码 当前 esp 值 
1 push ax 50 Ox900 
2 push eax 6650 Ox8fe 
3 push word ptr ds: 0x1234 ff363412 Ox8fa 
4 push dword ptr ds: Ox1234 66ff363412 Ox8f8 
5 jmp .-2 ebfe Ox8f4 

















1 于 是 在 16 位 模式 下 测试 ， 所 以 在 第 




















见 表 4-8， 第 1、2 行 是 压 入 通用 寄存 器 。 

















2 行 压 入 32 位 寄存 器 
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位 实 


以 下 














编译 器 为 指令 添加 了 操作 数 大 


小 反 转 前 缀 0x66 。 

















第 3、4 行 是 压 入 内 存 ， 第 3 行 是 压 入 16 位 内 存 数 据 ， 第 4 行 是 压 入 32 位 









































随 着 每 次 操作 数 的 压 入 ， 栈 指针 sp 的 值 每 次 都 会 减 去 操作 数 的 大 小 ， 大 伙 】 
































下 面 看 看 在 保护 模式 下 同样 是 























压 入 通用 寄存 器 和 内 存 的 情况 。 























内 存 数 据 。 


模式 ， 所 以 这 两 行 的 区 别 是 编译 器 为 第 4 行 的 指令 添加 了 操作 数 大 小 反 转 前 级 0x66。 








1 于 当前 模式 是 16 


























L 根 据 表 中 数据 E 











用 于 演示 的 代码 文件 32general_ reg_mem_push.S 大 部 分 与 32push.S 一 样 ， 区 别 是 


四 行 。 


60 push eax 


61 push word [0x1234] 
62 push dword [0x1234] 


以 上 是 32general reg mem pu 


表 4-9 是 32general reg_mem push.s 编译 后 在 CPU 上 运行 的 真实 情况 。 


sh.S 部 分 内 容 。 












































己 验 证 下 吧 。 











第 59 一 62 行 替 换 为 
































表 4-9 保护 模式 下 通用 寄存 器 和 内 存 压 栈 
行 号 下 一 条 指令 下 一 条 的 指令 的 机 器 码 当前 esp 值 
1 push ax 6650 Ox900 
2 push eax 50 Ox8fe 
3 push word ptr ds: Ox1234 66ff3534120000 Ox8fa 
4 push dword ptr ds: Ox1234 ff3534120000 Ox8f8 
5 jmp .-2 ebfe Ox8f4 








指针 esp 就 减 4。 这 上 
得 我 太 喝 叶 了 ， 想 必 甚 至 觉得 本 段 
与 保护 模式 的 初次 见面 到 此 就 结束 了 ， 真 正 能 领略 到 保护 模式 风采 的 是 后 
特权 级 、 分 页 等 ， 那 些 才 是 我 们 关注 的 重点 。 

















从 表 4-9 中 可 以 看 出 ， 在 保护 模式 每 次 压 入 16 位 数 
也 在 部 分 指令 中 添加 了 反 转 前 缀 0x66。 其 他 的 内 容 不 | 






































全 局 描述 符 表 











信息 











显著 


4.3. 


什么 淘汰 了 实 模式 而 发 明了 保护 模式 ? 最 3 
的 内 存 访问 依然 是 “ 段 基 址 ， 段 内 偏 移 ”的 形式 ， 又 要 有 效 提高 了 安全 性 。 
人 所 发 明 的 东西 都 是 基于 人 的 思维 设计 的 ，CPU 的 工程 师 们 已 经 解决 了 这 个 问题 。 吗 
能 够 悟 出 工程 师 的 做 法 。 如 果 是 您 ， 您 该 怎样 解决 这 个 问题 呢 ? 之 前 在 16 位 模式 下 ， 访 问 
址 加 载 到 段 寄存 器 中 ， 再 结合 偏 移 地 址 就 行 了 ， 段 寄存 器 太 小 了 ， 只 能 存储 16 位 的 信息 ， 


式 下 


一 定 
段 基 
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特征 之 一 。 


全 局 描述 符 表 (Global Descriptor Table，GDT) 是 
































内 容 都 是 多 余 的 ， 喻 哈 ， 大 家 理解 了 就 好 。 






























































四 时 栈 指针 esp 就 减 2， 每 次 压 入 32 位 数据 时 栈 
] 我 多 说 了 ， 估 计 大 家 已 经 觉 





看 的 部 分 : 全 局 描述 符 表 、 















































p 



































先 抛 出 这 样 一 个 术语 来 ， 下 面 


1 段 描述 符 






































大 家 回想 一 下 ， 首 先 ， 对 于 IA32 架构 的 处 到 
“ 段 基 址 ， 段 内 偏 移 地 址 ”形式 ， 即 使 到 了 保护 模式 ， 也 是 绕 不 开 这 个 限 种 














会 接着 讲解 。 

































































































































































器 〈 就 是 我 们 大 多 数 人 现在 所 用 的 处 到 





> 储户 短 

















到 了 保护 模式 下 ， 内 存 段 (如 数据 段 、 代 码 段 等 ) 不 再 是 简单 地 用 上 段 寄 存 器 加 载 一 下 段 基 址 就 能 用 啦 ， 段 的 


增加 了 很 多 ， 需 要 提前 把 段 定义 好 才能 使 用 。 就 像 家 庭 成 员 需 要 上 户口 一 样 上 登记 过 才 算 合法 。 
































器 )， 访 问 内 存 采用 


果 护 模式 下 内 存 段 的 登记 表 ， 这 是 不 同 于 实 模 式 的 



































要 的 是 安全 问题 。 基 于 以 上 两 方面 ，CPU 工程 归 


| 的， 这 是 骨子里 的 问题 。 其 次 ， 为 














j 既 要 保证 保护 模 























们 也 都 是 人 ， 所 以 





内 存 时 只 要 将 




















[至 连 20 位 地 




















址 都 要 借助 左 移 4 位 来 实现 。 现 在 为 了 安全 性 ,总 该 为 内 存 段 添加 一 些 额外 的 安全 属性 吧 ? 问题 来 啦 ， 这 些 用 



































除了 寄存 器 ， 自 然 只 剩 下 内 存 可 以 考虑 啦 。 

















于 安全 方面 的 属性 ， 该 往 哪 放 呢 ? 寄存 器 就 十 想 了 ， 即 使 是 32 位 寄存 器 ， 也 才刚 刚 够 存放 32 位 地 址 而 已 。 排 























相对 寄存 器 来 说 ， 内 存 可 是 非常 大 的 ， 既 然 有 了 那么 大 的 内 存 可 用 ， 那 就 干脆 多 添加 一 些 信息 ， 把 安 


全 做 得 更 加 彻底 一 些 。 
用 哪些 属性 来 描述 这 个 内 存 段 呢 ? 
首先 ， 先 要 解决 实 模式 下 存在 的 问题 。 


























实 模式 下 的 用 户 程序 可 以 破坏 存储 代码 的 内 存 






































区 域 ， 所 以 要 添加 个 内 存 段 类 型 属性 来 阻止 这 种 行为 。 

















实 模式 下 的 用 户 程序 和 操作 系统 是 同一 级 别 的 , 所 以 要 添加 个 特权 级 属性 来 区 分 用 户 程序 和 操作 系统 


的 地 位 。 
其 次 ， 是 一 些 访问 内 存 段 的 必要 属性 条 件 








o 











内 存 段 是 一 片 内 存 区 域 ， 访 问 内 存 就 要 提供 段 基 址 ， 所 以 要 有 段 基 址 属性 。 


























为 了 限制 程序 访问 内 存 的 范围 ， 还 要 对 段 大 小 进行 约束 ， 所 以 要 有 段 界 限 属性 。 
最 后 ， 要 改进 就 改 得 彻底 一 些 ， 所 以 多 增加 了 一 些 约束 条 件 ， 这 些 马 上 就 会 讲 到 。 





























您 看 ， 这 里 我 只 是 访 























了 一 小 部 分 内 存 段 的 属性 ， 看 上 去 也 要 


























占 不 少 字 节 呢 。 这 些 用 来 描述 内 存 段 的 属性 ， 





























说 
被 放 到 了 一 个 称 为 段 描述 符 的 结构 中 ， 顾名思义， 该 结构 专门 用 来 


















































苗 述 一 个 内 存 段 ， 该 结构 是 8 字 节 大 小 〈 顺 
























































便 说 一 句 ， 在 本 书 中 提 到 的 各 种 描述 符 大 小 都 是 8 字 节 )。 该 结构 如 图 4-5 所 示 。 
31~24 23 22 21 20 19~16 15 14~13 12 11~8 7~0 
局 
段 基 址 段 界 限 段 基 址 
324| G |DpB| L |a|ie16| P | pPL TRE | 73 32 
位 
31~16 15~0 
低 
段 基 址 15~0 段 界 限 15~0 32 
位 











全 | 冬 | 











跟 大 家 说 明 一 下 ， 段 描述 符 是 





4-5 段 描述 符 格式 














节 大 小 ， 在 图 4-5 中 我 们 为 了 方便 展示 ， 才 将 其 “人 为 地 ”分 成 了 


8 一 
低 32 位 和 高 32 位 ， 即 两 个 4 字 节 部 分 。 其 实 它们 不 能 分 成 两 部 分 ， 必 须 是 连续 的 8 字 节 ， 这 样 CPU 才 





能 读 取 到 正确 的 段 信息 。 


保护 模式 下 地 址 总 线 宽度 是 32 位 ， 段 基 址 需要 
段 界 限 表示 段 边界 的 扩展 最 值 ， 即 最 大 扩展 到 多 少 或 最 小 扩展 到 多 少 。 扩 展 方向 只 有 上 下 两 种 。 对 于 
数据 段 和 代码 段 ， 段 的 扩展 方向 是 向 上 ， 即 地 址 越 来 越 高 ， 此 时 
氏 ， 此 时 的 段 界 限 



































于 栈 段 ， 段 的 扩展 方向 是 向 下 ， 即 地 址 越 来 越 
































j 32 位 地 址 来 表示 。 























的 段 界限 用 来 表示 段 内 偏 移 的 最 大 值 。 对 














| 来 表示 上段 内 偏 移 的 最 小 值 。 无 论 是 向 上 























扩展 ， 还 是 向 下 扩展 ， 段 界限 的 作用 如 同 其 名 ， 表 示 段 的 边界 、 大 小 、 范 围 。 段 界限 用 20 个 二 进 制 位 来 



































表示 。 只 不 过 此 段 界 限 只 是 个 单位 量 ， 它 的 单位 要 么 是 字 节 ， 要 么 是 4KB， 这 是 由 描述 符 中 的 G 位 来 指 
定 的 。 最 终 段 的 边界 是 此 段 界限 值 * 单 位 ， 故 段 的 大 小 要 么 是 2 的 20 次 方 等 于 1MB， 要 么 是 2 的 32 次 方 
(4KB 等 于 2 的 12 次 方 ，12+20=32) 等 于 4GB。 






































上 面 所 说 的 1MB 和 4GB 只 是 个 范围 ， 并 不 是 











的 ， 所 以 实际 的 段 界限 边界 值 = 
































\ 体 的 边界 值 。 由 于 段 界 限 只 是 个 偏 移 量 ， 是 从 0 算 起 





(描述 符 中 段 界限 +1) *《〈 段 界限 的 粒度 大 小 : 4KB 或 者 1) -1。 


这 个 公式 很 简单 ， 就 是 表示 有 多 少 个 4KB 或 1。 





















































1 于 描述 符 中 的 段 界限 是 从 0 起 的 ， 所 以 左边 第 1 








个 括号 中 要 加 个 1， 表示 4KB 或 1 的 实际 数量 。 它 与 第 二 个 括号 中 的 段 粒度 大 小 相 乘 后 得 到 的 乘积 是 以 1 
为 起 始 的 段 的 实际 大 小 。 由 于 地 址 是 以 0 为 起 始 的 ， 所 以 公式 的 最 后 又 减 了 1。 
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*] - 


个 例子 ， 如 果 是 习 
0x1000-1=0xFFFFFFFF 。 
内 存 访 问 需要 用 到 “ 段 其 址 ; 段 内 1 








如 果 G 位 为 0， 表示 段 界 限 粒 度 大 小 为 1 字 节 ， 根 据 上 四 

















j 的 公式 ， 实 际 段 界限 =〈 描 述 符 中 段 界 限 +1) 









































= 描述 符 中 段 界 限 ， 段 界限 实际 大 小 就 等 于 描述 符 中 的 段 界限 值 。 
































如 果 G 位 为 1， 表 示 段 界限 粒度 大 小 为 4KB 字 节 ， 故 实际 段 界 限 =〈 描 述 符 中 段 界 限 +1) *4k-1。 举 








F 坦 模型 ， 段 界限 为 0xFFFFF，G 位 为 1， 套 用 上 面 公 式 ， 段 界限 边界 值 =0x100000* 





















































忆 移 地 址 ” 段 界限 





实 是 用 来 限制 段 内 偏 移 地 址 的 ， 段 内 偏 移 地 

















址 必须 位 于 段 的 范围 之 内 ， 否 则 CPU 会 抛 异常 。 根 据 段 的 扩展 方向 ， 此 “ 段 界限 * 单 位 ” 便 是 段 内 偏 移 地 


址 的 最 大 值 ( 向 上 扩展 ) 或 最 小 值 ( 向 下 扩展 )， 任 何 超过 此 
将 此 错误 
CPU 会 触发 相应 的 异常 ， 咱 们 负责 写 相 应 的 异常 处 理 程 

仔细 看 图 4-5， 您 会 发 现 20 位 的 段 界限 属性 ， 居 然 被 和 
































值 的 偏 移 地 址 都 被 认为 是 非法 访问 ，CPU 会 





者 获 。 顺 便 提 一 句 ， 是 CPU 硬件 负责 检测 ， 这 块 没 1 






































自 们 啥 事 ， 但 检测 到 错误 后 就 有 咱们 的 事 啦 ， 





斥 分 成 两 部 分 。 段 界限 的 低 16 位 〈0~15 位 ) 存放 在 


段 描述 符 的 低 32 位 ， 段 界限 的 高 4 位 《16 一 19 位 ) 存放 在 段 描述 符 的 高 32 位 。 不 止 段 界限 这 样 ， 段 基 址 更 过 














分 ，32 位 的 段 基 址 居然 被 分 


























拆 成 三 份 存放 。 有 没有 





























历史 遗留 问题 ?不 知 您 心 
的 CPU， 当 时 就 已 经 采用 段 描述 符 来 描述 内 存 段 信息 了 。 


























， 这 种 格式 确实 太 奇怪 了 ， 居 然 一 个 字段 被 拆 分 成 
多 个 …… 也 许 不 用 我 说 ， 很 多 读者 都 想到 了 ， 这 属于 历史 遗留 问题 。 为 了 兼容 〈 主 要 是 Intel 公司 的 战略 是 把 兼 
容 放 在 第 一 位 ) CPU 不 得 不 兼顾 着 过 去 的 产品 ， 这 也 正 是 计算 机 业 能 像 今天 这 样 朝气 壬 勃发 展 的 原因 。 



















































































是 否 也 有 个 大 大 的 问号 。3 





其 实 之 前 已 经 说 过 啦 ，80286 是 第 一 款 具 有 保护 模式 
只 是 当时 它 是 16 位 的 保护 模式 ， 地 址 总 线 是 24 位 ， 

















最 多 访问 16MB 内 存 ， 产 品 定位 模糊 。 所 以 这 款 产品 只 是 用 来 试 水 的 ， 最 终 也 未 像 8086 那样 成 功 。 但 问题 也 


就 来 了 ， 虽 然 80286 未 有 大 的 成 功 ， 但 也 依然 有 小 部 分 市 场 〈 估 计 是 卖 给 了 当时 的 土豪 们 )， 把 兼容 性 作为 第 
履 扩 展 ， 所 以 才 有 了 今天 这 样 奇形怪状 的 段 描 述 符 。 

不 过 也 不 要 太 担 忧 这 样 会 影响 CPU 获取 段 信息 的 效率 , 因为 段 信息 会 被 CPU 缓存 到 上 段 描 述 符 缓冲 寄存 器 
中 ， 这 个 前 面 在 介绍 寄存 器 时 有 说 过 啦 ， 此 缓冲 寄存 器 中 的 
[ 段 基 址 已 经 被 拼合 到 一 起 啦 ，CPU 下 次 会 E 


一 位 的 ntel 不 得 不 在 原 有 80286 的 段 描述 符 上 
































后 的 ， 段 界限 包 
下 面 根据 图 























































































































内 容 便 是 段 描述 符 中 的 内 容 ， 它 是 经 过 CPU 整理 
动 到 段 描 述 符 缓冲 寄存 器 中 取 段 数据 。 




































































4-5， 介 绍 一 下 段 描 述 符 中 的 属性 。 为 了 方便 大 家 阅读 ， 对 字段 的 解释 将 以 段 描述 符 中 的 























字段 顺序 为 主 ， 也 许 内 容 会 显得 有 些 虎 头 蛇 尾 ， 大 伙 儿 多 多 包涵 。 


内 容 说 的 都 是 在 段 描述 符 的 高 32 位 中 ， 为 叙述 方便 不 再 引 
0~7 位 是 段 基 址 的 16 一 23, 24 一 31 位 是 段 基 
15 位 ， 这 下 32 位 基地 址 才 算 齐全 了 。 
8 一 11 位 是 type 字段 ， 共 4 位， 用 来 指定 本 描述 符 的 类 型 。 这 里 要 提前 说 下 段 描 述 符 的 S$ 字段 了 。 是 























这 上 


之 为 系统 ， 凡 是 软件 (操作 系统 
无 论 是 代码 ， 


二、 














] 先 从 段 描述 符 的 低 32 位 开始 。 
段 描述 符 的 低 32 位 分 为 
址 的 0 一 15 位 。 
主要 的 属性 都 在 段 描 述 符 的 高 32 位 ， 一 眼 望 去 可 不 少 呢 ， 现 在 我 开始 逐一 和 大 家 介绍 。 注 意 ， 以 下 



































两 部 分 ， 前 16 位 用 来 存储 段 的 段 界 限 的 前 0~15 位 ， 后 16 位 用 来 存储 段 基 

























































































F 的 ， 一 个 段 描 述 符 ， 在 CPU 眼 里 分 为 两 大 类 ， 要 么 描述 的 是 系统 段 ， 要 么 描述 的 是 数据 段 ， 这 是 由 
段 描述 符 中 的 $ 位 决定 的 ， 用 它 指示 是 否 是 系统 段 。 在 CPU 眼 里 ， 凡 是 硬件 运行 需要 用 到 的 东西 都 可 称 
也 属于 软件 ，CPU 眼中 ， 它 与 用 户 程序 无 区 别 ) 需要 的 东西 都 称 为 数据 ， 
的 输入 ， 都 是 给 硬件 的 数据 而 已 ， 所 以 代码 段 在 段 






















































































EE 复 说 明 。 
址 的 24~31 位 ,加 上 在 段 描述 符 低 32 位 中 的 段 基 址 0 一 
















































































还 是 数据 ， 甚 至 包括 栈 ， 它 们 都 作为 硬 人 














己 























也 属于 数据 段 〈 非 系统 段 )。S$ 为 0 时 表示 系统 段 ，S 为 1 时 表示 数据 段 。type 字段 是 要 和 S 字 








段 配 合 在 一 起 才能 确定 段 描 述 符 的 确切 类 型 ， 只 有 $ 字段 的 值 确定 后 ，type 字段 的 值 才 有 具体 意义 。 





什么 是 系统 段 ? 各 种 称 为 “ 














调 / 
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3 门 、 任 务 门 。 简 而 言 之 ， 门 的 意思 就 是 入 口 ， 它 通 往 
主要 是 关注 $ 为 1 时 ， 非 系统 段 的 type 子 类 型 。 





























可 来 继续 说 type 字段 ， 该 字段 共 4 位 ， 用 于 









































]” 的 结构 便 是 系统 段 ， 也 就 是 硬件 系统 需要 的 结构 ， 非 软件 使 用 的 ， 如 
段 程序 。 关 于 系统 段 这 里 咱们 不 再 多 说 ， 目 前 

















示 内 存 段 或 门 的 子 类 型 。 说 明 见 表 4-10。 




















































































































































































































































































































































































































4.3 全 局 描述 符 表 
表 4-10 段 描 述 符 的 type 类 型 
系统 段 类 型 本 说 明 
3 |2 1 |0 
未 定义 0 |0 0 |0 保留 
可 用 的 80286TSS |0 |0 0 |1 仅 限 286 的 任务 状态 段 
LDT 0 10 1 |0 局 部 描述 符 表 ， 只 有 第 1 位 为 1 
性 碌 的 80286TSS |o |o . i 中 的 第 1 位 称 为 B 位 , 若 为 1， 则 表示 当前 任务 忙碌 。 由 CPU 
80286 调用 门 0 1 0 |0 仅 限 286 
系 | 任务 门 0 |1 04| 任务 门 在 现代 操作 系统 中 很 少 用 到 
统 | 80286 中 断 门 0 1 1 0 仅 限 286 
有 | 80286 陷阱 门 0 |1 1 |1 仅 限 286 
未 定义 1 10 0 |0 保留 
可 用 的 80386TSS 1 0 0 1 386 以 上 CPU 的 TSS，type 第 3 位 为 1 
未 定义 1 |0 1 |0 保留 
忙碌 的 80386TSS | 1 0 1 1 386 以 上 CPU 的 TSS，type 第 3 位 为 1 
80386 调用 门 1 1 0 |0 386 以 上 CPU 的 调用 门 ，type 第 3 位 为 1 
未 定义 1 1 0 |1 保留 
中 断 门 1 1 1 0 386 以 上 CPU 的 中 断 门 
陷阱 门 1 1 1 1 386 以 上 CPU 的 陷阱 门 
对 于 非 系 统 段 ， 按 代码 段 和 数据 段 划分 ， 这 4 位 分 别 有 不 同 的 意义 
内 存 段 类 型 X |R |C |A | 说 明 
1 0 0 |* 只 执行 代码 段 
代码 段 1 1 0 全 和 J 可 SS 
韭 1 0 1 可 执行 、 一 致 性 代码 段 
系 1 |1 |1 |* | 可 执行 可 读 、 一 致 性 代码 段 
统 | 内 存 段 类 型 X jw |E |A | 说 明 
自 0 10 0 |* 只 读数 据 段 
0 | 1 |0 |* | 可 读 写 数据 段 
TE. 0 |0 [1 |* | 名 恋 ,向 下 扩展 的 数据 段 
0 1 1 S 可 读 写 ， 向 下 扩展 的 数据 段 
虽然 表 中 一 并 列 出 了 系统 段 , 但 咱们 目前 还 是 主要 关注 非 系统 段 , 部 分 非 系统 段 会 在 今后 的 内 容 中 讲述 。 





表 中 的 A 位 表示 Accessed 位 ， 这 是 由 CPU 来 设置 











所 以 ， 创 建 一 个 新 段 








C 表示 一 致 性 代码 段 , 也 称 为 依从 代码 段 





局 用 
i 5 8 





致 性 





并 且 自 











段 ，C 为 0 时 
R 表示 可 
执行 过 程 中 ， 














代码 段 ， 
而 是 与 转移 前 的 低 特 权 级 一 致 ， 也 就 是 听从 、 依 从 转移 前 
则 表示 该 段 为 非 一 致 性 代码 段 。 

读 ，R 为 1 表示 可 
CPU 发 现 某 些 指令 对 及 为 0 的 段 进行 访问 ， 














i 述 符 时 ， 





























役 ， Conforming。 一 致 性 
































这 个 1 
如 使 用 


读 ，R 为 0 表示 不 可 读 。 






































抛 出 异常 。 咖 嗪 一 小 下 ， 内 存 ! 





骑 可 以 踏 蜗 任意 角落 。 所 以 ， 不 可 读 的 代码 段 只 























的 数据 对 CPU 来 说 是 要 处 理 的 数据 ， 
4 是 来 限制 代码 指 








令 的 ， 








A] 


X 表示 该 段 是 否 


J 执行 ，EXecutable。 我 们 所 说 的 指令 

















的 ， 每 当 该 段 被 CPU 访问 
应 该 将 此 位 置 0。 我 们 在 调试 时 ， 根 据 此 位 便 能 判断 该 描述 符 是 否 可 用 啦 。 
代码 段 是 指 如 果 上 
9 己 的 特权 级 一 定 要 高 于 当前 特权 级 ， 转 移 后 的 特权 级 不 与 
的 低 特权 级 。C 为 1 时 则 表示 该 段 是 一 致 性 代码 


届 性 一 般 用 来 限 种 
段 超越 前 绥 
仅仅 是 CPU 的 输 


和 数据 ,在 CPU 眼 ， 


过 后 ，CPU 就 将 此 位 置 1。 
























































己 是 转移 的 目标 段 
5 自己 的 DPL 为 主 ， 






























































1 代码 段 的 访问 。 如 果 指 令 
CS 来 访问 代码 段 ，CPU 将 
入 而 已 ，CPU 的 铁 
车 CPU 也 不 能 看 。 

是 没有 任何 区 别 的 ， 都 是 


并 不 是 连 
































010101 这 样 





类 似 的 二 进 制 。 
即 X 为 1。 而 数据 段 


Thi A 
本 起 合 下 


























所 以 要 用 type 中 的 X 位 来 标识 
是 不 可 执行 的 ， 即 X 为 0。 





可 执行 的 代码 。 代 码 段 是 可 执行 的 ， 
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是 用 来 标识 段 的 扩 





























展 方向 ，Extend。E 为 0 表示 向 上 扩展 ， 即 地 址 越 来 越 高 ， 通 常用 于 代码 段 和 数 
据 段 。E 为 1 表示 向 下 扩展 ， 地 址 越 来 越 低 ， 通 常用 于 栈 段 。 






































W 是 指 段 是 否 可 写 ，Writable。W 为 1 表示 可 写 ， 通 常用 于 数据 段 。W 为 0 








表示 不 可 写 入 ， 通 




















段 描述 符 的 第 

















12 位 是 S 字段 ， 前 














常用 于 代码 段 。 对 于 W 为 0 的 段 有 写 入 行为 ， 同 样 会 引发 CPU 抛 出 异常 。 
四 在 介绍 type 时 已 解释 过 啦 ， 























j 来 指出 当前 描述 符 是 否 是 系统 段 。 





























S 为 0 表示 系统 段 ，$ 为 1 表示 非 系统 段 。 关 于 系统 段 的 类 型 ， 可 参见 表 4-10 的 系统 段 类 型 部 分 。 
段 描述 符 的 第 13 一 14 位 是 DPL 字段 ，Descriptor Privilege Level， 即 描述 符 特 权 级 ， 这 是 保护 模式 提 




















供 的 安全 解决 方案 


， 将 计算 机 1 











由 于 段 描述 符 用 来 描述 














上 世界 按 权 力 划 分 成 不 同等 级 ， 每 一 种 等 级 称 为 一 种 特权 级 。 























个 内 存 段 或 一 段 代码 的 情 








况 ( 若 描述 符 类 型 为 “ 门 ”)， 所 以 





i 述 符 中 的 DPL 











是 指 所 代表 的 内 存 段 的 特权 级 。 


这 两 位 能 表示 








4 种 特权 级 ， 分 别 是 0、1、2、3 级 4 
下 才 有 的 东西 ，CPU 


















































1 实 模式 进入 保护 模式 后 ， 特 权 级 E 























竺 权 ， 数 字 越 小 ， 特 权 级 越 大 。 特 权 级 是 保护 模式 
动 为 0。 因 为 保护 模式 下 的 代码 已 经 是 操作 系统 





















































的 一 部 分 啦 ， 所 以 操作 系统 应 该 处 于 最 高 的 0 特权 级 。 








只 能 在 0 特权 级 下 执行 ， 从 而 保证 了 安全 。 


A 


段 描 述 符 的 第 









































j 户 程序 通常 处 于 3 特权 级 ， 权 限 最 小 。 某 些 指 令 














15 位 是 P 字段 ，Present， 即 段 是 否 存在 。 如 果 段 存在 于 内 存 中 ，P 为 1， 否则 了 为 0。 
P 字段 是 由 CPU 来 检查 的 ， 如 果 为 0，CPU 将 抛 出 异常 ， 转 到 相应 的 异常 处 理 程序 ， 此 异常 处 理 程序 是 





























咱们 来 写 的 ， 在 异常 处 理 程序 处 理 完 成 后 要 将 P 置 1。 也 就 是 说 ， 对 于 了 字段 ，CPU 只 负责 检查 ,1 











责 赋 值 。 不 过 在 通 














不 也 是 很 
案 ， 









































段 描 











段 


位 代码 段 。 这 目前 



































常情 况 下 ， 段 都 是 在 内 存 中 
对 应 的 内 存 段 换 出 ， 
足 时 ， 也 没有 将 整个 段 都 换 吕 
占 空 间 吗 ? 而 且 这 些 平坦 的 段 都 是 公 
保护 模式 下 有 分 页 功能 ， 可 以 按 页 (4KB) 的 单位 来 将 内 存 换 入 换 出 。 

段 描述 符 的 第 16 一 19 位 是 段 界 限 的 第 16 一 19 位 。 这 样 共 20 位 的 段 界限 就 齐全 啦 。 
述 符 的 第 20 位 为 AVL 字段 ， 从 名 字 上 看 它 是 AVaiLable， 
户 来 说 的 ， 也 就 是 操作 系统 可 以 随意 用 此 位 。 对 硬 位 





























































































































们 负 





























的 。 当 初 CPU 的 设计 是 当 内 存 不 足 时 ， 可 以 将 段 描述 符 中 
也 就 是 可 以 把 不 常用 的 段 直 接 换 出 到 硬盘 ， 待 使 用 时 再 加 载 进来 。 但 现在 即使 内 存 不 
8 去 的 ， 现 在 基本 都 是 平坦 模型 ， 


















































般 情 况 下 ， 段 都 要 4GB 大 小 ， 换 到 硬盘 














j 的 ， 换 出 去 就 麻烦 啦 。 所 以 这 些 是 未 开局 分 页 时 的 解决 方 

















属于 保留 位 ， 在 我 们 32 位 CPU 下 乡 


段 描述 符 的 第 22 位 是 DB 字段 ， 用 来 指示 有 效 地 址 〈 段 内 偏 移 地 址 ) 及 操作 数 的 大 小 。 有 没有 觉得 
奇怪 ， 实 模式 已 经 是 32 位 的 地 址 线 和 操作 数 了 ,难道 操作 数 不 是 32 位 大 小 吗 ? 其 实 这 是 为 了 





保护 模式 ，286 的 保护 模式 下 的 操作 数 是 16 位 。 
的 ， 与 指令 相关 的 内 存 段 是 代码 段 和 栈 段 ， 所 以 出 





来 说 ， 它 没有 专门 
































j 的 。 不 过 这 “可 
的 用 





j 的 ”是 对 用 
途 ， 就 当 作 是 硬件 给 软件 的 


可 





























划 述 符 的 第 21 位 为 L 字段 ， 用 来 设置 是 否 是 64 位 代码 段 。L 为 1 表示 64 位 代码 段 ， 否 则 表示 32 
程 ， 将 SS 




















置 为 0 便 可 。 


















































容 286 的 








既然 是 指定 “操作 数 ” 的 大 小 ， 也 就 是 对 “指令 ”来 说 
字段 是 D 或 了 B。 


对 于 代码 段 来 说 ， 此 位 是 D 位 ， 若 D 为 0， 表 示 指 令 中 的 有 效 地 址 和 操作 数 是 16 位 ， 指 令 有 效 地 址 
用 全 寄存 器 。 若 DD 为 1， 表 示 指 令 中 的 有 效 地 址 及 操作 数 是 32 位 ， 指 令 有 效 地 址 用 EIP 寄存 器 。 





对 于 栈 段 来 说 
址 

















段 描述 符 的 第 23 位 是 G 字段 ，Granularity， 粒 度 ， 
合 段 界限 的 ， 它 与 段 界 限 一 起 来 决定 段 的 大 小 。 若 G 为 0， 
的 20 次 方 *1 字 节 ， 即 1MB。 若 G 为 1， 表示 段 界限 的 单 














节 ， 即 4GB。 





， 此 位 是 B 位 ，| 









































来 指定 操作 数 大 小 ， 此 操作 数 涉 及 到 栈 指针 寄存 器 的 选择 及 栈 的 地 
上 限 。 若 B 为 0， 使 用 的 是 sp 寄存 器 ， 也 就 是 栈 的 起 始 地 址 是 16 位 寄存 器 的 最 大 寻 址 范围 ，0xFFFF。 
若 B 为 1， 使 用 的 是 esp 寄存 器 ， 也 就 是 栈 的 起 始 地 址 是 32 位 寄存 器 的 最 大 寻 址 范 转 
































OxFFFEFEFEFFF 。 









































来 指定 段 界 限 的 单位 大 小 。 所 以 此 位 是 用 来 配 
表示 段 界限 的 单位 是 1 字 节 ， 这 样 段 最 大 是 2 
位 是 4KB， 这 样 段 最 大 是 2 的 20 次 方 *4KB 字 




















段 描 述 符 的 第 24 一 31 位 是 段 基 址 的 第 24~31 位 ， 这 是 段 基 址 的 最 后 8 位 。 




















把 段 描述 符 说 完了 ， 其 实 以 后 还 要 说 其 他 描述 符 呢 ， 所 以 ， 





















































用 的 时 候 再 下 
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来 翻 看 才 1 














事 方便 。 









































j 不 着 把 每 个 字段 的 意义 都 记 下 来 ， 将 来 


























4.3.2 全 局 描述 


区 


符 表 GDT、 














局 部 的 述 符 表 LDT 及 选择 子 


























个 段 描述 符 只 

















用 来 定义 








个 段 


























内 存 段 也 要 各 自 占用 

















说 的 GDT (Global Descriptor 
8 字 节 的 描述 符 。 可 以 用 选择 子 (马上 会 

为 什么 将 该 表 称 为 “全 局 ”描述 符 表 ? 全 
全 局 描述 符 表 位 于 内 存 中 , 外 


























个 段 描 述 符 ， 这 
Table )。 全 





























不 过 ， 对 此 寄存 





即 GDT Register， 专 门 ) 











样 的 指令 为 gdtr 初始 化 ， 有 专门 的 指令 
lgdt 指令 。 0 ty een 


ee 代码 段 要 









































































































































FE 里 面 定义 自 i 























] 来 存储 GDT 的 内 存 地 址 及 大 小 。 
器 的 访问 ， i mov XXX = 


、 数 据 段 和 栈 段 等 ， 多 个 
和 术 符 表 ， 就 是 本 节 开 头 所 
是 数组 ， 数 组 中 的 每 个 元 素 都 是 
讲 到 ) 中 提供 的 下 标 在 GDT We 昔 述 符 。 
局 体现 在 多 个 程序 都 可 以 如 
需要 用 专门 的 寄存 器 指向 它 后 , CPU 才 知 道 它 如 














1 的 段 描述 符 ， 是 公用 的 。 
那里 。 这 个 专门 的 寄存 器 便 是 GDTR， 











GDTR 是 个 48 位 的 寄存 器 ， 如 图 4-6 所 示 。 


15 0 











GDT 内 存 起 始 地 址 


GDT 界限 














保护 模式 下 也 能 够 执行 





式 后 ， 访 问 的 内 存 空 





lgdt 的 指令 格式 是 : 
这 48 位 内 存 数据 划分 为 两 前 


GDT 的 字 节 大 小 减 1。 


的 16 次 方 等 于 65536 字 节 
个 ， 即 GDT 中 可 容纳 8192 个 段 或 门 。 
保护 模式 中 的 段 描 述 符 虽 





此 看 上 去 此 指令 是 在 实 模式 下 执行 的 ， 但 实际 上 
es GDT， 但 
个 GDT 加 载 。 在 保护 模式 下 重新 换个 GDT 的 原 
位 于 1MB 之 内 。 根 据 操作 系统 的 实际 情 ; 
x 间 突破 了 1MB， 
lgdt48 位 内 存 数 据 。 

































































CE 
要 把 GDT 放 在 其 他 的 内 存 位 置 ， 











4-6 GDTR 寄存 器 


进入 保护 模式 后 ， 还 可 以 再 重新 换 


























可 以 将 GDT 放 在 合适 的 位 置 后 











了 重 








分 








中 前 16 位 是 GDT 以 字 
ee 由 于 











.每 个 描述 符 






























































段 描述 符 有 了 ， 






































节 为 单位 的 界限 值 
F GDT 的 大 小 是 16 位 二 进 
节 , 故 ,GDT 中 最 多 可 容纳 的 描述 


三 









































间 ， 所 以 GDT 只 能 
所 以 在 进入 保护 模 








新 加 载 进 来 。 


， 所 以 这 16 位 相当 于 
央 ， 其 表示 的 范围 是 2 














守 数量 是 65536/8=8192 





























有 然 看 上 去 又 怪异 又 复杂 ， 但 它 本 质 上 
尽管 它 不 像 实 模式 那样 直接 ， 即 段 的 大 小 统一 都 是 64KB， 段 基 址 代表 内 存 的 起 始 ， 
移 量 …… 但 它 代表 的 同样 也 是 一 段 内 存 。 
昔 述 符 表 也 有 了 ， 我 们 该 如 何 使 
段 寄 存 器 CS、DS、ES、FS、GS、SS， 本 



























































而 在 保护 模式 下 时 ， 
































中 得 到 了 内 存 段 的 起 始 

下 面 正式 介绍 下 选择 子 。 由 于 有 段 寄存 器 是 16 位 
用 来 存储 RPL， 即 请 求 特权 级 ， 可 以 表示 0、 
节 中 详尽 说 明 ， 此 处 可 以 理解 为 请 求 者 的 当前 特权 级 〈 不 到 
即 Table Indicator， a Co 9 
为 0 表示 在 GDT 中 索引 描述 符 ，TI 为 1 表示 在 LDT 中 索引 
在 GDT 中 索引 描述 符 。 前 
的 索引 值 就 是 GDT 中 的 下 标 。 选 择 子 结构 如 并 


















































择 子 的 第 2 位 是 TI 位， 


述 符 的 索引 值 ， 用 此 值 





| 于 段 基 址 已 经 存 入 了 段 
存 器 中 存 入 的 是 一 个 叫 作 选择 子 的 东西 
其 中 还 有 其 他 属性 咱们 一 会 再 说 。 用 此 索引 值 在 段 描 述 符 表 中 索引 相应 的 段 描 述 符 ，i 
包 址 和 段 男 限 值 等 相关 信息 。 


























八代 


段 措 述 符 与 内 存 段 的 关系 如 图 4-7 所 示 。 
面 我 们 引出 新 
下 时 ， 自 中 存储 的 是 段 


段 内 存 区 域 的 “身份 证 ”而 已 ， 
























































冯 

































































存 器 中 再 
。 选择 子 “基本 上 ”是 





选择 子 也 是 16 位 ， 
js 人 关于 RPL 我 
E 解 也 没关系 ， 

















偏 移 地 址 代表 段 内 偏 











的 概念 : 段 的 选择 子 。 

也 址 ， 即 内 存 段 的 起 始 地 址 。 
段 基 址 是 没有 意义 的 ,在 段 寄 
索引 值 ， 这 里 说 的 是 基本 上 ， 





































































































有 说 过 GDT oe 














这 样 ， 便 在 段 描述 符 


企 其 低 2 位 即 第 0 一 1 位 ， 
们 会 在 专门 讲 特权 级 的 章 
尺 为 在 本 章 中 它 不 重要 )。 在 选 
还 是 LDT 中 索引 描述 符 。TI 
es 
符 数组 ， 所 以 此 选择 子 中 



































由 于 选择 子 的 索引 值 部 分 是 13 位 ， 即 2 的 13 次 方 是 8192， 故 最 多 可 以 索引 8192 个 段 ， 这 和 GDT 


中 最 多 定义 8192 个 描述 符 是 吻合 的 。 























选择 子 的 作用 主要 是 确 
的 还 是 要 确定 段 的 基 




















也 址 。 


虽然 到 了 保护 模式 ， 但 IA32 为 


地 址 ”的 形式 。 保 护 模式 下 的 段 寄存 器 中 已 经 是 选择 子 














定 段 描述 符 ， 确定 描述 














架构 始终 脱离 不 了 内 存 分 段 ， 即 访问 内 存 必 














符 的 目的 ， 一 是 为 了 特权 级 、 界 限 等 安全 考虑 ， 最 主要 








:须要 用 “上 段 基 址 ， 段 内 偏 移 
子 ， 不 再 是 直接 的 段 基 址 。 段 基 址 在 段 描述 符 中 ， 用 
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第 4 章 保护 模式 X 门 









































给 出 的 选择 子 索 引 到 描述 符 后 ，CPU 自动 从 段 描 述 符 中 取出 段 基 址 ， 这 样 再 加 上 段 内 偏 移 地 址 ， 便 凑 成 
了 “上 段 基 址 : 段 内 偏 移 地 址 ”的 形式 。 






























































内 存 





描述 符 表 
段 描述 符 3 
段 描述 符 1 


入 
段 描述 符 0 
SS 15 站 0 


描述 符 索引 值 TI | RPL 
4 图 4~-7 段 描述 符 与 内 存 段 的 关系 4 图 4-8 选择 子 结构 


但 大 家 要 注意 ， 到 了 保护 模式 下 后 ， 由 于 已 经 是 32 位 地 址 线 和 32 位 寄存 器 啦 ， 任 意 一 寄存 器 都 能 够 
提供 32 位 地 址 ， 故 不 需要 再 将 段 基 址 乘 以 16 后 再 与 段 内 偏 移 地 址 相 加 啦 ， 直 接 用 选择 子 对 应 的 “ 段 描 述 
符 中 的 段 基 址 ”加 上 “ 段 内 偏 移 地 址 ”就 是 要 访问 的 内 存 地 址 。 

例如 选择 子 是 0x8， 将 其 加 载 到 ds 寄存 器 后 ， 访 问 ds: 0x9 这 样 的 内 存 ， 其 过 程 是 : 0x8 的 低 2 位 是 
RPL， 其 值 为 00。 第 2 是 TI， 其 值 0， 表 示 是 在 GDT 中 索引 段 描述 符 。 用 0x8 的 高 13 位 0x1 在 GDT 中 
索引 ， 也 就 是 GDT 中 的 第 1 个 段 描述 符 “GDT 中 第 0 个 段 描述 符 不 可 用 )。 假 设 第 1 个 段 描述 符 中 的 3 
个 段 基 址 部 分 , 其 值 为 0x1234。.CPU 将 0x1234 作为 段 基 址 , 与 段 内 偏 移 地 址 0x9 相 加 ,0x1234+0x9=0x123d。 
用 所 得 的 和 0x123d 作为 访 存 地 址 。 
值得 注意 的 是 上 面 括 号 中 提 到 了 GDT 中 的 第 0 个 段 描述 符 是 不 可 用 的 , 原因 是 定义 在 GDT 中 的 段 
述 符 是 要 用 选择 子 来 访问 的 ， 如 果 使 用 的 选择 子 忘 记 初 始 化 ， 选 择 子 的 值 便 会 是 0， 这 便 会 访问 到 第 0 个 
段 描述 符 。 为 了 避免 出 现 这 种 因 忘 记 初 始 化 选择 子 而 选择 到 第 0 个 段 描述 符 的 情况 ，GDT 中 的 第 0 个 段 
述 符 不 可 用 。 也 就 是 说 ， 若 选择 到 了 GDT 中 的 第 0 个 描述 符 ， 处 理 器 将 发 出 异常 。 

按理 说 有 全 局 就 要 有 局 部 , 还 真有 ,这 就 是 局 部 描述 符 表 , 叫 LDT,， Local Descriptor Table, 它 是 CPU 
厂商 为 在 硬件 一 级 原生 支持 多 任务 而 创造 的 表 ， 按 照 CPU 的 设想 ， 一 个 任务 对 应 一 个 LDT。 其 实在 现代 
操作 系统 中 很 少 有 用 LDT 的 ， 我 们 系统 中 也 未 用 LDT。 所 以 这 里 就 撒 带 着 说 一 下 ， 点 到 为 止 。 

CPU 厂商 建议 每 个 任务 的 私有 内 存 段 都 应 该 放 到 自己 的 段 描述 符 表 中 ， 该 表 就 是 LDT， 即 每 个 任务 
都 有 自己 的 LDT， 随 着 任务 切换 ， 也 要 切换 相应 任务 的 LDT。LDT 也 位 于 内 存 中 ， 其 地 址 需要 先 被 加 载 
到 某 个 寄存 器 后 ，CPU 才能 使 用 LDT， 该 寄存 器 是 LDTR， 即 LDT Register。 同 样 也 有 专门 的 指令 用 于 加 
载 LDT， 即 lldt。 以 后 每 切换 任务 时 ， 都 要 用 lldt 指令 重新 加 载 任务 的 私有 内 存 段 。 
回顾 一 下 段 描 述 符 中 的 type 字段 ， 其 中 LDT 为 系统 段 ， 换 句 话说 ，LDT 虽然 是 个 表 , 但 其 也 是 一 片 内 存 
区 域 ， 所 以 也 需要 用 个 描述 符 在 GDT 中 先 注册 。 段 描述 符 是 需要 用 选择 子 去 访问 的 。 故 ，lldt 的 指令 格式 为 : 

lldt 16 位 寄存 器 /16 位 内 存 
无 论 是 寄存 器 ， 还 是 内 存 ， 其 内 容 一 定 是 个 选择 子 ， 该 选择 子 用 来 在 GDT 中 索引 LDT 的 段 描述 符 。 
在 LDT 被 加 载 到 ldtr 寄存 器 后 ， 之 后 再 访问 某 个 段 时 ， 选 择 子 中 的 TI 位 若 为 1， 就 会 用 该 选择 子 中 
的 高 13 位 在 ldtr 寄存 器 所 指向 的 LDT 中 去 索引 相应 段 描述 符 。 

LDT 中 的 段 描述 符 和 GDT 中 的 一 样 ， 与 GDT 不 同 的 是 LDT 中 的 第 0 个 段 描 述 符 是 可 用 的 ， 因 为 提 
交 的 选择 子 中 的 TI 位 ，TI 位 用 于 指定 是 GDT， 还 是 LDT，TI 为 1 则 表示 在 LDT 中 索引 段 描述 符 ， 即 TI 
为 1 必然 是 经 过 显 式 初始 化 的 结果 ， 完 全 排除 了 忘记 初始 化 的 可 能 。 好 啦 ，LDT 就 说 到 这 ， 以 后 在 介绍 
TSS 时 还 会 说 一 些 LDT 的 内 容 。 

在 表 4-10 中 列 出 的 系统 段 ， 它 们 都 有 各 自 的 描述 符 ， 或 者 说 描述 符 结构 相同 ， 只 是 用 type 和 $ 字段 予以 区 
分 不 同 的 描述 符 。 任 何 描述 符 的 大 小 都 是 8 字 节 。 但 无 论 描 述 符 的 种 类 有 多 少 ， 它 们 的 高 32 位 中 的 第 8 一 12 字 
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节 内 容 都 是 不 变 的 ， 第 12 位 必须 是 S， 第 8 一 11 位 必须 为 type， 描 述 符 中 的 其 他 位 的 内 容 不 强制 要 求 。 这样“ 局 
部 ”格式 统一 ,便于 CPU 识别 段 类 型 。 虽 然 列 出 了 众多 系统 段 ， 但 很 多 都 不 是 在 全 局 描述 符 表 中 的 ， 如 中 断 门 、 
陷阱 门 、 任 务 门 等 都 是 在 中 断 描述 符 表 中 存在 的 ， 将 来 说 到 中 断 的 时 候 咱 们 再 展开 这 方面 内 容 。 


4.3.3 打开 A20 地 址 线 


还 记得 实 模式 下 的 wrap-around 吗 ? 也 就 是 地 址 回 绕 。 咱 们 一 起 来 复习 一 下 。 

实 模式 下 内 存 访问 是 采取 “ 段 基 址 : 段 内 偏 移 地 址 ”的 形式 ， 段 基 址 要 乘 以 16 后 再 加 上 段 内 偏 移 地 址 。 
实 模式 下 寄存 器 都 是 16 位 的 ， 如 果 段 基 址 和 有 段 内 偏 移 地 址 都 为 16 位 的 最 大 值 ， 即 0xFFFF: 0xFFFF， 最 大 
地 址 是 0xFFFFO+0xFFFF, 即 0x10FFEF。 由 于 实 模 式 下 的 地 址 线 是 20 位 ,最 大 寻 址 空间 是 1MB, 即 0x00000 一 
0xFFFFF。 超 出 1MB 内 存 的 部 分 在 逻辑 上 也 是 正常 的 ， 但 物理 内 存 中 却 没有 与 之 对 应 的 部 分 。 为 了 让 “上 段 
基 址 : 段 内 偏 移 地 址 ”策略 继续 可 用 ，CPU 采取 的 做 法 是 将 超过 1MB 的 部 分 自动 回 绕 到 0 地 址 ， 继 续 从 0 
地 址 开始 映射 。 相 当 于 把 地 址 对 1MB 求 模 。 超 过 1MB 多 余 出 来 的 内 存 被 称 为 高 端 内 存 区 HMA。 

这 种 地 址 回 绕 是 如 何 做 到 的 呢 ? 要 分 两 种 情况 分 别 讨论 啦 。 

对 于 只 有 20 位 地 址 线 的 CPU， 不 需要 任何 额外 操作 便 能 自动 实现 地 址 回 绕 。 









































































































































































































































































































































































































































地 址 (Address) 线 从 0 开始 编号 ， 在 8086/8088 中 ， 只 有 20 位 地 址 线 ， 即 A0 一 Al19。20 位 地 址 线 表 
示 的 内 存 是 2 的 20 次 方 ， 最 大 是 1MB， 即 0x0~0xFFFFF。 内 存 若 超 过 1MB， 是 需要 第 21 条 地 址 线 支 
持 的 。 所 以 说 ， 若 地 址 进位 到 1MB 以 上 ， 如 0x100000， 由 于 没有 第 21 位 地 址 线 ， 相 当 于 丢掉 了 进位 1， 
变 成 了 0x00000。 这 一 “缺陷 ”甚至 成 了 当时 很 多 程序 员 利 用 的 技巧 。 地 址 回 绕 如 图 4-9 所 示 。 

A A 
A 
也 址 输入 / 
/ 
/ 1 1 1 1 
| : 
相当 于 -一 < 
进位 丢弃 /一 (IO00000000000000000000 
A 图 4-9 地址 回 绕 


























对 于 80286 后 续 的 CPU， 通过 A20GATE 来 控制 A20 地 址 线 。 

CPU 发 展 到 了 80286 后 ， 虽 然 地 址 总 线 从 原来 的 20 位 发 展 到 了 24 位 ， 从 而 能 够 访问 的 内 存 范围 可 
达到 2 的 24 次 方 , 等 于 16MB。 但 任何 时 候 ，Intel 都 会 把 兼容 放 在 第 一 位 。80286 是 第 一 款 具 有 保护 模式 
的 CPU， 它 在 实 模式 下 时 ， 其 表现 也 应 该 和 8086/8088 一 模 一 样 。 按 照 兼容 的 要 求 ， 这 意味 着 80286 以 及 
后 续 CPU 的 实 模式 都 应 该 与 8086/8088 完全 一 样 ， 即 仍然 只 使 用 20 条 地 址 线 。 但 80286 有 24 条 地 址 线 ， 
即 A0~A23， 也 就 是 说 A20 地 址 线 是 开启 的 。 如 果 访 问 0x100000 一 0Oxl0FFEF 之 间 的 内 存 ， 系 统 将 直接 
访问 这 块 物理 内 存 ， 并 不 会 像 8086/8088 那样 回 绕 到 0。 

为 了 解决 此 问题 ，IBM 在 键盘 控制 器 上 的 一 些 输出 线 来 控制 第 21 根 地 址 线 (A20) 的 有 效 性 ， 故 被 
称 为 A20Gate。 

e 如 果 A20Gate 被 打开 ， 当 访问 到 0xl100000~0Oxl0FFEF 之 间 的 地 址 时 ，CPU 将 真正 访问 这 块 物理 内 存 。 

e 如 果 A20Gate 被 禁止 ， 当 访问 0x100000~0Oxl0FFEF 之 间 的 地 址 时 ，CPU 将 采用 8086/8088 的 地 址 回 绕 。 

上 面 描述 了 地 址 回 绕 的 原理 , 但 地 址 回 绕 是 为 了 兼容 8086/8088 的 实 模式 。 如 今 我 们 是 在 保护 模式 下 ， 
我 们 需要 突破 第 20 条 地 址 线 〈A20) 去 访问 更 大 的 内 存 空间 。 而 这 一 切 ， 只 有 关闭 了 地 址 回 绕 才能 实现 。 
而 关闭 地 址 回 绕 ， 就 是 上 面 所 说 的 打开 A20Gate。 
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说 了 半天 ， 








步骤 就 可 以 实现 啦 。 


in al, Ox92 
or al, 0000 0010B 
out Ox92, al 























































































































其 实 打 开 A20Gate 的 方式 是 极其 简单 的 ， 将 端口 0x92 的 第 





1 位 置 1 





就 可 以 了 ， 以 下 三 个 
































我 们 离 保护 模式 越 来 越 近 了 ,为 了 给 大 家 一 个 盼 涉 ， 剧 透 一 下 ， 其 实 我 们 距 32 位 地 址 空间 只 差 一 步 ， 
下 一 节 中 我 们 将 播 出 有 关内 容 ， 欢 迎 大 家 准时 收看 。 
4.3.4 保护 模式 的 开关 ，CRO 寄存 器 的 PE 位 

这 是 进入 模式 的 最 后 一 步 ， 也 就 是 第 三 步 。 这 一 步 过 后 ， 我 们 将 突破 1MB 内 存 的 束缚 ， 踏 入 广阔 4G 
的 天 空 ， 准 备 大 干 一 场 啦 。 

在 前 面 说 寄存 器 的 时 候 ， 有 讲 到 过 控制 寄存 器 系列 CRx。 控 制 寄 存 器 是 CPU 的 窗口 ， 既 可 以 用 来 展示 CPU 
的 内 部 状态 ， 也 可 用 于 控制 CPU 的 运行 机 制 。 这 次 我 们 要 用 到 的 是 CR0 寄存 器 。 更 准确 地 说 ， 我 们 要 用 到 CRO 
寄存 器 的 第 0 位 ， 即 PE 位 ，Protection Enable， 此 位 用 于 启用 保护 模式 ， 是 保护 模式 的 开关 ， 对 保护 模式 来 说 ， 




































































































































































































































































有 万 事 俱 备 只 欠 东 风 的 感觉 。 当 打开 此 位 后 ，CPU 才 控制 寄存 器 CRO 保留 位 
真正 进入 保护 模式 ， 所 以 这 是 进入 保护 模式 三 步 中 的 
最 后 一 步 。 图 4-10 所 示 是 32 位 CR0 全 貌 。 总 | | 4 国 ? 是 | 呈 | 全 | 总 | 营 | 
虽然 都 说 啦 目 前 只 需要 关注 PE 位 ， 但 考虑 到 31 30 29 28 9 18 17 16 15 6543 2 10 
一 些 和 我 一 样 有 强迫 症 的 同学 ， 我 还 是 把 CRO ! ^ 图 4-10 控制 寄存 器 CRO 
的 字段 全 列 出 来 啦 , 见 表 4-11, 描述 部 分 没有 换 成 对 应 的 中 文 , 老外 发 明 的 东西 还 是 用 原 汁 原味 的 英文 好 。 
表 4-11 控制 寄存 器 CRO 字段 
标 志 位 描 述 
PE Protection Enable 
MP Monitor coProcessor/Math Present 
EM Emulation 
TS Task Switched 
ET Extention Type 
NE Numeric Error 
WP Write Protect 
AM Alignment Mask 
NW Not Writethrough 
CD Cache Disable 
PG Paging 








PE 为 0 表示 在 实 模式 下 运行 ，PE 为 1 表示 在 保护 模式 下 运行 


例 代码 如 下 。 


1 mov eax, 
2 or eax, 
3 Tiov Gr0; 


全 全 





泊 


4.3.5 
如 今 我 们 已 
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第 3 行 是 将 eax 写 
好 啦 ， 进 入 保护 模式 的 条 价 


让 我 们 进 





cr0 
0x00000001 
eax 


第 1 行 代码 是 将 cr0 写 入 eax。 
第 2 行 代码 ， 通 


通过 或 运算 or 指 








口 














入 保护 模 陈 


























己 经 知道 如 何 进 入 保护 模式 了 ， 下面 











i 咱们 通过 


令 将 eax 的 第 0 位 置 1。 
cr0， 这 样 cr0 的 PE 位 便 为 1 了 。 
咱们 都 说 完 啦 。 好 入 都 没 大 





实践 ,， 





巴 以 上 知识 


。 所 以 ， 我 们 的 各 


口 母 - 窑 
\ 贝 牙 


E 务 是 将 此 位 置 1。 示 





代码 啦 ， 是 时 候 进入 保护 模式 大 干 一 场 啦 。 


穿 起 来 。 

















其 实在 前 面 讲述 保护 模式 下 的 指令 扩展 时 ， 就 已 经 “见识 ” 就 是 那个 文件 32push.S。 不 
过 此 文件 的 保护 模式 并 不 直观 ， 我 们 对 它 稍微 改造 一 下 ， 让 其 变 得 “可 见 ”…… 我 就 不 故弄玄虚 了 ， 其 实 
就 是 打印 一 些 字 符 ， 哈 哈 。 

上 正餐 之 前 ， 还 是 先 给 大 家 来 点 小 甜点 ， 有 些 相关 的 东 东 要 提前 和 大 家 交待 清楚 。 

保护 模式 是 在 loader.bin 中 进入 的 ， 除 了 源 程序 loader.S 要 更 新 外 ， 还 更 新 了 相关 的 2 个 文件 。 
第 一 个 是 mbrS， 由 于 loaderbin 超过 了 512 字 节 ， 所 以 我 们 要 把 mbr.S 中 加 载 loaderbin 的 读 入 扇 
数 增 大 ， 目 前 它 是 1 扇 区 ， 为 了 避免 将 来 再 次 修改 ， 直 接 改 成 读 入 4 扇 区 。 见 代码 4-1 的 52 行 。 


代码 4-1 (project/c4/a/boot/mbr.S ) 
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… 略 

52 mov cx,4 ; 待 读 入 的 扇 区 数 

53 call rd disk m 16 ; 以 下 读 取 程序 的 起 始 部 分 ( 一 个 扇 区 ) 
… 略 

















loader.bin 是 由 mbrbin 中 的 函数 rd_disk_m_16 负责 加 载 的 ， 其 参数 “ 读 入 扇 区 数 ” 存 入 cx 寄存 器 中 。 
所 以 ， 如 果 loaderbin 的 大 小 超过 mbr 所 读 取 的 扇 区 数 ， 切 记 一 定 要 修改 mbrS 中 函数 rd_disk_m_16 的 读 
入 扇 区 数 ， 如 代码 4-2 中 的 第 52 行 。 如 果 忘 记 的 话 ， 由 于 被 加 载 的 程序 不 全 ，CPU 在 执行 时 就 会 执行 到 
一 些 黄 名 其 妙 的 代码 (内 存 中 的 数据 “恰好 ” a ， 虽 然 用 了 “恰好 ” 但 这 种 情况 很 普遍 ， 一 
E01 二 进 制 串 ， 总 能 贞 猫 磁 上 和 死 耗 子 成 为 某 个 指令 )， 碍 看 反 汇 编 代 码 ， 根 本 就 不 是 自己 写 的 指令 。 我 经 
避 因 入 翅 记 修 改 这 个 参数 而 瞎 折 腾 好 入 ， ， 原因 时 都 是 热泪 盔 眶 ， 甚 至 满 地 打 深 儿 …… 哈哈 ， 您 懂 
的 ， 当 程序 调 通 时 ， 很 多 程序 员 都 是 喜 大 普 奔 的 样子 。 

另 一 个 要 更 新 的 文件 是 include/boot,inc， 里 面 是 一 些 配置 信息 ，loaderS 中 用 到 的 配置 都 是 定义 在 
boot.inc 中 的 符号 ， 见 代码 4-2。 


代码 4-2 (project/c4/a/bootinclude/boot.inc ) 
二 二 loader 和 kernel “ ---------- 




























































































































































































IR 






























































2 

3 LOADER BASE ADDR equ 0x900 
4 LOADER START SECTOR equ 0x2 
5 





6 gadt 描述 符 属性 ------------- 
7 DESC G 4K equ 1 00000000000000000000000b 
8 DESC D 32 equ 1 0000000000000000000000b 
9 






































DESC_ equ 0_000000000000000000000b 
; 64 位 代码 标记 ， 此 处 标记 为 0 便 可 
10 DESC AVL equ 0_00000000000000000000b 
; CPU 不 用 此 位 , 暂 置 为 0 
11 DESC LIMIT CODE2 equ 1111 0000000000000000b 
12 DESC LIMIT DATA2 equ DESC LIMIT CODE2 
13 DESC LIMIT VIDEO2 equ 0000 000000000000000b 
14 DESC P equ 1 000000000000000b 
15 DESC DPL 0 equ 00 0000000000000b 
16 DESC DPL 1 equ 01 _ 0000000000000b 
17 DESC DPL 2 equ 10 0000000000000b 
18 DESC DPL 3 equ 11 0000000000000b 
19 DESC S CODE equ 1_000000000000b 
20 DESC S DATA equ DESC_S_CODE 
21 DESC S sys equ 0 000000000000b 
22 DESC TYPE CODE equ 1000 00000000b 








;x=1, c=0, r=0,a=0 代码 段 是 可 执行 的 ， 非 一 致 性 ， 不 可 读 ， 已 访问 位 a 清 0 














23DESC_TYPE DATA 0010 00000000b 
;x=0, e=0, w=1, a=0 数据 段 是 不 可 执行 的 ， 向 上 扩展 的 ， 可 写 ， 已 访问 位 a 清 0 
24 


25 DESC CODE HIGH4 equ (0x00 << 24) + DESC G 4K + DESC D 32 + \ 
DESC L + DESC AVL + DESC LIMIT CODE2 + \ 

DESC P+DESC DPL 0 + DESC S CODE +\ 

DESC TYPE CODE + 0x00 





26 DESC DATA HIGH4 equ (0x00 << 24) + DESC G 4K + DESC D 32 +\ 
DESC L + DESC AVL + DESC LIMIT DATA2 + \ 
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DESC P + DESC DPL 0 + DESC S DATA + \ 
DESC_ TYPE DATA + 0x00 


27 DESC VIDEO HIGH4 equ (0x00 << 24) + DESC G 4K + DESC D 32 +\ 
DESC L + DESC AVL + DESC LIMIT VIDEO2 + DESC P + \ 
DESC DPL 0 + DESC S DATA + DESC TYPE D ATA + 0x00 


29'13 = 选 摊子 属性 








33 RPL3 equ 11b 
34 TI_GDT equ 000b 
35. TI TDT equ 100b 


代码 4-2 中 ， 主 要 是 新 增 段 描述 符 的 属性 及 选择 子 ， 都 是 以 宏 的 方式 实现 的 。 
equ 是 nasm 提供 的 伪 指 令 ， 意 为 equal， 即 等 于 ,用 于 给 表达 式 起 个 意义 更 明确 的 符号 名 ， 其 指令 格式 是 : 
符号 名 称 equ 表达 式 

ij 述 符 中 的 各 个 字段 都 是 由 equ 来 定义 的 ， 符 号 名 一 律 采 用 “DESC 字段 名 _ 字 段 相关 信息 ”的 形式 。 
例如 符号 DESC_G_4K, 这 就 表示 描述 符 的 G 位 为 4K 粒度 , 其 值 等 于 (equ)1_00000000000000000000000b。 
其 中 结尾 的 b 表示 二 进 制 , 之 所 以 这 样 用 二 进 制 写 属性 位 ， 就 是 为 了 在 格式 中 的 位 置 容易 对 比 ， 最 左边 的 
1 正好 处 在 第 23 位 ， 也 就 是 段 描述 符 中 G 的 位 次 。1 右边 的 字符 “_” 没 有 特别 的 意义 ， 只 是 我 人 为 加 上 
去 的 ， 这 样 人 眼 “ 看 ”起 来 显得 比较 清晰 明朗 ，nasm 编译 器 做 得 很 人 性 化 ， 为 了 人 看 得 方便 ， 它 特意 支 
持 这 种 分 隔 符 的 写法 ， 在 编译 阶段 会 忽略 此 分 隔 符 。 也 许 type 字段 的 定义 更 有 说 服 力 ， 见 第 22 行 : 
“DESC_ TYPE CODE equ 1000_00000000b”， 这 是 定义 了 一 个 代码 段 的 type 字段 ， 右 边 的 二 进 制 串 的 
高 4 位 就 是 type 中 的 4 位 ， 右 边 用 ' ' 字 符 来 分 隔 ， 确 实 直观 了 很 多 ， 如 果 您 忘记 了 type 中 各 位 的 意义 ， 

赶紧 回去 翻 看 段 描述 符 格 式 。 此 定义 的 意义 在 注释 中 已 写 得 很 清楚 了 : x=1，c=0，r=0，a=0 代码 段 是 可 
执行 的 ， 非 一 致 性 ， 不 可 读 ， 已 访问 位 a 清 0。 

在 保护 模式 中 ， 我 们 还 是 学 习 Linux 等 主流 操作 系统 的 内 存 段 ， 用 平坦 模型 。 平 坦 模型 之 前 已 经 提 到 
过 了 ， 就 是 整个 内 存 都 在 一 个 段 里 ， 不 用 再 像 实 模式 那样 用 切换 段 基 址 的 方式 访问 整个 地 址 空间 。 在 32 
位 保护 模式 中 ， 寻 址 空间 是 4G， 所 以 ， 平 坦 模型 在 我 们 定义 的 描述 符 中 ， 段 基 址 是 0， 段 界 限 * 粒 度 等 于 
4G。 粒 度 我 们 选 的 是 4k， 故 段 界 限 是 0xFFFFF。 下 面 以 第 25 行 的 段 定 义 为 例 。 

第 25 行 的 PESC_ CODE_ HIGH4， 就 是 定义 了 代码 段 的 高 4 字 节 。eqnu 后 面 那 一 串 加 法 表达 式 ， 就 是 在 凑 
足 段 描述 符 这 高 4 字 节 内 容 。 其 中 〈0x00 << 24) 表示 “ 段 基 址 24~31” 字 段 ， 该 字段 位 于 段 描述 符 高 4 字 节 
中 的 第 24~31 位 ,由 于 平 垣 模式 段 基 址 是 0, 所 以 咱们 用 0 偏 移 24 位 填充 该 字段 。 当 然 这 只 是 一 部 分 段 基 址 ， 
段 基 址 在 8 字 节 的 段 描述 符 中 存在 3 处 ， 它 们 在 每 处 都 会 是 0。 继 续 看 ，DESC _G 4K 表示 4k 的 粒度 ， 其 定 
义 刚 才 说 过 啦 。 DESC_D_32 表示 描述 符 中 的 D/B 字段 , 对 代码 段 来 说 是 D 位 , 在 此 表示 32 位 操作 数 .DESC 工 
表示 上 段 描 述 符 中 的 LL 位， 其 值 见 代码 4-2 的 第 9 行 ， 为 0， 表示 为 32 位 代码 段 。DESC _AVL 为 0， 前 面 介绍 
过 啦 ， 此 位 没 实际 意义 ， 是 留 给 操作 系统 用 的 。DESC LIMIT_ CODE2 是 代码 段 的 段 界限 的 第 2 部 分 〈 段 界限 
的 第 1 部 分 在 段 描 述 符 的 低 4 字 节 中 )， 此 处 值 为 1111b， 它 与 段 界限 的 第 1 部 分 将 组 成 20 个 二 进 制 1， 即 总 
共 的 段 界限 将 是 0xXFFFFF。DESC_P 表示 上 段 存在 。DESC_DPL 0 表示 该 段 描述 符 对 应 的 内 存 段 的 特权 级 是 0， 
即 最 高 特权 级 。 当 CPU 在 该 段 上 运行 时 ,将 有 至 高 无 上 的 特权 。DESC_S_CODE 是 代码 段 的 $ 位 ， 此 值 为 1， 
表示 它 是 个 普通 的 内 存 段 ， 不 是 系统 段 。DESC_TYPE_CODE 刚才 刚 说 过 ， 意 义 为 x=1，c=0，r=0，a=0 ， 即 
代码 段 是 可 执行 的 ， 非 一 致 性 ， 不 可 读 ， 已 访问 位 a 清 0。0x00 是 段 基 址 的 第 16 一 23 位 ， 位 于 段 描述 符 高 4 
字 节 的 起 始 8 位 ， 如 前 所 述 ， 由 于 是 平坦 模型 ， 所 以 段 基 址 的 任意 部 分 都 是 0。 
第 29 一 35 行 是 定义 选择 子 属性 ， 字 面 上 很 好 理解 ， 不 多 说 了 。 这 里 并 没有 把 选择 子 定义 到 这 里 ， 
为 选择 子 中 的 高 13 位 是 用 来 索引 有 段 描述 符 的 ， 它 的 值 取决 于 段 描 述 符 的 具体 位 置 ， 而 段 描述 符 我 们 在 
loader.S 中 定义 ， 所 以 最 终 的 选择 子 是 在 loaderS 中 定义 的 ， 这 样 修改 段 描 述 符 的 位 置 时 ， 顺 便 就 把 选择 
子 修 改 了 ， 和 否则 放 在 多 个 文件 中 容易 遗漏 。 

介绍 完了 相关 文件 ,这 下 可 以 上 正餐 啦 , 下 面 是 loader.S 文件 , 让 我 们 看 看 它 是 怎么 进入 保护 模式 的 ， 
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上 代码 。 
代码 4-3 (project/c4/a/boot/loader.S ) 

a Sinclude "boot.inc" 

2 section loader vstart=LOADER BASE ADDR 

3 LOADER STACK TOP equ LOADER BASE ADDR 

4 jmp loader start 

5 

6 ;构建 gqt 及 其 内 部 的 描述 符 

3 GDT_BASE: dd 0x00000000 

8 dq 0x00000000 

9 
10 CODE DESC: dd Ox0000FFFF 
开征 dd DESC CODE HIGH4 
12 
13 DATA STACK DESC: dd Ox0000FFFF 
14 dd DESC DATA HIGH4 
15 
16 VIDEO DESC: dd Ox80000007;1limit= (0xbffff-0xb8000) /4k=0x7 
7 dd DESC_VIDEO_HIGH4 ;此 时 dpl 为 0 
18 


19 GDT_ SIZE equ $ - GDT BASE 
20 GDT LIMIT equ GDT SIZE - 1 
21 times 60 dq 0 ; 此 处 预 留 60 个 描述 符 的 空位 
22 SELECTOR_CODE equ (0x0001<<3) + TI_GDT + RPL0 
; 相当 于 (CODE_DESC - GDT BASE)/8 + TI_GDT + RPL0 

































































































































































































































































23 SELECTOR DATA equ (0x0002<<3) + TI_GDT + RPL0 ; 同上 
24 SELECTOR VIDEO equ (0x0003<<3) + TI_GDT + RPLO ; 同上 
25 
26 ; 以 下 是 gdt 的 指针 ， 前 2 字 节 是 gqt 界限 ， 后 4 字 节 是 gdt 起 始 地 址 
27 
28 gdt ptr dw GDT LIMIT 
29 dd GDT BASE 
30 loadermsg db '2 loader in real.' 
31 
32 loader start: 
33 
94 二 二 二 莹 二 生生 二 二 二 二 二 二 生 过 二 二 六 二 二 二 攻 汪 二 生生 关 二 车 生 全 二 二 基 生 和 二 二 二 车 二 二 二 二 三 兰 二 革 二 生 二 站 全 三 三 
35 ;INT 0x10 功能 号 :0x13 功能 描述 :打印 字符 串 
和 和 
37 ;输入 : 
38 ;AH 子 功能 号 =13H 
39 ;BH = 页 码 
40 ;BL = 属性 ( 若 AL=00H 或 01H) 
41 7; CX= 字 符 串 长 度 
42 ; (DH、DL) = 坐标 ( 行 、 列 ) 
43 ;ES:BP= 字 符 串 地 址 
44 ;AL= 显 示 输 出 方式 
45 ; 0 一 一 字符 串 中 只 含 显示 字符 ， 其 显示 属性 在 BL 中 
;显示 后 ， 光 标 位 置 不 变 
46 ; 1 一 一 字符 串 中 只 含 显 示 字 符 ， 其 显示 属性 在 BL 中 
;显示 后 ， 光 标 位 置 改变 
47 ; ”2 一 一 字符 串 中 含 显 示 字 符 和 显示 属性 。 显 示 后 ， 光 标 位 置 不 变 
48 ; 3 一 一 字符 旦 中 含 显 5 字符 和 显示 属性 。 亚 沙 癌 ， 光 示 位 改变 
49 ;无 返回 值 
50 mov sp, LOADER BASE ADDR 
5 了 1 mov bp, loadermsg ; ES:BP = 字符 串 地 址 
52 mov cx, 17 ; CX = 字符 串 长 度 
53 mov ax, 0x1301 ; AH = 13, AL = 01h 
54 mov bx, Ox001f ; 页 号 为 0 (BH = 0) 蓝 底 粉 红字 (BL = 1fh) 
55 mov dx, Ox1800 
56 int 0x10 ; 10h 号 中 断 
SY 
58 ; -------------------- 准备 进入 保护 模式 一 -一 -一 一- 一 一- 一 一- 一- 一- 
59 ;1 打开 A20 
60 ;2 加 载 gat 
61 ;3 将 cr0 的 pe 位 置 1 
62 
63 
64 ;一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 打开 A20 一 -一 -一 一 -一 一 一 一 一 一 一 一 
65 in alr0x92 
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Im 
wn 





6 or al,0000_0010B 

7 out Ox92,al 

8 

9 ;一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 加 载 GDT 一- 一 一 -一 一 
0 lgdt [gdt ptr] 

1 

2 

3 二 cr0 第 0 位 置 1 ---------------- 
4 mov eax, cr0 

5 or eax, 0x00000001 

6 mov cr0, eax 

7 

8 jmp dword SELECTOR CODE:p mode start ; 刷新 流水 线 
9 

0 

TSiEs 2 

2 p mode start: 

3 mov ax, SELECTOR DATA 

4 mov ds, ax 

2 mov es, ax 

6 mov ss, ax 

7 mov esp, LOADER STACK _ TOP 

8 mov ax, SELECTOR VIDEO 

9 mov gs, ax 

0 

mov byte [gs:160], 'P' 

2 

3 jmp $ 











代码 不 到 100 行 


点 给 大 家 介绍 下 。 











， 里 面 的 注释 还 是 比较 详尽 的 ， 基 本 上 能 看 懂 ， 









































前 2 行 不 用 多 说 了 ， 和 之 前 版 本 的 loader 差不多 。 








第 3 行 “LOADER_STACK_TOP equLOADER_BASE_ ADDR”， 这 个 LOADER_STACK_TOP 是 用 于 














所 以 就 不 逐 行 解释 了 ， 下 面 我 就 部 分 

















loader 在 保护 模式 下 的 栈 , 它 等 于 LOADER BASE ADDR， 其实 这 是 loader 在 实 模 式 下 时 的 栈 指针 地 址 。 


只 不 过 进入 保护 模式 后 ， 咱 们 得 为 保护 模式 下 的 esp 初始 化 ， 所 以 用 了 相同 的 内 存 地 址 作为 栈 顶 。 
LOADER BASE ADDR 的 值 是 0x900， 这 是 loader 被 加 载 到 内 存 : 


全 局 描述 符 表 GDT 只 是 一 片 内 存 区 域 ， 里 面 每 隔 8 字 节 便 是 一 个 表 项 ， 即 段 描述 符 。 我 们 这 里 定义 段 描述 


符 的 
如 果 














方式 很 简单 直接 ， 
























































的 位 置 ， 在 此 地 址 之 下 便 是 栈 。 





























































































































Re 


是 将 描述 符 拆 成 高 4 字 节 和 低 字 节 两 部 分 ， 分 别 定义 。 这 不 是 定义 段 描述 符 的 固定 方式 ， 






























































您 愿意 也 可 以 直接 定义 8 字 节 的 数据 , 甚至 也 可 用 两 两 字 节 的 方式 去 拼 段 描述 符 , 风格 不 限 , 纯 属 个 人 喜好 。 





























咱们 

















J 
D， 








高 于 





述 符 没 
DATA STACK_DESC、 显 存 段 描述 符 VIDEO_DESC， 它 1 
昔 述 符 的 大 小 。 别 忘记 了 ， 我 们 前 面 说 过 ，GDT 中 的 第 0 个 描述 符 不 可 用 ， 所 以 第 7 一 8 行 ， 直 接 将 段 描 
述 符 的 高 4 字 节 和 低 4 字 节 ， 分 别 用 dd 定义 为 0。 
























































这 里 用 的 是 dd 指令 


上 面 的 dd 所 定义 的 数据 地 址 ， 也 就 是 说 ， 上 面 的 dd 是 定义 的 段 描 ; 
的 高 4 字 节 。 话 说 我 都 觉得 有 点 喝 号 了 ， 感 觉 说 再 
第 6 一 17 行 是 在 构建 全 局 描述 符 表 , 并 直接 在 里 面 填充 段 描述 符 
所 在 的 地 址 。 这 里 我 们 事先 定义 了 3 个 有 用 的 段 描述 符 ， 注 意 啦 ， 我 说 的 是 “有 用 的 ” 因为 第 0 个 段 描 
] 。 从 第 1 个 到 第 3 个 ， 分 别 是 代码 段 描述 符 CODE DESC、 数 据 段 和 栈 段 描述 符 
门 三 个 之 间 都 是 间隔 8 字 节 大 小 ， 也 就 是 每 个 段 



























































来 定义 它们 的 ，dd 是 伪 指 令 ， 意 为 define double-word， 即 定义 双 字 变量 ， 一 个 字 是 2 
所 以 双 字 就 是 4 字 节 数 据 。 程 序 编译 后 的 地 址 是 从 上 到 下 越 来 越 高 的 ， 所 以 ， 下 面 用 dd 定义 的 数据 地 址 要 





































































































































































































述 符 的 低 4 字 节 ， 下 面 的 dd 是 段 描述 符 
得 没 法 再 清楚 了 ， 写 书 真 地 不 容易 啊 ， 总 怕 说 得 不 清楚 。 












































.GDT 的 起 始 地 址 是 标号 GDT_BASE 










































































段 描述 符 的 低 4 


















































字 贡 还 是 比较 容易 定义 的 ， 








的 低 2 字 节 是 段 界 限 的 0 一 15 位 , 高 2 字 节 是 段 基 址 















































的 0~-15 位 。 拿 第 10~11 行 的 段 描述 符 CODE DESC 举例 ， 第 1 个 “dd 0x0000FFFF”， 这 是 段 描述 符 的 
低 4 字 节 。 其 中 低 2 字 节 的 FFFF 是 段 界限 的 第 0~15 位 ， 高 2 字 节 的 0000 是 段 基 址 的 第 0 一 15 位 。 忘 


记 的 











话 ， 赶 紧 参 看 图 
段 描述 符 的 高 4 


















































4-5 段 描述 符 的 格式 。 
字 节 相对 麻烦 一 些 , 所 以 在 boot.inc 中 直接 将 段 
























































i 述 符 的 高 4 位 提前 定义 好 ,到 loader.S 























中 直接 用 就 行 啦 。 例 如 第 11 行 的 dd DESC CODE HIGH4， 这 就 是 在 定义 代码 段 描述 符 的 高 4 字 节 。 


162 
































DESC_CODE _HIGH4 定义 在 代码 4-2 的 boot.inc 中 ， 
DATA STACK_DESC 是 数据 段 和 栈 段 的 段 描述 


























前 面 在 说 boot.inc 时 已 经 


























符 


























这 当然 是 可 以 的 ， 因 为 栈 段 也 是 数据 段 。 其 定义 




















展 的 , 数据 段 是 向 上 扩展 的 , 一 个 段 描述 符 只 能 定义 
要 么 是 1〈 向 下 扩展 )。 栈 也 能 用 向 上 扩展 的 数据 段 




















Est 


改 









































按照 数据 段 
么 的 ， 只 有 
令 的 作用 ， 和 段 描述 符 的 扩展 方向 无 关 ， 此 扩 










































































的 规则 来 检查 了 。 段 描述 符 中 的 各 字段 只 是 用 来 供 
j 此 段 的 人 才 知 道 。 栈 段 向 下 扩展 ， 是 指 栈 指针 esp 指向 的 地 址 逐渐 减 小 ， 不 过 那 是 push 指 


展 方向 是 用 来 配合 段 界限 的 ，CPU 在 检查 段 









































合法 性 时 ， 就 需要 结合 扩展 方向 和 段 界 限 来 判断 。 而 
更 容易 。 我 们 还 是 挑 简单 的 来 ， 直 接 用 










































































且 ， 














下 面 说 说 显存 段 
本 模式 显示 适配器 的 内 



























































我 们 只 支持 文本 模式 的 输出 ， 所 以 为 J 
本 模式 的 起 始 地 址 0xb8000， 段 大 小 为 
/4k=7。 有 具体 见 第 16 一 17 行 ， 这 里 不 再 


A 


























多 说 ， 大 家 对 照 着 段 描述 符 的 格式 验证 




















向 上 扩展 的 数据 段 做 栈 段 ， 比 用 
普通 的 数据 段 做 栈 段 ， 所 以 type 中 的 e 为 0。 

昔 述 符 VIDEO_DESC。 还 记得 实 模式 下 的 内 存 布局 吗 ? 赶紧 看 看 表 1-1, 其 中 | 
存 地 址 是 0xb8000~0xbffff， 内 存 地 址 0xc0000 显示 适配器 
































条 


载 GDT 做 准备 。 


AAA 





























过 这 个 元 长 的 表达 式 啦 。 











我 们 这 里 数据 段 和 栈 段 共同 使 用 一 个 段 描 述 符 ， 

的 原理 和 CODE_DESC 一 样 。 按 理 说 ， 栈 应 该 是 向 下 扩 
种 扩展 方向 , type 字段 中 的 e 要 么 是 0( 向 上 扩展 )， 
吗 ? 当然 可 以 ， 只 不 过 在 这 种 情况 下 ， 栈 段 的 段 界 限 
CPU 检查 的 ，CPU 不 知道 此 段 是 用 来 干 什 























内 偏 移 地 址 的 
J 下 扩展 的 段 








1 
口 



































于 文 
BIOS 所 在 区 域 。 由 于 









































方便 显存 操作 ， 显 存 段 不 采用 平坦 模型 。 我们 直接 把 段 基 址 置 为 文 
Oxbffff-Oxb8000=0x7fff， 段 粒度 为 4k， 因 而 段 界 限 limit 等 于 0x7fff 


o 


19 一 20 行 ， 先 是 通过 地 址 差 来 获得 GDT 的 大 小 ， 进 而 用 GDT 大 小 减 1 得 到 了 段 界限 ， 这 是 为 加 

















朱 
续 塞 中 
4 字 ， 即 8 字 节 。 所 以 用 times 60 dq 0 提前 预 留 60 


















































21 行 纯粹 是 为 了 将 来 往 GDT 中 添加 其 他 描述 符 ， 提 前 保留 空间 而 
断 描述 符 表 IDT 和 任务 状态 段 TSS 描述 符 。dq 上 





Lo 























人 























以 后 我 们 还 要 往 GDT 中 继 
来 定义 了 8 字 节 数据 ， 即 define quad-word， 定 义 
i 述 符 空位 。 其 实 也 不 用 保留 那么 多 ， 就 当 是 为 了 








方便 扩展 吧 ， 万 一 哪 天 用 到 了 就 省 事 了 。 哦 ，times 是 nasm 提供 的 伪 指 令 ， 用 来 重复 执行 tmes 后 面 的 表 





达 式 ， 相 当 于 是 个 循环 ， 
times 循环 次 数 表 达 式 
第 22 一 24 行 是 在 构建 代码 段 、 数 据 段 、 显 存 段 
































的 选择 子 ， 按 照 图 





4-8 选择 子 的 格式 来 构造 。 有 没有 





























疑问 , 哎 ? 怎么 没有 栈 段 的 选择 子 。 有 啊 ， 其 实用 的 



























































就 是 数据 段 选 择 子 ， 项 


























为 数据 段 和 栈 段 是 同一 个 段 描 


只 不 过 “直接 ”执行 此 循环 的 不 是 CPU， 而 是 编译 器 nasm。 指 令 格式 是 : 











局 描述 符 表 GDT 的 指针 ， 此 指针 是 lgdt 加 载 GDT 到 gdtr 寄存 器 时 























的 ， 还 记 








这 48 位 内 存 数据 的 前 16 位 是 GDT 以 字 节 为 单位 的 界限 值 ， 也 就 是 GDT 大 小 减 1。 后 32 位 是 GDT 

















述 符 。 一 会 儿 在 加 载 ss 段 寄 存 器 选择 子 的 时 候 ， 大 家 就 清楚 了 。 
第 28 一 29 行 是 定义 全 

得 lgdt 指令 的 格式 吗 ? 
lgdt48 位 内 存 数据 

的 起 始 地 址 。 
第 30 行 就 是 定义 个 字符 串 ， 用 来 “显示 ”一 下 























是 个 告别 吧 。 





的 参数 。“2 loader in real.” 的 长 度 是 17。 
第 55 行 的 “mov dx， 0x1800”， 上 有 


























real.” 将 出 现在 最 后 一 行 的 行 首 。 














(1) 打开 A20 地 址 线 。 
(2) 在 gdtr 寄存 器 中 加 载 GDT 的 地 址 及 偏 移 量 
(3) 将 cr0 寄存 器 的 pe 位 置 1。 

其 中 第 (2) 步 ， 也 就 是 70 行 的 “lgdt [gdt_ptr]”， 





























于 在 文本 模式 下 的 行 数 是 25 行 ， 即 0 一 24 行 ， 所 以 0x18 的 十 进 








咱们 要 进入 保护 模式 了 。 其 实 它 还 是 在 实 模式 下 打印 





的 还 是 BIOS 中 断 ， 此 中 断 在 MBR 中 已 经 介绍 过 啦 。 以 后 咱们 就 不 用 再 BIOS : 


























断 了 ， 这 次 就 当 














第 $2 行 的 BIOS 调用 中 ， 利 用 int 0x10 打印 字符 串 的 功能 ，cx 寄存 器 是 字符 串 的 长 度 ， 这 是 int 0x10 


中 行 数 dh 为 0x18， 列 数 dl 为 0x00。 这 也 是 int 0x10 的 参数 。 由 











第 58 一 76 行 是 进入 保护 模式 的 三 个 步 又。 分 别 如 下 。 





(界限 值 )。 


























gdt_ptr 是 前 国 





判 为 24， 即 最 后 


已经 介绍 过 的 GDT 地 址 指针 变量 ， 划 


行 ， 所 以 ,“2 loader in 









































的 前 16 位 是 GDT 界限 值 ， 后 32 位 是 GDT 的 起 始 地 址 。gdt_ptr 本 身 是 个 地 址 ， 所 以 要 用 中 括号 [] 括 起 来 ， 表 






































示 在 地 址 处 取 值 。 该 值 才 是 lgdt 的 参数 。 此 指令 执行 完 后 ，GDT 就 加 载 成 功 啦 ， 其 中 的 描述 符 如 图 4-11 所 示 。 











<bochs:5> info gdt 

Global Descriptor Table (base=0xc0000900, limit=31) 

GDT[Ox00]=??? descriptor hi=0x00000000, lo=0x00000000 

GDT[Ox01]=Code segment, base=Qx00000000, limit=Qxffffffff, Execute-Only 
， Non-Conforming, Accessed, 32-bit 

GDT[Ox02]=Data segment, base=Qx00000000, limit=Qxffffffff, Read/Write, 


Accessed 

GDT[OQx03]=Data segment, base=0QxcO0b8000, limit=OxQ0007fff, Read/Write, 
Accessed 

You can List individuaL entries with "info gdt [NUM]” or groups with “1 
nfo gdt [NUM] [NUM]' 














4 图 4-11 ”GDT 中 的 描述 符 

































































这 里 面 只 列 出 了 4 个 段 描述 符 ， 即 0x00~~0x03。 这 里 只 列 出 4 个 ， 并 不 是 因为 CPU 知道 咱们 定义 了 


































































































4 个 描述 符 ，CPU 并 不 知道 GDT 中 哪些 描述 符 是 咱们 定义 的 ， 内 存 中 的 随机 值 也 许 会 让 某 些 空 描述 符 恰 
好 凌 成 正确 的 描述 符 。 之 所 以 列 出 了 咱们 定义 的 全 部 描述 符 ， 是 因为 加 载 时 ， 参 数 的 前 16 位 是 GDT 








































































































界限 值 ， 是 它 来 告诉 CPU 只 显示 (界限 值 +1/ 段 描述 符 大 小 8 字 节 ) 个 描述 符 ， 所 以 段 描 述 
一 定 要 保证 它们 在 GDT 中 是 连续 的 。 







































































门 ， 此 位 相当 于 保护 模式 的 开关 。 图 4-12 所 示 是 启用 PE 位 的 前 后 对 比 。 
Ee pg CD NW ac wp ne ET ts em mp[pe | PE 位 初 值 为 0 


CR2=page fault laddr=0x00000000 
[CR3=0x0000000000009 
PCD=page-level cache disable=0 
PWT=page-level write-through=0 
ICR4=0x00000000: smap smep osxsave pcid fsgsbase smx vmx osxmmexcpt osfxsr pce pge mce pae 











lme sce 


以 下 三 步 将 CR0 寡 存 器 PE 位 置 为 1 


(0) [Oo GE 0000:0b39 (unk. ctxt): mov eax，cr9 Hi AL) 


: Or eax, OQx00000001 ;) 6683c801 


: mov CrO, eax ; 9f22c0 





ext at t=17843185 
(9) [69x9600060006b43] 66000:690609b43 (unk. ctxt): jmp far 0008:0b48 ; ea480b0800 


<bochs:8> creg \ 
CRe=0x60000011: pg CD NW ac wp ne ET ts em mp PE | PE 位 现 为 1 
CR2=page fault Laddr=0x00000000 
CR3=0x000000000000 
PCD=page-level cache disable=0 
PWT=page-level write-through=0 
ICR4=0x00000000: smap smep osxsave pcid fsgsbase smx vmx osxmmexcpt osfxsr pce pge mce pae 
pse de tsd pvi vme 
EFER=0x00000000: ffxsr nxe lma lme sce 
<bochs:9> 








4 图 4-12 CR0 的 PE 位 















































符 在 定义 时 ， 





第 74 一 76 行 ， 也 就 是 上 面 进入 保护 模式 的 第 (3) 步 ， 将 PE 位置 1 后， 从 此 便 进入 了 保护 模式 的 大 


如 图 4-12 所 示 ，creg 是 bochs 中 用 来 查看 控制 寄存 器 的 命令 。 在 bochs 中 ， 控 制 寄存 器 和 状态 寄存 器 

















中 的 相应 位 若 为 1，bochs 会 将 该 名 称 以 大 写 来 表示 。 所 以 ， 在 执行 中 间 框 框 中 的 三 个 步骤 之 前 ，cr0 寄存 
































的 一 位 等 于 4 





器 的 值 为 0x60000010，pe 位 是 0， 名 称 是 小 写 。 注 意 啦 ， 寄 存 器 的 值 是 十 六 进 制 的 ， 其 : 
位 二 进 制 。 右 边 第 2 位 的 1 是 CR0 寄存 器 第 4 位 ， 参 见 CR0 寄存 器 的 结构 ， 其 为 ET 位 ， 


























由 于 其 值 是 1， 





所 以 是 大 写 ET。 在 执行 框框 中 的 步骤 之 后 ，CR0 寄存 器 的 值 为 0x60000011，PE 位 是 1， 所 以 是 大 写 PE。 























咱们 先 把 话 锋 转 一 转 ， 说 点 小 事 儿 。 











loader.S 中 第 4 行 的 “jmp loader_start”， 其 机 器 码 是 E91702， 共 3 字 节 大 小 。 其 中 的 E9 是 操作 码 ，1702 是 


























操作 数 ， 由 于 是 小 端 字 节 序 ， 所 以 其 十 六 进 制 是 0x217， 这 是 16 位 相对 近 转 移 。 此 指令 直接 跳 过 


















































GDT 定义 相关 


部 分 ， 直 接 到 第 32 行 。 第 32 行 的 标号 loader start 在 文件 内 的 地 址 是 “jmp loader start” 的 3 字 节 机 器 码 +4 个 段 


















































加 上 loader 被 加 载 到 的 地 址 0x900， 在 内 存 中 的 实际 地 址 为 0x900+0x21a=0xbla。 
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昔 述 符 大 小 + 预 留 的 60 个 描述 符 大 小 +gdt_ptr 的 6 字 节 Hoadermsg 的 17 个 字 节 =3+32+480+6+17=538=0x21a。 再 


4.4 处理 器 微 架构 简介 


如 果 不 包 括 第 4 行 的 jmploader_start， 那 么 loader_start 的 地 址 将 是 0xbla-3=0xb17。 也 就 是 说 ， 如 果 把 
mbr 中 跳 入 loader 的 语句 jmp LOADER BASE ADDR， 改 成 jmp LOADER BASE ADDR+ 0xb17， 其 结 
果 也 是 一 样 的 ， 直 接 跳 转 到 loader.S 中 的 loader start。 重 点 来 了 ， 也 就 是 说 ，loaderS 中 开头 第 4 行 的 
jmploader start 是 可 以 不 要 的 。 

接 下 来 咱们 扒 上 大 事 啦 。 

见 代 码 4-3 的 第 78 一 82 行 。 















































78 jmp dword SELECTOR CODE:p mode start ; 刷新 流水 线 


B81 [BIEs32] 
82 p mode start: 


第 78 行 跳 入 的 地 址 是 第 82 行 的 p_mode_start， 在 第 78 行 和 第 82 行 之 间 没 有 任何 指令 或 数据 ， 在 没有 
任何 “间隔 阻拦 ”的 情况 下 为 何 还 要 用 路 转 指令 呢 ? 去 掉 它 行 吗 ? 还 真 不 行 ， 去 掉 它 之 后 ,程序 就 运行 出 错 
了 。 大 伙 儿 不 信 自己 试 试看 。 也 许 您 已 经 注意 到 了 ， 本 行 代码 后 面 的 注释 : 刷新 流水 线 。 这 是 喻 意思 呢 ? 

流水 线 是 CPU 为 提高 效率 而 采取 的 一 种 工作 方式 ，CPU 将 当前 指令 及 其 后 面 的 几 条 指令 同时 放 在 流水 
线 中 重 县 执 行 。 由 于 在 实 模式 下 时 ， 指 令 按照 16 位 指令 格式 来 译 码 ， 第 78 一 82 行 既 有 16 位 指令 ， 又 有 32 
位 指令 , 所 以 流水 线 把 32 位 指令 按照 16 位 译 码 就 会 出 错 。 解 决 这 问题 的 方法 就 是 用 无 跳 转 指令 清空 流水 线 。 

各 位 看 官 ， 有 关 流 水 线 这 里 先 点 到 为 止 ， 后 面 4.4 和 4.5 两 节 专 门 讲 这 些 体系 结构 相关 的 内 容 ， 其 中 
主要 说 的 就 是 流水 线 。 不 过 咱们 做 事 要 有 始 有 终 ， 这 里 先 把 剩 下 的 代码 说 完 。 

第 83 一 89 行 ， 是 用 选择 子 初 始 化 成 各 段 寄 存 器 。 
第 90 行 ， 是 往 显存 第 80 个 字符 的 位 置 〈 第 2 行 首 字符 的 位 置 ) 写 入 字符 了 P。 默 认 的 文本 显示 模式 是 
80*25， 即 每 行 是 80 个 字符 〈0 一 79)， 每 个 字符 占 2 字 节 ， 故 传 入 偏 移 地 址 是 80*2=160。 显 存 中 每 个 字 
符 的 低 字 节 是 字符 的 ASCII 值 ， 高 字 节 是 属性 位 。 这 里 咱们 没有 传 入 属性 值 ， 便 会 默认 为 黑 底 白字 。 程序 
执行 效果 如 图 4-13 所 示 。 

了 | 
































































































































































































































































































































































































































RR loader in real. 
CTRL + 3rd button enables nouse NIM [caps scRL | [| | 人 | | 


4 图 4-13 ”进入 保护 模式 































































































图 4-13 左下 角 的 字符 串 “2 loader in real” 是 在 实 模式 下 用 BIOS 中 断 0x10 打印 的 。 左 上 角 第 2 行 的 
字符 'P'， 这 是 咱们 在 保护 模式 下 输出 的 。 一 个 程序 历经 两 种 模式 ， 各 模式 下 都 打印 了 字符 ， 为 了 区 别 实 模 























式 下 的 打印 ， 所 以 字符 串 中 含有 “inreal ”。 


处 理 器 微 架 构 简介 


了 解 处 理 器 内 部 硬件 架构 ， 有 助 于 理 贸 



















































































软件 运行 原理 ， 因 为 这 两 者 本 身 相 辅 相 成 ， 相 互 依存 。 就 像 枪 








td 
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和 狙击 手 ， 枪 的 操作 和 外 形 设 计 都 要 根据 





射出 子弹 击 中 目标 ， 

















枪 赋予 了 人 的 使 命 。 


反 过 来 ， 狙 击 





中 率 的 方法 ， 做 到 人 枪 合 一 ， 人 赋予 了 枪 的 生命 。 


4.4.1 流水 线 
记得 











对 于 CPU 的 选择 ， 





2002 年 年 末 我 在 ! 
当时 可 花 了 兄弟 我 1600 元 呢 ， 话 说 当时 一 个 月 只 挣 











关 村 斤 了 台电 脑 ， 








当时 日 




















懂 了 CPU 中 另 一 个 非常 重要 的 技术 ， 这 就 是 流水 线 。 











手 要 根 和 











我 当时 只 关注 主 频 ， 根 本 不 关注 其 他 参数 ， 其 实 主要 是 不 懂 其 他 参数 
里 一 个 穿着 蓝 色 工作 服 的 工人 ,站 在 像 传 送 带 


说 到 流水 线 ， 也许 您 脑子 中 马上 联想 到 : 工 ) 


紧张 而 有 节奏 的 工作 。 也 许 您 会 问 ， 你 怎么 知道 我 是 这 么 想 的 ? 哎 














线 。 可 是 这 个 例子 毕竟 大 遥 远 ， 并 不 是 


折 有 同学 

















大 伙 儿 都 有 
了 充分 利用 房 本 


租 




















um 








EE 狭小 的 空间 ， 肯 定 用 色 





























时 枪 的 操作 和 儿 




















吓人 体 工 学 ， 让 人 不 仅 操作 容易 ， 而 且 携带 也 要 轻便 ， 做 到 能 随时 

















形 设 计 ， 找 至 





| 发 挥 其 最 大 命 





的 最 新 的 桌面 CPU 是 奔 4-2.4b， 我 一 咬牙 就 买 它 了 ， 
1500 元 。 其 中 2.4 是 指 CPU 的 主 频 是 2.4G。 您 看 ， 
， 哈 哈 。 后 来 才 


















































视 里 











在 工 / 














带 一 样 的 工作 台 前 
都 这 么 演 的 …… 没 错 





， 这 就 是 流水 














做 过 流水 线 工 人 ， 咱 们 还 是 拿 生活 ! 





房子 的 经 历 吗 ? 如 果 没 有 也 没关系 ， 

















子 往 墙 


长 | 











下 过 钉子 ， 











重点 不 是 租 


房子 ， 我 要 说 上 




















从 宏观 上 看 ,ff 


(1) 取 钉 子 。 
(2) 砸 钉子 











o 


假设 每 一 步 都 占用 1 秒 ， 钉 钉子 这 两 个 步骤 下 来 是 2 秒 ， 


下 钉子 可 以 分 两 个 步骤 。 


30 个 钉子 。 过 程 见 表 4-12。 











您 懂 的 ， 可 以 挂 东西 嘛 。 


如 果 顺 序 执行 这 两 个 步骤 ， 一 分 钟 可 以 











的 例子 说 事 。 


的 是 像 我 等 北 漂 一 族 ， 为 


局 























































































































































































































表 4-12 顺序 执行 

第 1 秒 第 2 秒 第 3 秒 第 4 秒 第 n-1 秒 第 n 秒 
取 钉 子 砸 钉子 取 钉 子 砸 钉子 取 钉 子 砸 钉子 
砸 入 第 一 个 钉子 砸 入 第 二 个 钉子 大 入 第 n/2 个 钉子 

以 上 是 以 串 行 顺序 的 方式 来 砸 钉子 ， 不 过 这 种 串 行 的 效率 实在 有 限 ， 如 果 改 为 并 行 的 方式 砸 钉子 ， 效 
率 必然 大 大 提高 。 

生活 中 处 处 是 并 行 的 例子 ， 最 为 典型 的 并 行 系统 就 是 咱们 的 身体 。 比 如 心脏 在 为 身体 泵 血 的 时 候 ， 肺 
同时 在 保持 呼吸 为 身体 供 氧 小肠 也 同时 在 蠕动 ， 为 人 体 汲 取 养 分 。 这 些 器 官 的 活动 都 是 并 行 的 ， 并 不 是 
在 心脏 跳动 完 之 后 ， 小 肠 再 蠕动 ， 它 们 的 工作 是 彼此 独立 无 关联 的 。 人 体内 部 的 器 官 虽然 是 在 并 行 工 作 ， 
但 它们 作为 一 个 整体 一 一 人 ， 却 同一 时 间 只 能 做 好 一 件 事 ， 所 以 一 心 不 能 三 用 。 

如 果 以 “并 行 ” 的 方式 ， 也 就 是 同时 砸 钉子 ， 那 得 多 增加 入手 才 行 ， 一 个 人 同时 只 能 做 一 件 事 ， 并 且 
要 么 拿 钉 子 ， 要 么 砸 钉子 。 下 面 给 砸 钉子 的 工作 增加 个 人 手 ， 专 门 给 取 钉 子 ， 这 样 一 个 人 取 钉 子 ， 另 一 个 





























人 专门 来 古 钉 子 ， 取 钉子 和 砸 钉子 的 了 








[ 作 重 对 进 行 ， 过 程 见 表 4-13。 











































































































表 4-13 重 杰 执行 

钉子 第 1 秒 第 2 秒 第 3 各 第 4 各 第 m-1 秒 第 n 秒 
第 一 个 钉子 取 钉 子 砸 钉子 
第 二 个 钉子 取 钉 子 硬 钉 子 
第 三 个 钉子 取 钉 子 三 钉 子 

上 面 的 并 行 我 加 了 引号 ， 因 为 它 并 不 是 真正 地 并 行 ， 这 是 在 重 登 执行 。 重 和 登 的 意思 是 说 在 同一 时 间 内 
同时 完成 两 个 钉子 的 部 分 工序 ， 拿 第 2 秒 来 说 ,第 一 行 的 “ 砸 钉子 ”是 砸 的 第 一 个 钉子 ， 第 二 行 的 “ 取 钉 








































































































子 ” 取 的 是 第 二 个 钉子 ， 做 的 并 不 都 是 第 一 个 钉子 的 工序 。 真 正 的 并 行 是 两 个 人 自己 取 自 己 的 钉子 ,然后 
自己 砸 自己 的 钉子 ， 各 干 各 的 。 而 我 们 的 例子 中 ， 取 钉子 的 人 只 会 取 钉 子 ， 砸 钉子 的 人 也 只 会 砸 钉子 。 
增加 了 一 个 人 手 之 后 ， 除 第 1 秒 外 ， 每 一 秒 都 有 “ 砸 钉子 ”的 动作 ， 所 以 第 一 分 钟 内 可 以 砸 入 59 根 
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钉子 ， 在 第 二 分 钟 以 后 ， 每 分 钟 能 砸 60 个 。 
表 4-13 的 过 程 便 是 一 个 流水 线 的 执行 过 程 ， 由 于 硬 钉 子 分 为 两 个 步骤 ， 所 以 以 上 流水 线 称 为 二 级 流水 线 。 
这 种 情况 在 CPU 中 也 是 一 样 的， 指令 执行 单元 EU 是 执行 指令 的 唯一 部 件 ， 一 次 只 能 执行 一 个 指令 ， 
单 核 CPU 的 情况 下 ， 只 有 一 个 指令 处 于 执行 中 。CPU 中 的 各 部 分 也 是 同时 只 能 做 一 件 事 ， 但 它们 就 像 身 
体 器 官 一 样 ， 也 是 在 并 行 工作 ， 相 当 于 多 个 “人 手 ”。CPU 的 指令 执行 过 程 分 为 取 指令 、 译 码 、 执 行 三 个 
步骤 。 每 个 步骤 都 是 独立 执行 的 ，CPU 可 以 一 边 执行 指令 ， 一 边 取 指 令 ， 一 边 译 码 。CPU 中 的 时 序 不 是 

















































































































































































































秒 ， 对 CPU 来 说 ， 秒 就 是 天 文 数字 。 它 的 时 序 是 时 钟 周期 。 按 照 这 三 个 步骤 ， 其 三 级 流水 线 见 表 4-14。 
表 4-14 三 级 流水 线 
外 令 周期 1 周期 2 周期 3 周期 4 周期 5 周期 6 
第 一 条 指令 ”| 取 指 译 码 执行 
第 二 条 指令 取 指 译 码 执行 
第 三 条 指令 取 指 译 码 执行 
以 上 在 第 2 周期 后 ， 都 有 指令 在 执行 ， 这 是 最 基本 的 流水 线 啦 。 为 了 更 好 地 理解 以 后 的 分 支 预测 ， 
























































在 此 提醒 一 下 大 伙 儿 : 虽然 在 一 个 时 钟 周期 内 CPU 同时 干 了 三 件 事 ， 但 一 定 要 清楚 ， 这 三 件 事 不 属于 
同一 个 指令 ， 是 三 个 指令 重 且 在 一 起 了 ， 这 和 厢 钉 子 的 流水 线 是 一 样 的 道理 。 同 时 完成 的 是 当前 指令 的 
第 三 步 、 下 一 条 指令 的 第 二 步 、 第 三 条 指令 的 第 一 步 。CPU 中 每 条 指令 必须 经 过 取 指 、 译 码 、 执 行 三 步 
才 算 完成 。 就 拿 表 4-14 中 的 周期 3 来 说 ， 在 这 一 时 钟 周期 里 ，CPU 同时 完成 了 “执行 ””“ 译 码 ””“ 取 
指 ” 三 件 事 。 其 中 的 “执行 ”是 执行 的 第 一 条 指令 ,“ 译 码 ” 是 在 为 第 二 条 指令 译 码 ， 取 指 是 从 内 存 中 
取出 第 三 条 指令 。 
在 这 里 不 得 不 插 一 句 , CPU 是 按照 程序 中 指令 顺序 来 填充 流水 线 的 ,也 就 是 说 按照 程序 计数 器 PCCx86 
中 是 cs: ip)〉 中 的 值 来 装载 流水 线 的 ， 当 前 指令 和 下 一 条 指令 在 空间 上 是 挨 着 的 。 如 果 当 前 执行 的 指令 是 
jmp， 下 一 条 指令 已 经 被 送 上 流水 线 译 码 了 ， 第 三 条 指令 已 经 被 送 上 流水 线 取 指 啦 。 仔 细 想 想 看 ， 其 实 这 
个 流水 线 没 用 了 ， 因 为 CPU 早已 经 跳 到 别处 去 执行 了 ， 第 二 、 三 条 指令 用 不 上 了 ， 所 以 CPU 在 遇 到 无 条 
件 转 移 指 令 jmp 时 ， 会 清空 流水 线 。 

回 到 正题 , 其实 , 流水 线 还 是 有 优化 空间 的 , 表 4-4 才 3 级 流水 线 , 而 奔腾 CPU 可 是 32 级 流水 线 呢 。 
CPU 指令 三 个 步骤 中 ， 只 有 “执行 ”这 一 步 才 是 最 重要 的 ， 想 办 法 让 此 步骤 的 周期 更 短 才 是 王道 。 也 就 
是 说 ， 执 行 周期 越 短 ，CPU 所 执行 指令 的 数量 越 多 ， 效 率 也 就 越 高 ， 但 流水 线 级 数 肯 定 越 多 。 解 决 问题 
的 办 法 是 ， 将 每 一 步 操作 再 继续 划分 成 粒度 更 细 的 微 操作 。 为 了 说 明 问 题 ， 咱们 还 是 拿 砸 钉子 举例 。 和 仔细 
分 析 下 砸 钉子 的 两 个 步 又 : 第 1 个 步 又 取 和 钉子 ， 可 以 分 解 为 取 钉 子 、 定 位 。 第 2 个 步骤 钉 钉 子 ， 可 以 分 解 
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do 





























































































































































































































































































































为 瞄准 ， 磺 钉子。 全 部 过 程 是 ， 取出 钉子 后 ， 确 定 钉 入 的 位 置 ， 拿 起 锤子 ， 瞄 准 ， 磺 下去。 最终 起 作用 的 
步 又 是 砸 钉子， 前 三 小 步 都 是 在 做 准备 ， 砸 钉子 这 步 时 间 越 短 越 好 。 由 于 每 个 大 步骤 耗 时 1 秒 ， 现 假设 每 
个 小 步骤 耗 时 0.5 秒 。 按 小 步骤 重新 安排 流水 线 ， 情 况 见 表 4-15。 

表 4-15 四 级 流水 线 

钉子 第 0.5 秒 第 1 秒 第 1.5 秒 第 2 秒 第 2.5 秒 第 3 秒 第 3.5 秒 
第 一 个 钉子 | 取向 子 定位 瞄准 三 钉子 
第 二 个 钉子 取 钉 子 定位 昔 准 砸 包子 
第 三 个 钉子 取 杀 子 定位 瞄准 古 钉 子 
第 四 个 钉 取 钉 子 定位 瞄准 硬 钉 子 

从 第 2 秒 后 ， 每 0.5 秒 就 会 有 一 个 砸 钉子 的 动作 ， 所 以 在 以 后 的 每 分 钟 内 ， 都 会 钉 入 120 个 钉子 ， 速 
度 又 提高 了 很 多 。 这 焉 是 将 指令 拆 分 成 多 个 微 操 作 后 的 效率 提升 。 


























流水 线 是 CPU 提高 效率 的 一 种 出 路 ， 以 后 介绍 的 各 种 优化 方法 ， 其 实 都 是 围绕 如 何 让 流水 线 更 加 有 
效 而 展开 的 。 走 ， 咱 们 继续 看 看 CPU 工程 师 们 还 做 了 哪些 努力 。 
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4.4.2 ” 乱 序 执行 


乱 序 执行 ， 是 指 在 CPU 中 运行 的 指令 并 不 按照 代码 中 的 顺序 执行 ， 而 是 按照 一 定 的 策略 打 乱 顺序 执 
行 ， 也 许 后 面 的 指令 先 执 行 ， 当 然 ， 得 保证 指令 之 间 不 具备 相关 性 。 
举 个 简单 的 例子 ， 比 如 如 下 两 行 代码 就 无 法 乱 序 执行 。 


1 mov eax, [0x1234] 
2 add eax, ebx 

























































































第 2 行 的 add 加 法 , 需要 知道 eax 的 值 , 但 eax 的 值 需要 在 第 1 行 中 的 mov 操作 后 才能 确定 , 而 且 内 存 访 
问 相 对 来 说 非常 慢 ， 第 2 步 不 得 不 等 待 第 1 步 完成 后 才能 进行 。 所 以 只 能 是 先 执行 第 1 步 ， 再 执行 第 2 步 。 
如 果 将 上 面 第 2 步 的 代码 修改 一 下 ， 如 下 : 





































































































1 mov eax, [0x1234] 
2 add ecx,ebx, 


这 样 就 可 以 在 执行 第 1 步 内 存 访问 后 的 等 待 中 执行 第 2 步 啦 。 由 于 第 2 步 不 依赖 第 1 步 ， 所 以 有 利于 
放 在 流水 线 上 。 

x86 最 初 用 的 指令 集 是 CISC (Complex Instruction Set Computer )， 意 为 复杂 指令 集 计 算 机 ， 为 什么 复 
杂 呢 ?当初 的 CPU 工程 师 们 为 了 让 CPU 更 加 强大 ， 不 断 地 往 CPU 中 添加 各 种 指令 ， 甚 至 在 CPU 硬件 一 
级 直接 支持 软件 中 的 某 些 操作 ， 以 至 于 指令 集 越 来 越 庞 大 笨重 复杂 。 例 如 push 指令 ， 它 相当 于 多 个 子 操 
作 的 合成 ， 拿 保护 模式 中 的 栈 来 说 ，push eax 相当 于 : 

。 push 指令 先 将 栈 指针 esp 减 去 操作 数 的 字 长 ， 如 sub esp,4。 

e 再 将 操作 数 mov 到 新 的 esp 指向 的 地 址 ， 如 mov [esp],eax。 

这 两 个 子 操作 合成 了 一 个 指令 ， 其 中 每 一 个 子 操作 称 为 微 操作 。 

与 CISC 指令 集 相 对 应 的 是 RISC (Reduced Instruction Set Computer)， 意 为 精简 指令 集 计算 机 。 根 据 
二 八 定律 ， 最 常用 的 指令 只 有 20%， 但 它们 占 了 整个 程序 指令 数 的 80%。 而 不 常用 的 指令 占 80%， 但 它 
们 只 占 整个 程序 指令 数 的 20%。 这 就 是 RISC 指令 集 的 由 来 ， 它 精简 保留 了 那些 常用 的 指令 ， 这 些 指令 大 
多 数 都 是 不 可 再 细 分 的 ， 也 就 是 ， 它 们 基本 上 都 是 属于 微 操 作 级 别 的 指令 啦 。 
所 以 ，x86 发 展 到 后 来 ， 虽 然 还 是 CISC 指令 集 ， 但 其 内 部 已 经 采用 RISC 内 核 ， 译 码 对 于 x86 体系 
来 说 ， 除 了 按照 指令 格式 分 析 机 器 码 外 ， 还 要 将 CISC 指令 分 解 成 多 个 RISC 指令 。 当 一 个 “大 ”操作 被 
分 解 成 多 个 “ 微 ” 操 作 时 ， 它 们 之 间 通 常 独立 无 关联 ， 所 以 非常 适合 乱 序 执行 。 

还 是 拿 栈 举 例 ， 如 下 三 行 代码 。 



























































































































































































































































1 mov eax , [0x1234 
2 push eax 
3 call function 






















































































第 1 步 需 要 内 存 访问 ， 由 于 内 存 较 慢 ， 所 以 寻 址 等 待 过 程 中 可 以 做 其 他 事 。 
第 2 步 的 push 指令 拆 分 成 sub esp ，4 和 mov [esp]， eax。 
第 3 步 的 call 函数 调用 ， 需 要 在 栈 中 压 入 返回 地 址 ， 所 以 说 call 指令 需要 用 栈 指针 。 
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于 第 2 步 中 的 微 操 作 sub esp，4， 可 以 让 CPU 知道 esp 的 最 新 值 ， 不 用 等 到 mov [esp], eax 完成 ， 

第 3 步 call 指令 向 栈 中 压 入 返回 地 址 的 操作 就 可 以 执行 了 。 故 第 2 步 未 执行 完 就 开始 第 3 步 的 执行 了 ， 也 

许 第 3 步 先 于 第 2 步 完 成 。 
总 结 一 下 ， 乱 序 执行 的 好 处 就 是 后 面 的 操作 可 以 放 到 前 面 来 做 ， 利 于 装载 到 流水 线 上 提高 效率 。 


4.4.3 缓存 


缓存 是 20 世纪 最 大 的 发 明 ， 其 原理 是 用 一 些 存 取 速 度 较 快 的 存储 设备 作为 数据 缓冲 区 ， 避 免 频 繁 访问 速度 
较 慢 的 低速 存储 设备 ， 归 根 结 底 的 原因 是 低速 存储 设备 是 整个 系统 的 瓶 须 ， 缓 存 用 来 缓解 “瓶颈 设备 ”的 压力 。 
第 3 章 介 绍 实 模式 下 的 寄存 器 时 ， 举 了 一 个 浏览 器 访问 网 页 的 例子 ， 里 面 有 12 步 ， 几 乎 步 步 都 用 到 了 缓存 。 
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不 过 ， 这 些 缓存 都 是 在 内 存 DRAM 中 实现 的 ， 即 动态 随机 访问 存储 器 ， 究 其 原因 是 数据 要 么 在 数据 库 中 ， 要 么 












































在 硬盘 上 ， 其 速度 肯定 比 内 存 慢 。 选 作 绥 存 的 存储 设备 ， 其 存 取 速 度 肯定 是 比 其 原 有 存储 设备 更 快 ， 否则 失去 了 








缓存 的 意义 。 






































相对 于 CPU 来 说 ，DRAM 太 慢 了 ， 如 果 也 要 用 它 来 做 CPU 的 缓存 ， 反 而 是 拖 了 后 腿 ， 不 如 不 用 。 























CPU 为 什么 要 用 缓存 ? 因为 待 执行 的 指令 和 相关 数据 存储 在 低速 的 内 存 中 ， 让 CPU 这 种 高 速 设备 等 
待 慢 速 的 内 存 ， 着 实 太 浪费 CPU 资源 了 。 人 们 根本 无 法 容忍 CPU 如 此 “漫长 ”的 “浪费 ” 所 以 需要 用 
一 个 比 内 存 更 快 的 存 取 设备 做 缓冲 区 ， 尽 量 和 CPU 一 个 速度 ， 让 CPU 不 要 等 待 。 于 是 SRAM 成 了 CPU 






































的 救世 主 ， 成 为 CPU 和 内 存 之 间 数 据 缓存 的 不 二 之 选 。 








前 面 在 





介绍 实 模 式 下 的 寄存 器 时 ， 也 说 到 了 CPU 中 的 缓存 。CPU 中 有 一 级 缓存 LI1、 二 级 缓存 L2， 
































和 寄存 器 放 





SRAM 更 快 。 | 
用 的 都 是 触发 器 ， 它 可 是 工作 速度 极 快 的 ， 属 于 纳 秒 级 别 。 至 于 触发 器 是 什么 ， 这 已 属于 硬件 范畴 ， 这 里 


就 不 深究 了 


{至 三 级 缓存 L3 等 。 它 们 都 是 SRAM， 即 静态 随机 访问 存储 器 ， 它 是 最 快 的 存储 器 啦 。 之 所 以 把 SRAM 








到 一 块 说 ， 是 因为 很 多 同学 在 感 观 上 觉得 寄存 器 是 CPU 直接 使 用 的 存储 单元 ， 所 以 寄存 器 比 
其 实 它 们 在 速度 上 是 同一 级 别 的 东西 ， 因 为 寄存 器 和 SRAM 都 是 用 相同 的 存储 电路 实现 的 ， 

















































































































， 有 兴趣 的 读者 请 自行 调研 吧 。 


















































有 哪些 








东西 可 以 被 缓存 昵 ? 无 论 是 程序 中 的 数据 ， 还 是 指令 ， 在 CPU 眼 里 全 是 一 样 形式 的 二 进 制 01 





























串 ， 没 有 任何 区 别 ， 都 是 CPU 待 处 理 的 “数据 ”。 所 以 我 们 眼中 的 指令 和 数据 都 可 以 被 缓存 到 SRAM 中 。 





行 在 程序 中 








局 部 性 分 为 以 下 两 个 方面 。 






































什么 时 候 能 缓存 呢 ? 可 以 根据 程序 的 局 部 性 原理 采取 缓存 策略 。 局 部 性 原理 是 : 程序 90% 的 时 间 都 运 








10% 的 代码 上 。 
































力 田 


是 时 间 局 部 性 :最近 访问 过 的 指令 和 数据 ， 在 将 来 一 段 时 间 内 依然 经 常 被 访问 。 








丸 一 方 








面 是 空间 局 部 性 : 靠近 当前 访问 内 存 空间 的 内 存 地 址 ， 在 将 来 一 段 时 间 也 会 被 访问 。 

















举 一 个 典型 的 例子 ， 我 们 在 用 高 级 语言 写 程序 时 ， 经 常会 写 到 这 样 的 循环 嵌 套 代码 ， 如 : 




















int array[100] [100]; 


int sum 


数组 array 元 素 被 赋值 ， 略 


for (int i=0, i<100,i++) { 
for (int .J=0%j<100,3++). 1{ 
sumt+=array[i][j]; 

















以 上 是 将 二 维 数组 中 的 所 有 元 素 相 加 求 和 的 代码 。 循 环 中 经 常 被 用 到 的 地 址 是 sum 所 在 的 地 址 ， 经 党 
































被 用 到 的 指令 是 加 法 求 和 指令 ， 这 是 在 时 间 上 的 局 部 性 。 未 来 要 访问 的 地 址 是 与 当前 访问 地 址 &array 自 中 相 








邻 的 地 址 &array 身 [+1]， 它 们 之 间 只 差 一 个 整 型 变量 的 大 小 ， 这 是 空间 上 的 局 部 性 的 。( 当然 ， 这 些 局 部 性 





















































都 是 编译 器 编译 的 结果 ， 编 译 器 就 是 这 样 安排 的 。 ) CPU 利用 此 特性 ， 将 当前 用 到 的 指令 和 当前 位 置 附近 的 






































数据 都 加 载 到 缓存 中 ， 这 就 大 大 提高 了 CPU 效率 ， 下 次 直接 从 缓存 中 拿 数 据 ， 不 用 再 去 内 存 中 取 啦 。 
当然 ， 上 面 说 的 是 理想 的 状态 ， 如 果 绥 存 中 没有 相应 的 数据 ， 还 是 要 去 内 存 中 加 载 ， 然 后 再 放 到 缓存 中 。 












































4.4.4 分 支 预测 
人 在 道路 的 分 岔口 时 要 预测 哪 条 路 能 够 到 达 目 的 地 ， 面 对 众多 选择 时 ， 计 算 机 也 一 样 要 抉择 ， 毕 竟 计 算 


机 的 运行 方 















































式 是 以 人 的 思路 来 设计 的 ， 计 算 机 中 的 抉择 其 实 就 是 人 在 抉择 。 




















CPU 中 的 指令 是 在 流水 线 上 执行 。 分 支 预测 ， 是 指 当 处 理 器 遇 到 一 个 分 支 指令 时 ， 是 该 把 分 支 左边 


的 指令 放 到 











流水 线 上 ， 还 是 把 分 支 右边 的 指令 放 在 流水 线 上 呢 ? 











如 C 语言 程序 中 的 过、switch、for 等 语言 结构 ， 编 译 器 将 它们 编译 成 汇编 代码 后 ， 在 汇编 一 级 来 说 ， 
这 些 结构 都 是 用 跳 转 指令 来 实现 的 ， 所 以 , 汇编 语言 中 的 无 条 件 跳 转 指令 很 丰富 ， 以 至 于 称 之 为 跳 转 指令 





“ 族 ”， 多 得 








举 个 作 
























































中 人 矣 应 对 各 种 转移 方式 。 





1 子 ， 如 下 面 的 测试 代码 。 
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1 void main () { 

2 int i = 0; 

3 while (i < 10) { 
4 二 中 让 必 

9 } 

6 } 








里 面 的 while 结构 ， 就 是 执行 了 10 次 it++。 我 们 来 看 一 下 while 结构 是 如 何 翻 译 成 汇编 语言 的 。 

gcc -S -0 一 /test/while.S 一 /tesVwhile.c 回 车 ， 这 样 gcc 就 将 while.c 编译 成 了 汇编 代码 while.S。 其 中 
的 参数 -S 是 编译 到 汇编 语言 ， 不 进行 汇编 和 链接 。 
查看 下 一 /test /while.S 文件 ，cat -n 一 /tesVywhile.S 回 车 。 

































































J .file"while.c" 

2 .text 

3 .globl main 

4 .type main, Qfunction 

5 main: 

6 Push1l Sebp 

a movil Sesp, sebPp 

8 subl $16, Sesp 

9 movil $0, -4(%ebp) 

10 jmp .L2 

er Re ;此 处 是 while 的 循环 体 
2 addl $1, -4 ($ebp) 

13 .Es ;此 处 是 while 循环 条 件 表达 式 
14 cmpl $9, -4(%ebp) 

15 jle .L3 

16 leave 

17 ret 

18 .Size main, .—main 

19 .ident "GCC: (GNU) 4.4.6 20120305 (Red Hat 4.4.6-4)" 
20 .Section .note.GNU-stack,"",@progbits 




















这 个 生成 的 汇编 语言 并 不 是 我 们 熟悉 的 Intel 语法 ， 而 是 AT&T 语法 ， 如 果 此 时 您 觉得 太 陌生 也 不 要 
慌张 ， 因 为 在 后 面 的 章节 我 们 会 专门 说 到 此 类 语法 ， 现 在 先 抛 出 来 和 大 家 预 预 热 。 
本 来 打算 只 列 出 第 9~15 行 的 ， 但 考虑 到 本 身 才 20 行 ， 干 脆 就 全 贴 出 来 了 ， 简 要 说 明 一 下 ， 前 4 行 
用 于 声明 代码 段 ， 导 出 main 函数 符号 。 第 5 行 是 main 函数 的 起 始 地 址 ， 高 级 语言 中 的 函数 名 在 汇编 语言 
中 只 是 个 符号 ， 而 符号 便 是 地 址 ， 这 就 是 很 多 教科 书 上 都 说 函数 名 是 地 址 的 原因 。 话 说 数组 也 同 理 ， 数 组 
名 在 汇编 语言 中 也 是 个 标号 地 址 ， 所 以 数组 名 也 是 地 址 。 局 部 变量 是 在 栈 中 分 配 空间 的 ， 所 以 第 6~8 行 
是 在 创建 堆栈 框架 ， 也 就 是 为 局 部 变量 i 在 栈 中 分 配 空间 ，-4 〈%ebp) 便 是 指 局 部 变量 i。 堆 栈 框架 以 后 
会 说 到 。 咱 们 主要 是 看 第 9 一 15 行 。 
第 9 行 是 为 变量 i 赋值 为 0。AT&T 语法 中 , 寄存 器 前 要 用 % 来 指示 , 立即 数 前 要 用 $ 来 指示 。-4 (%ebp) 
表示 内 存 地 址 “ebp 寄存 器 的 值 减 4” 处 的 内 存 内容 ， 相 当 于 Intel 汇编 语法 形式 [ebp - 各 。AT&T 语法 
是 源 操作 数 在 左 ， 目 的 操作 数 在 右 ， 和 Intel 语法 相反 。 所 以 第 9 行 是 将 0 送 入 了 变量 i 所 在 的 栈 空间 。 
第 10 行 就 是 简单 的 无 条 件 跳 转 ， 直 接 进 入 while 循环 结构 的 条 件 表达 式 判断 ， 也 就 是 第 13 行 。 
第 14 行 就 是 while 括号 中 的 条 件 表达 式 ， 用 变量 i 的 值 和 立即 数 9 做 比较 。 
第 15 行 的 jle 意思 是 若 第 14 行 的 比较 结果 是 小 于 等 于 9， 则 跳 到 11 行 ， 继 续 执行 第 12 行 的 加 法 。 
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可 见 第 11 一 12 行 是 循环 体 。 
程序 执行 流 是 由 第 15 行 跳 到 第 11 行 ， 这 样 组 成 了 循环 结构 的 回路 。 

































































程序 执行 while 循环 后 就 结束 了 ， 所 以 局 部 变量 i 所 在 的 栈 空 间 要 被 回收 ， 第 16 行 的 指令 leave 用 于 堆 
栈 框架 的 回收 工作 。 
第 17 行 是 main 函数 退出 。 由 于 main 也 是 被 调用 的 ， 所 以 gcc 显 式 地 帮 咱 们 加 了 个 ret 以 示 退 出 ， 为 
什么 main 也 是 由 别人 调用 的 ? 这 个 在 加 载 用 户 程序 时 





















































































































































咱们 会 说 到 的 。 
上 面 的 第 15 行 jle 指令 就 是 程序 中 的 分 支 结 构 。 我 们 花 了 “大 力气 ”讲述 了 程序 流 的 分 支 ， 这 并 不 是 
浪费 力气 。 类 似 这 样 的 分 支 结构 很 多 ， 它 们 只 有 两 种 结果 ， 要 么 转移 到 这 一 边 ， 要 么 转移 到 那 一 边 。 分 支 


















































结构 虽然 让 程序 更 加 灵活 多 样 ， 但 这 却 成 了 CPU 执行 效率 的 诉 病 。 这 是 怎么 回 事 呢 ? 
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之 前 说 流水 线 的 时 候 ， 我 和 大 家 强调 了 两 次 “ 重 有 又”， 即 同一 时 间 周 期 内 完成 的 是 当前 指令 的 执行 ， 
下 一 条 指令 的 译 码 ， 第 三 条 指令 的 取 指 。 其 中 最 重要 的 是 “执行 ” 指令 只 有 执行 了 ， 才 真正 是 泌 出 去 的 
水 ， 收 不 回来 了 。 另 外 的 译 码 和 取 指 并 不 重要 ， 首 先 它 们 并 不 是 执行 ， 其 次 它们 也 不 属于 当前 指令 ， 当 前 
外 令 的 “ 取 指 ”和 “ 译 码 ” 早 就 在 前 两 个 周期 内 完成 了 。 

不 知道 您 注意 到 了 没有 ， 拿 表 4-14 的 周期 3 来 说 ， 这 一 时 钟 周 期 内 的 “执行 ” 指 的 是 当前 指令 的 执行 阶 
段 ,“ 取 指 ” 和 “ 译 码 ”这 两 个 工序 分 别 隶 属于 未 来 要 执行 的 下 一 条 指令 和 下 下 一 条 指令 。 想 到 这 里 不 禁 要 有 
个 疑问 ， 这 两 个 未 来 的 指令 ，CPU 是 如 何 确定 的 ? 如 果 程 序 一 直 是 顺序 执行 的 ， 未 来 无 论 多 少 条 指令 都 可 以 
轻易 得 到 ， 都 可 以 提前 放 到 流水 线 上 。 可 是 ， 程 序 是 有 分 支 啊 ， 到 底 该 把 哪个 分 支 的 指令 放 到 流水 线 上 呢 ? 

流水 线 是 有 效 提升 CPU 效率 的 方式 ， 但 流水 线 最 大 的 问题 是 程序 中 的 分 支 结构 ， 如 何 把 握 好 转移 的 
方向 ， 才 是 使 流水 线 保持 高 效 的 关键 ， 因 为 如 果 流 水 线 上 的 指令 放 错 了 的 话 ， 必 须要 清空 那些 已 经 在 流水 
线 上 的 指令 ， 一 定 不 能 执行 错误 的 指令 。 随 着 流水 线 级 数 越 多 ， 要 清空 的 指令 也 将 越 多 ， 清 空 流 水 线 的 代 
价 就 越 大 ， 这 严重 影响 CPU 效率 。 

当 遇 到 一 个 分 岔口 时 ， 是 往 左 走 ， 还 是 往 右 走 呢 ? 对 于 这 种 分 支 情况 ， 就 需要 预测 出 哪 一 侧 的 指令 将 
被 执行 ， 然 后 将 预测 出 的 那 一 分 支 上 的 指令 放 入 流水 线 。 从 统计 学 的 角度 来 看 ， 某 些 事情 一 旦 出 现 ， 下 一 
次 出 现 的 机 率 还 会 很 大 。 纵 观 历 史 ， 很 多 事情 都 是 在 重复 地 发 生 ， 很 多 伟人 都 拿 这 些 历史 样本 来 预测 未 来 
发 生 的 事情 。 这 个 说 的 有 点 悬 乎 了 ， 说 点 简单 的 ， 比 如 现在 是 葡萄 收获 的 季节 ,今天 刚 吃 了 和 葡萄， 很 好 吃 ， 
明天 后 天 甚至 未 来 的 几 周 都 会 继续 吃 和 葡萄， 哈哈， 我 太 爱 吃 和 葡萄 了 。 

让 我 们 说 说 预测 的 算法 吧 。 

对 于 无 条 件 跳 转 ， 没 喻 可 犹豫 的 ， 直 接 跳 过 去 就 是 了 。 所 谓 的 预测 是 针对 有 条 件 跳 转 来 说 的 ， 因 为 不 
知道 条 件 成 不 成 立 。 最 简单 的 统计 是 根据 上 一 次 跳 转 的 结果 来 预测 本 次 ， 如 果 上 一 次 跳 转 啦 ， 这 一 次 也 预 
测 为 跳 转 ， 否 则 不 跳 。 

最 简单 的 方法 是 2 位 预测 法 。 用 2 位 bit 的 计数 器 来 记录 跳 转 状态 ， 每 跳 转 一 次 就 加 1， 直 到 加 到 最 
大 值 3 就 不 再 加 啦 ， 如 果 未 跳 转 就 减 1， 直 到 减 到 最 小 值 0 就 不 再 减 了 。 当 遇 到 跳 转 指令 时 ， 如 果 计 数 器 
的 值 大 于 1 则 跳 转 ， 如 果 小 于 等 于 1 则 不 跳 。 这 只 是 最 简单 的 分 支 预 测算 法 ，CPU 中 的 预测 法 远 比 这 个 
复杂 ， 不 过 它们 都 是 从 2 位 预测 法 发 展 起 来 的 。 分 支 指令 所 在 地 址 | 预测 的 分 支 地 址 | 跳 转 统计 

算法 有 了 ， 咱 们 看 看 CPU 是 如 何 实现 预测 的 。 

Intel 的 分 支 预 测 部 件 中 用 了 分 支 目 标 缓冲 器 (Branch 
Target Buffer，BTB )。 其 结构 如 图 4-14 所 示 。 

BTB 中 记录 着 分 支 指令 地 址 ，CPU 遇 到 分 支 指令 时 ， 先 ^ 图 4-14 BTB 结构 
用 分 支 指令 的 地 址 在 BTB 中 查找 ， 若 找到 相同 地 址 的 指令 ， 根 据 跳 转 统计 信息 判断 是 否 把 相应 的 预测 分 
支 地 址 上 的 指令 送 上 流水 线 。 在 真正 执行 时 ， 根 据 实际 分 支流 向 ， 更 新 BTB 中 跳 转 统计 信息 。 

如 果 BTB 中 没有 相同 记录 该 怎么 办 呢 ? 这 时 候 可 以 使 用 Static Predictor， 静 态 预 测 器 。 为 什么 称 为 静 
态 昵 ? 这 是 因为 存储 在 里 面 的 预测 策略 是 固定 写 死 的 , 它 是 由 人 们 经 过 大 量 统计 之 后 , 根据 某 些 特征 总 结 
出 来 的 。 比 如 ， 转 移 目标 的 地 址 若 小 于 当前 转移 指令 的 地 址 ， 则 认为 转移 会 发 生 ， 因 为 通常 循环 结构 中 都 
用 这 种 转移 策略 ， 为 的 是 组 成 循环 回路 。 所 以 静态 预测 器 的 策略 是 : 车 向 上 跳 转 则 转移 会 发 生 ， 若 向 下 跳 
转 则 转移 不 发 生 ， 如 图 4-15 所 示 。 

ETTETT 程序 在 实际 执行 转移 分 支 指令 后 ， 再 将 转移 记录 录入 到 BTB。 
{ 还 记得 之 前 反复 强调 的 重 亚 吗 ? 其 实 是 用 在 这 的 。 如 果 分 支 预测 错 了 ， 
训 循环 结构 也 就 是 说 ， 当 前 指令 执行 结果 与 预测 的 结果 不 同 ， 这 也 没关系 ， 只 要 将 流水 






























































































































































































































































































































































































































































































































































































































































































































































向 上 跳 转 | ” 线 清空 就 好 了 。 因为 处 于 执行 阶段 的 是 当前 指令 , 即 分 支 跳 转 指令 。 处 于 “ 译 
码 ”“ 取 指 ” 的 是 尚未 执行 的 指令 ， 即 错误 分 支 上 的 指令 。 只 要 错误 分 支 上 的 
, 国 1_15 六 环 U 坎 全 上 也 吏 指令 还 没 到 执行 阶段 就 可 以 挽回 ， 所 以 ， 直 接 清空 流水 线 就 是 把 

误 分 支 上 的 指令 清 掉 ， 再 把 正确 分 支 上 的 指令 加 入 到 流水 线 ， 只 是 清空 流水 



























































线 代 价 比 较 大 。 
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El 


好 啦 各 位 ， 关 于 微 架构 这 块 咱们 说 到 这 就 够 用 了 ， 
线 的 ， 不 能 偏离 目标 太 远 啦 。 














3 们 当初 是 想 解 决 代码 4-3 中 第 78 行 的 清空 流水 





使 用 远 跳 转 指令 清空 流水 线 ， 更 新 段 描述 符 缓冲 寄存 器 


大 伙 应 该 还 记得 代码 4-3 中 的 第 78 行 的 无 条 件 跳 转 指 令 吧 : 


| jmp dword SELECTOR CODE:p mode start 





























当时 在 遇 到 它 的 时 候 只 是 简单 地 说 了 一 下 ， 本 节 该 把 它 严 肃 地 说 清楚 了 。 为 什么 要 用 jmp 远 转移 ， 是 











因为 我 们 有 两 个 问题 要 解决 。 




































































首先 ， 段 描述 符 缓 冲 寄存 器 未 更 新 ， 它 还 是 实 模式 下 的 值 ， 进 入 保护 模式 后 需要 填 入 正确 的 信息 。 


在 讲述 保护 模式 下 的 寄存 器 扩展 时 ,我 们 说 到 了 上段 描述 符 缓 冲 寄存 器 ， 它 首次 在 80286 中 出 现 ， 是 为 了 






































加 速 段 描 述 符 中 信息 的 访问 而 设 的 。 如 今 的 32 位 CPU 的 保护 模式 也 依然 要 月 














日 到 段 
































i 述 符 缓 冲 寄存 器 。32 




















位 CPU 虽然 兼容 实 模式 ， 但 在 实 模式 下 运行 时 并 不 是 变 成 纯 16 位 的 CPU。 兼容 是 指 能 够 正确 处 理 16 位 模 
式 的 程序 ， 并 不 要 求 变 成 16 位 CPU。 在 16 位 CPU 中， 访问 内 存 时 段 基 址 要 左 移 4 位， 然后 再 与 段 内 偏 移 
地 址 相 加 求 和 后 去 访问 内 存 。 而 此 过 程 在 32 位 CPU 的 实 模式 下 有 所 不 同 ,， 即 段 基 址 左 移 4 位 后 被 送 入 了 段 
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总 结 一 下 。 






































段 描 述 符 缓冲 寄存 器 在 CPU 的 实 模式 和 保护 模式 中 都 同时 使 用 ， 在 不 如 





























开 














苗 述 符 绥 冲 寄存 器 ， 随 后 再 用 此 缓冲 寄存 器 的 值 与 段 内 偏 移 地 址 相 加 。 也 就 是 说 ，32 位 的 CPU 已 经 有 了 组 
冲 寄 存 器 ， 就 应 该 充分 发 挥 其 作用 。 既 然 CPU 实 模式 下 的 段 基 址 每 次 都 要 左 移 4 位 ， 何 不 将 左 移 4 位 后 的 
结果 放 到 段 描述 符 缓冲 寄存 器 中 缓存 起 来 , 下 次 再 有 段 内 访问 时 就 不 用 再 重复 计算 段 基 址 了 。 由 于 实 模式 下 
的 段 基 址 只 有 20 位 ， 所 以 段 描述 符 缓冲 寄存 器 中 的 低 20 位 有 效 ， 用 于 存储 段 基 址 ， 划 


























他 位 都 为 0。 


新 引用 一 个 段 时 ， 段 描述 符 











缓冲 寄存 器 中 的 内 容 是 不 会 更 新 的 ， 无 论 是 在 实 模式 ， 还 是 保护 模式 下 ，CPU 都 以 段 描 述 符 缓冲 寄存 器 
































中 的 内 容 为 主 。 实 模式 进入 保护 模式 时 ， 由 于 段 描 述 符 缓冲 寄存 器 中 的 内 容 仅 仅 是 实 模 式 下 的 20 位 的 段 
































存 器 ， 也 就 是 要 想 办 法 往 相 应 段 寄存 器 中 加 载 选择 子 。 
其 次 ， 流 水 线 中 指令 译 码 错误 。 













































































基 址 ， 很 多 属性 位 都 是 错误 的 值 ， 这 对 保护 模式 来 说 必然 会 造成 错误 ， 所 以 需要 马上 更 新 段 描述 符 缓 冲 寄 








在 默认 情况 下 ， 如 果 未 使 用 bits 伪 指 令 来 设置 运行 环境 ， 编 译 器 就 将 代码 按照 16 


立 实 模式 编译 。 代 




















码 4-3， 即 loader.S 中 唯一 的 bits 指令 是 在 81 行 ， 所 以 80 行 之 前 的 代码 运行 在 实 模式 之 下 ， 它 们 是 16 位 


















































间 令 格式 。 第 81 行 的 [bits 32] 是 让 编译 器 将 此 行 后 面 的 指令 编译 成 为 32 位 。 


下 了 ， 我 们 知道 保护 模式 下 的 指令 是 32 位 ， 所 以 要 编译 成 符合 保护 模式 的 指令 格式 。 


我 们 已 经 知道 ，CPU 为 了 提高 效率 而 采用 了 流水 线 ， 这 样 ， 指 令 间 是 重 登 执行 的 。 第 76 行 之 前 的 指 

















令 都 是 16 位 指令 ， 自 76 行 之 后 ，CPU 便 进 入 了 保护 模式 ， 故 第 78 行 的 指令 已 








,经 是 在 保护 模式 下 了 ， 但 














导 为 此 处 已 经 是 在 保护 模式 






































它 依然 还 是 16 位 的 指令 ， 相 当 于 处 于 16 位 保护 模式 下 。 为 了 让 其 使 用 32 位 
令 dword,， 故 其 机 器 码 前 会 加 0x66 反 转 前 级 。 而 第 81 行 后 的 代码 是 在 [bits 32] 之 后 ,所 以 全 是 32 位 指令 。 
流水 线 的 工作 是 这 样 的 : 在 第 76 行 代码 执行 的 同时 , 第 78 行 和 之 后 的 部 分 指令 已 经 被 送 上 流水 线 了 ， 



















































































ES 

















旧 是 ， 段 描述 符 缓冲 寄存 器 在 实 模式 下 时 已 经 在 使 用 了 ， 其 低 20 位 是 段 基 址 ， 但 其 


局 移 地 址 ， 所 以 添加 了 伪 指 











位 默认 为 0， 也 就 














的 ， 这 就 十 了， 人 家 83 行 开始 的 指令 明明 是 32 位 指令 ，16 位 和 32 位 的 指令 都 有 各 


是 描述 符 中 的 D 位 为 0, 这 表示 当前 的 操作 数 大 小 是 16 位 。 流水线 上 的 指令 全 是 按照 


















































么 能 不 出 错 呢 ?所 以 ， 如 果 将 第 78 行 的 跳 转 指令 去 掉 ， 程 序 将 在 第 83 行 开始 出 错 ， 
码 是 32 位 指令 格式 ， 而 CPU 是 将 其 按照 16 位 指令 格式 来 译 码 的 ， 译 码 之 后 在 其 执行 





自 不 同 的 意义 ， 这 怎 














16 位 操作 数 来 译 码 





n 


原因 就 是 83 行 的 代 





时 ， 必 然 是 错误 的 。 


综 上 所 述 ， 解 决 问题 的 关键 就 是 既 要 改变 代码 段 描述 符 缓 冲 寄存 器 的 值 ， 又 要 清空 流水 线 。 
























































尺码 段 寄 存 器 cs， 只 有 用 远 过 程 调 用 指令 call、 远 转移 指令 jmp、 远 返 下 




















指令 retf 等 指令 间接 改变 ， 






































没有 直接 改变 cs 的 方法 ， 如 直接 mov cs，xx 是 不 行 的 。 另 外 ， 之 前 介绍 过 了 流水 线 原 理 ，CPU 遇 到 jmp 



























































站 令 时 ， 之 前 已 经 关上 流水 线 上 的 指令 只 有 清空 ， 所 以 jmp 指令 有 清空 流水 线 的 凶 
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奇 功 效 。 











故 ， 用 





无 条 件 远 跳 转 指令 jmp 来 解决 | 








上 述 两 个 问题 


页 将 是 一 





举 两 得 的 做 法 。 


补充 一 下 , 代码 4-3 的 第 78 行 jmp dword SELECTOR_CODE: p_mode_start, 由 于 已 经 身 处 保护 模式 ， 











所 以 CPU 将 此 指令 1 














所 以 操作 数 是 16 位 ， 当 
是 16 位 。 
两 者 的 区 别 见 

表 4-16 























表 4-16。 


汇编 代码 


前 属于 16 位 
而 且 p_mode_start 的 地 址 并 没有 超过 








呆 护 模式 。 故 ， 在 这 











的 SELECTOR_CODE 认为 是 选择 子 。 因 为 当前 段 描 述 符 缓 冲 寄存 器 : 











的 D 位 是 0， 























机 器 码 对 比 


实际 指令 


文 里 也 可 以 把 





巴 dword 去 掉 ， 
16 位 ， 用 dword 表示 的 32 位 地 址 并 没有 发 挥 其 功效 。 这 


毕竟 当 


前 操作 数 大 小 就 























机 器 码 





jmp dword 
SELECTOR_CODE: pP_mode start 


jmp far 0008: 00000b4b 


66ea4b0b00000800 





jmp SELECTOR_CODE: p_mode start 


绷 。 


是 指 反 转 操作 数 大 小 前 绥 























保护 模式 中 的 保护 三 字体 现在 哪里 ? 其实 主要 体现 在 段 
E 质 ， 是 用 来 给 CPU 
的 合法 性 ， 从 而 起 到 了 保护 的 作用 。 

本 节 围 绕 内 存 段 来 做 个 基本 的 阐述 ， 其 他 方面 的 保护 ， 如 特权 级 ， 以 后 








同 : 


入 契 











的 。 这 些 属性 








] 来 描述 





时 ，CPU 用 这 些 属性 来 检查 动作 下 











第 一 行 的 机 器 码 为 66ea4b0b00000800。 力 


块 内 存 的 和 





1 了 伪 指 令 


jmp far 0008: 0b48 





ea480b0800 












































































































































令 的 机 器 码 大 小 ， 


第 二 行 的 机 器 码 为 ea480b0800， 这 是 引用 的 16 位 地 址 。 
至 于 操作 数 中 的 偏 移 地 址 ， 一 个 是 0xb4b， 一 个 是 0xb48， 
空间 不 同 导致 的 ， 大 家 可 以 数 下 这 两 个 指 


保护 模式 之 内 存 段 的 保护 


dword 后 ， 编 译 器 引 


它们 之 间 差 了 3， 是 
确实 是 差 了 3 字 节 。 




















i 述 符 的 属性 字段 
收 参考 的 ， 














j 32 位 地 址 ， 所 以 加 了 0x66 











不 同 指令 本 身 所 占 




















中 。 每 个 字段 都 不 是 多 余 
当 有 实际 动作 在 这 片 内 存 上 发 生 


























们 再 开 专门 的 章节 来 细 说 。 





















































4.6.1 向 段 寄存 器 加 载 选择 子 时 的 保护 

当 引 用 一 个 内 存 段 时 , 实际 上 就 是 往 段 寄存 器 中 加 载 个 选择 子 , 为 了 避免 出 现 非 法 引用 内 存 段 的 情况 ， 
在 这 时 候 ， 处 理 器 会 在 以 下 几 方 面 做 出 检查 。 

首先 根据 选择 子 的 值 验证 段 描述 符 是 否 超越 界限 。 

选择 子 的 高 13 位 是 段 描 述 符 的 索引 值 ， 第 0 一 1 位 是 RPL， 第 2 位 是 TI 位。 忘记 其 结构 的 同学 














五 



































述 符 的 最 后 1 字 节 一 定 要 在 描 






















































































基地 址 + 选择 子 : 
地 址 + 描述 符 表 界限 值 。 
检查 过 程 如 下 : 处理 器 








可 以 参考 图 4-8。 首 先 处 理 器 得 保证 选择 子 是 























节 ， 所 以 在 往 段 寄 存 器 中 加 载 选 择 子 时 ， 处 至 
的 索引 值 *8+7 <= 描 述 


先 检查 TI 的 值 








符 表 基 














， 如 果 











TI 是 0， 则 从 全 局 描述 符 表 寄存 器 gdtr 中 拿 到 GDT 








基地 址 和 GDT 界限 值 。 











如 果 TI 是 1， 则 从 局 部 描 


述 符 表 寄存 器 ldtr 中 拿 到 LDT 其 地址 和 LDT 界限 

















值 。 有 了 描述 符 表 基地 址 和 


























i 述 符 表 界 限 值 





后 , 把 





























选择 子 的 高 13 上 四 
处 理 器 则 抛 出 异 





















































的 表达 式 ， 若 不 成 立 ， 
。 过 程 如 图 4- 
在 此 提 庚 一 下 GDT 中 的 第 0 个 描述 符 


16 所 示 。 
是 空 描 








E 确 的 ， 判 断 的 标 ; 














茧 述 符 表 (GDT 或 LTDT) 中 描述 符 的 个 数 。 这 就 像 数 组 下 标 一 样 ， 绝 对 不 能 越界 。 也 就 是 说 ， 段 描 
述 符 表 (GDT 或 LDT) 的 界限 地 址 之 内 。 每 个 段 





E 是 选择 子 的 索引 值 一 定 要 小 于 等 于 























i 述 符 的 大 小 是 8 字 




















索引 值 *8+7< 
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A 


器 要 求 选择 子 中 的 索引 值 要 满足 下 


0 
描述 符 索 引 值 





受 | 

















外 表达 式 : 描述 符 表 











描述 符 表 
GDT 或 LDT 


4-16 ”加 载 选择 子 时 的 保护 
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述 符 ， 如 果 选 择 子 的 索引 
























































































































































































































































值 为 0 则 会 引用 到 它 。 所 以 ， 不 允许 往 CS 和 SS 段 寄 存 器 : 




















加 载 索 引 值 为 0 的 选 





































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































择 子 。 虽然 可 以 往 DS、ES、FS、GS 寄存 器 中 加 载 值 为 0 的 选择 子 , 但 真正 在 使 用 时 CPU 将 会 抛 出 异常 ， 
毕竟 第 0 个 段 描述 符 是 哑 的 ， 不 可 用 。 

段 描述 符 中 还 有 个 type 字段 ， 这 用 来 表示 段 的 类 型 ， 也 就 是 不 同 的 段 有 不 同 的 作用 。 在 选择 子 检查 
过 后 ， 就 要 检查 段 的 类 型 了 。 

这 里 主要 是 检查 段 寄 存 器 的 用 途 和 段 类 型 是 否 匹 配 。 大 的 原则 如 下 。 

e。 只 有 具备 可 执行 属性 的 段 〈 代 码 段 ) 才能 加 载 到 CS 段 寄 存 器 中 。 

。 只 具备 执行 属性 的 段 〈 代 码 段 ) 不 允许 加 载 到 除 CS 外 的 段 寄 存 器 中 。 

。 只 有 具备 可 写 属性 的 段 (数据 段 〉 才 能 加 载 到 SS 栈 段 寄存 器 中 。 

。 至 少 具 备 可 读 属 性 的 段 才 能 加 载 到 DS、ES、FS、GS 上 段 寄 存 器 中 。 

如 果 CPU 发 现 有 任意 上 述 规 则 不 符 ， 检 查 就 不 会 通过 。 以 上 所 述 可 见 表 4-17。 

表 4-17 段 类 型 检查 

代码 段 (X=1) 数据 段 (X=0) 
段 寄存 器 
只 执行 (R=0) 执行 + 可 读 (R=1) 只 读 (R=1，W=0) 读 写 (W=1) 

CS 通过 通过 不 通过 不 通过 
DS 不 通过 通过 通过 通过 
ES 不 通过 通过 通过 通过 
FS 不 通过 通过 通过 通过 
GS 不 通过 通过 通过 通过 
SS 不 通过 不 通过 不 通过 通过 

仿 查 完 type 后 ， 还 会 再 检查 段 是 否 存在 。CPU 通过 段 描 述 符 中 的 P 位 来 确认 内 存 段 是 否 存在 ， 如 果 
P 位 为 1， 则 表示 存在 ， 这 时 候 就 可 以 将 选择 子 载 入 段 寄存 器 了 ， 同 时 段 描 述 符 缓冲 寄存 器 也 会 更 新 为 选 
择 子 对 应 的 段 描述 符 的 内 容 , 随后 处 理 器 将 段 描述 符 中 的 A 位 置 为 1, 表示 已 经 访问 过 了 。 如 果 P 位 为 0， 
则 表示 该 内 存 段 不 存在 ， 不 存在 的 原因 可 能 是 由 于 内 存 不 足 ， 操 作 系 统 将 该 段 移出 内 存 转 储 到 硬盘 上 了 。 
这 时 候 处 理 器 会 抛 出 异常 ,自动 转 去 执行 相应 的 异常 处 理 程 序 ， 异常 处 理 程序 将 段 从 硬盘 加 载 到 内 存 后 并 
将 P 位 置 为 1， 随 后 返回 。CPU 继续 执行 刚才 的 操作 ， 判 断 P 位 。 

注意 啦 ， 以 上 所 涉及 到 的 P 位 ， 其 值 由 软件 〈 通 常 是 操作 系统 ) 来 设置 , 由 CPU 来 检查 。A 位 由 CPU 
来 设置 。 
4.6.2 ”代码 段 和 数据 段 的 保护 

对 于 代码 段 和 数据 段 来 说 ，CPU 每 访问 一 个 地 址 ， 都 要 确认 该 地 址 不 能 超过 其 所 在 内 存 段 的 范围 。 

前 面 说 过 啦 ， 实 际 段 界限 的 值 为 ; 

《描述 符 中 段 界限 +1) *《〈 段 界限 的 粒度 大 小 : 4Kk 或 者 1) -1。 

fC A 

实际 段 界 限 大 小 = 描述 符 中 有 段 界限 *0x1000+0xFFF 

其 中 ，0xFFF 是 4k 〈0x1000) 中 以 0 为 起 始 的 最 后 一 字 节 。 所 以 此 公式 的 意义 是 以 0 为 起 始 的 段 偏 
移 量 ， 即 段 界限 。 推 导 过 程 也 很 简单 ， 就 是 将 原 公 式 展开 : 

(描述 符 中 段 界 限 +1〉*4k-1= 描 述 符 中 段 界 限 *4k+4k-1 = 描述 符 中 段 界限 *0x1000+OxFFF。 

实际 的 段 界 限 大 小 ， 是 段 内 最 后 一 个 可 访问 的 有 效 地 址 。 由 于 有 了 上 段 界 限 的 限制 ， 我 们 给 CPU 提交 的 每 
一 个 内 存 地 址 ， 无 论 是 指令 的 地 址 ， 还 是 数据 的 地 址 ，CPU 都 要 帮 我 们 检查 地 址 的 有 效 性 。 首 先 地 址 指向 的 
数据 是 有 宽度 的 ，CPU 要 保证 该 数据 一 定 要 落 在 段 内 ， 不 能 “ 骑 ” 在 段 边 界 上 。 下 面 我 们 分 情况 讨论 。 

对 于 代码 段 来 说 ， 段 中 的 “数据 ”是 各 种 机 器 指令 。 有 部 分 同学 总 以 为 具有 数据 段 才 用 内 存 分 段 策略 
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访问 ， 这 





是 4 误会 2 


不 掉 的 ^ ^。 代 码 段 既然 也 是 内 存 ! 
在 32 位 保护 模式 下 ， 段 基 址 存放 在 CS 寄存 器 ! 
CS: EIP 只 是 指令 的 起 始 地 址 ， 指 令 本 身 























这 里 








重申 一 下 ， 在 IA32 体系 结构 中 ， 访 问 内 存 就 要 月 


























的 区 域 ， 所 以 对 了 





























， 段 内 1 

















度 有 2 字 节 的 


3 字 节 的 等 ， 


» 





整 ” 地 任 ; 


F 昔 ` 一 … 
L / 己 \ 





EIP 中 的 优 





CPU 则 会 抛 虽 
这 利 





类 到 


作 数 引 
据 地 二 








上 也 要 遵 

















同 图 4-1 
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口 
户 





























循 此 原则 : 


址 + 数据 长 度 -1 和 实际 段 界限 大 小 

7 类 似 , 数据 段 的 段 界 限 也 是 段 内 可 访问 的 最 后 一 个 地 址 ， 
所 以 不 允许 出 现 数 
举 个 例子 ， 假 设 数 据 段 描述 符 的 段 界 限 是 0x12345， 段 基 址 为 0x00000000。 


中 


十 





6466 9 
器 | 外 














如 果 G 位 为 0， 己 
0x1000+0xFFF=0x1234S$SFFF。 如 果 访 问 的 数 # 





若 数 和 
际 段 界限 之 内 





o 


了 分 都 在 当前 的 代码 段 内 ， 也 就 是 要 满足 以 下 条 件 : 
移 地 址 + 指令 长 度 -1 三 实际 段 界限 大 小 
如 果 不 满足 条 件 ， 如 图 4-17 所 示 ， 


已 2 
DO 开 避 。 


边界 检查 对 于 数 
型 数据 的 长 度 不 一 致 ， 这 就 是 数据 类 型 的 作用 
要 “完全 、 完 整 ”地 


居 段 也 是 一 档 


E 意 部 分 都 要 在 当前 数 拉 


了 么 实际 段 界 限 便 是 0x12345。 如 
地址 是 0x12345FFF， 还 要 看 访问 的 数据 
四 大 小 是 1 字 节 ， 如 mov ax，byte [0x12345fff]， 这 种 内 存 操作 一 点 问题 都 没有 





也 是 有 长 度 的 ， 之 前 我 们 见 过 
其 机 器 码 为 ebfe， 大 小 就 是 2 字 节 





如 jmp .-2, J 








间 令 未 完整 地 落 在 本 段 内 ， 





FE， 数据 也 是 有 长 度 的 (不 同 
)，CPU 也 要 保证 操 
居 段 内 。 所 以 ， 数 
























































多 


So 











段 边界 的 性 不 再 单独 











况 ， 这 上 





屠 | 





























日 分 段 策 略 ， 这 是 它 的 宿 俞 ， 逃 








代码 段 的 访问 也 要 用 “ 段 基 址 : 段 内 偏 移 地 址 ”的 形式 ， 
局 移 地 址 ， 即 有 效 地 址 ， 存 放 在 EIP 寄存 器 中 。 








各 种 各 样 的 机 器 码 ， 它 们 的 长 
。CPU 得 确保 指令 “ 


人 
es 














机 器 码 跨 段 了 

“ 骑 ” 在 了 段 界限 上 
如 此 处 机 器 码 为 ebfe 
eb 在 段 A, fe 在 段 B 


低地 址 


指令 超过 段 界 限 ，CPU 将 抛 出 异常 
到 4-17 ”代码 段 非法 访问 














A 

















果 G 位 为 1， 








那么 实际 段 界 限 便 是 0x12345* 

















中 人 
居 宽 度 。 








， 数 据 完全 在 实 














若 该 数据 大 小 是 2 字 节 ， 如 mov ax，word [0x12345fff]， 这 种 内 存 操 作 超 过 了 实际 的 段 界限 ， 数 据 所 





在 地 址 分 别 是 0x12345FFF 和 0x12346000 这 7 


4.6.3” 栈 段 的 保护 


前 面 我 们 
情况 。 





情 





丽人 个 字 节 ，CPU 会 抛 异常 。 














在 loader.S 中 用 























虽然 段 描述 符 type 中 的 e 位 用 来 表示 段 的 扩 


























上 


展 ， 也 依然 可 以 引 


十 、 相 Ar 日 .不 


划 述 段 的 性 质 ， 即 使 e 等 于 1 




















了 向 上 扩展 的 数据 段 作 为 栈 段 ， 本 节 介 绍 下 

















j 向 下 扩展 的 数据 段 作 为 栈 段 的 




















展 方向 ， 但 它 和 别 的 描述 符 属性 





样 ， 仅 仅 是 用 来 














向 下 扩展 ， 依 然 可 以 引用 不 断 向 





























作用 ， 


2b 人 尔 
可 能 您 


与 











述 


付 赴 但 





扩展 的 段 有 什 


CPU 对 数据 段 的 检查 
上 一 节 提 到 的 数 # 





CPU 将 按照 
现在 段 界限 的 





对 于 向 
对 于 向 
我 知道 这 么 说 您 可 能 不 会 明白 


么 区 别 ? 











四 段 就 可 以 用 作 栈 。 




















一 项 就 是 看 地 址 是 否 超越 段 界 限 。 如 果 将 








意义 上 。 
上 扩展 的 段 ， 
下 扩展 的 段 ， 














由 于 





F 栈 段 是 向 下 扩展 的 ， 也 许 有 同学 觉得 段 界限 似乎 





韦 





韦 





大 小 范 





， 沁 











能 的 原因 
实 不 然 ， 
址 本 身 由 








低 向 








高 发 


可 没有 负数 之 说 ， 所 以 段 界 氏 
是 您 把 位 于 高 地 址 处 的 栈 底 当成 了 基准 ， 心 想 :“ 在 者 
栈 的 段 界 限 是 以 栈 段 的 基 
展 ， 段 界限 也 是 个 地 











四 段 的 方式 检查 该 段 。 如 果 用 向 下 扩 





实际 的 段 界限 是 段 内 可 以 访问 的 最 后 一 字 节 。 





展 的 段 做 栈 


上 递增 的 内 存 地 址 ， 即 使 e 等 于 0 向 
j 不 断 问 下 递减 的 内 存 地 址 。 栈 项 指针 [ejsp 的 值 逐渐 降低 ， 这 是 push 指令 的 
向 下 扩展 无 关 ， 也 就 是 说 ， 是 数 志 
会 间 了 ， 本 来 以 为 向 下 扩展 的 段 是 专门 给 栈 用 的 ， 现 在 又 说 数据 段 就 可 以 / 





























j 作 栈 ， 那 它 与 向 上 














向 上 扩展 的 数据 段 用 作 栈 ， 那 


况 有 点 复杂 ， 这 体 


个， 





的 话 ， 





情 











实际 的 段 界限 是 段 内 不 可 以 访问 的 第 一 个 字 节 。 








， 下 面 咱们 具体 一 点 。 


























负数 更 为 “由 
。 如果 您 觉 


针 觉 得 栈 


: 准 之 上 为 正 ， 











FE 数 


民 肯 定 是 个 了 


























6 切 ”。 





且 段 界限 本 质 上 就 是 段 的 
的 段 界 限 应 该 是 负数 的 话 ， 可 
在 基准 之 下 当然 为 负 了 ”其 























Ee 


此 为 基准 的 ， 并 不 是 以 栈 底 ， 因 此 栈 的 段 
止 ， 而 栈 的 扩展 方向 是 由 高 地 址 向 低 


















































栈 顶 之 下 。 地 


界限 肯定 是 位 也 
地 址 ， 与 段 界限 有 个 碰撞 的 趋 
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势 。 为 了 避免 碰撞 ， 将 段 界限 地 址 +1 视 为 栈 可 以 访问 的 下 限 。 段 界限 +1， 才 是 栈 指针 可 达 的 下 边界 ， 如 
图 4-18 所 示 。 



































高 地 址 本 
已 用 空间 | 
ee + 一 栈 项 收 指 针 寄 存 器 ESP) 
剩余 空间 神 硕 地 址 
酚 段 边界 = 段 界 腿 +1 ， i 
段 界限 一 一 
低地 址 + 一 一 栈 段 基 址 ( 栈 自 寄存 器 SS) 
图 4-18 ” 械 的 段 界限 




















下 面 咱们 以 32 位 保护 模式 下 的 栈 为 例 简要 说 下 。 

32 位 保护 模式 下 栈 的 栈 顶 指针 是 esp 寄存 器 ， 栈 的 操作 数 大 小 是 由 B 位 决定 的 ， 我 们 这 里 假设 B 为 
1， 即 操作 数 是 32 位 。 栈 段 也 是 位 于 内 存 中 ， 所 以 它 也 要 受 控 于 段 描述 符 中 的 G 位 。 

。 如果 G 为 0， 实 际 的 段 界 限 大 小 = 描述 符 中 的 段 界 限 。 

。 如 果 G 为 1， 实 际 的 段 界 限 大 小 = 描述 符 中 段 界限 *0x1000+0xFFF。 
同 代码 段 的 操作 数 一 样 ， 用 于 压 栈 的 操作 数 也 有 其 长 度 ，push 指令 每 向 栈 中 压 入 操作 数 时 ， 实际 上 就 
是 将 esp 指针 减 去 操作 数 的 大 小 (2 字 节 或 4 字 节 ) 后 ， 再 将 操作 数 复制 到 esp 减 4 后 的 新 地 址 。 栈 指针 
可 访问 的 最 低地 址 是 由 实际 段 界 限 决定 的 ,但 栈 段 最 大 可 访问 的 地 址 是 由 B 位 决定 的 ,我 们 这 里 B 位 为 1， 
表示 32 位 操作 数 ， 所 以 栈 指 针 最 大 可 访问 地 址 是 0xFFFFFFFF。 综 上 所 述 ， 每 次 向 栈 中 压 入 数据 时 就 是 
CPU 检查 栈 段 的 时 机 ， 它 要 求 必须 满足 以 下 条 件 。 

实际 段 界限 +1 科 esp- 操 作 数 大 小 科 0xFFFFFFFF 

假设 现在 esp 指针 为 0xFFFFE002， 段 描述 符 的 G 位 为 1， 描述 符 中 的 段 界 限 为 0xFFFFD。 故 实际 段 
界限 为 0x1000*FFFFD+0xFFF=0xFFFFDFFF。 当 执行 push ax, 压 入 2 字 节 的 操作 数 , 即 esp-2=0xFFFFE000， 
新 的 esp 值 三 实际 段 界 限 0xKFFFFDFFF +1。 如 果 执 行 push eax， 压 入 4 字 节 的 数据 ，esp-4=0xFFFFDFFE， 
小 于 实际 段 界 限 0xFFFFDFFF， 故 CPU 会 抛 出 异常 。 

由 于 esp 只 是 栈 段 内 的 偏 移 地 址 ， 其 真正 物理 地 址 还 要 加 上 段 基 址 。 假 设 段 基 址 为 0， 故 该 栈 段 : 

最 大 可 访问 地 址 为 0+0xFFFFFFFF=0xFFFFFFFF。 

最 小 可 访问 地 址 为 0+0xFFFFDFFF+1=0xFFFFE000。 

栈 段 空间 大 小 为 0xFFFFFFFF-0xFFFFE000=8KB。 

由 于 本 书 中 并 不 会 用 到 向 下 扩展 的 数据 段 ， 故 有 关于 此 的 内 容 到 这 里 就 结束 了 ， 咱 们 把 更 多 的 精力 放 
在 后 面 的 操作 系统 上 。 

本 章 到 此 结束 ， 下 章 咱们 再 见 。 
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的 所 有 章节 属于 人 








局 理论 基础 ， 毕 





Se 





在 上 一 章 中 虽然 介绍 了 保护 模式 ， 但 过 多 的 笔墨 是 花 在 了 理论 














兄 








从 本 章 开 始 ， 我 们 的 代码 将 在 保护 模式 下 工作 ， 除 了 开 
章 献 给 大 家 的 全 是 “ 硬 ” 货 。 从 这 一 刻 起 ， 我 们 才 算 帮 






































上 ， 对 于 实践 只 是 浅 举 加 止 。 
了 扎实 的 基本 功 才能 消化 更 深入 的 知识 。 





启 虚拟 内 存 外 ， 我 们 还 会 接触 到 























获取 物理 内 存 容量 


操作 系统 是 计算 机 硬件 的 管家 





























2 ee 


EE 理 











按照 预定 的 
说 的 一 套 管 









































Pra 























等 。f 
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中 , 是 用 








策略 使 硬 作 
里 资源 的 方法 ， 管 
保护 模式 最 “大 ”的 特点 就 是 寻 
这 些 和 内 存 有 着 


学 习 Linux 获取 内 存 
在 Linux 中 有 多 种 方法 获取 内 存 容量 ， 如 果 一 种 方法 失败 ， 就 会 试用 其 
detect_ memory 函数 来 获取 内 存 容 量 的 。j 
是 BIOS 中 断 0x15 的 3 个 子 功 能 ， 子 功能 号 要 存放 到 寄存 器 EAX 或 AX: 


资源 得 到 合理 的 运 ) 





， 它 不 仅 要 知道 














己 安 装 了 哪些 硬件 ， 还 得 给 出 有 效 


F 始 了 真正 的 操作 系统 学 习 之 旅 。 


4 旦 
本 



































]。 但 管理 策略 只 是 逻辑 上 的 东西 , 是 
































酒 言 ” 沿 右 
里 再 漂亮 ， 没 有 


二 的 概念 都 建立 在 物理 
内 存 上 落实 行动 。 为 了 在 后 期 做 好 内 存 管 理工 


的 方法 

















《大 2 


止 空 让 

















硬件 支撑 也 无 能 为 力 ， 真 正 干 活 的 都 是 底层 。 
在 进入 保护 模式 之 后 ， 我 们 将 接触 到 虚拟 内 存 、 


























存 之 上 ， 
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Pw 


















































。 EAX=0xE820: 遍历 主机 上 全 部 内 存 。 


AX=0xE801: 


AH=0x88: 最 多 检测 








咱们 先 得 知道 自 : 


其 函数 在 本 质 上 是 通过 调 




















当 的 管理 
操作 系统 上 





措施 ， 

















吾 
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内 存 

















无 论 



































,有 多 少 物理 内 存 才 行 。 
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> 如 下 。 


分 别 检 测 低 13MB 和 16MB~4GB 的 内 存 ， 最 大 支持 4GB。 
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若 三 种 方法 都 失败 了 ， 由 于 无 法 获取 








BIOS 中 断 可 以 返 匠 
































靠 硬 件 提供 的 接口 
Interface, API 





的 














程序 的 上 下 文保 























的 信息 ， 由 用 








户 程序 上 


























出 重点 














BIOS 0x135 : 








功能 较为 强大 ，0x15 中 断 











局 ， 信 息 量 相对 多 
提 到 了 子 功能 0x88 也 能 


些 ， 




















内 存 














上 64MB 内 存 ， 实 际 内 存 超 过 此 容量 也 按照 64MB 返回 。 
BIOS 中 断 是 实 模式 下 的 方法 ， 只 能 在 进入 保护 模式 前 调用 。 
在 实 模式 下 也 用 这 三 种 方法 检测 完 内 存 容量 后 再 进入 保护 模式 。 丸 
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。 另 外 ， 由 于 每 次 




















硬件 的 应 用 
时 




















周 用 


BIO : 








口 





口 

















时 可 以 


























次 ! 














出 





内 容 。 下 面 介绍 的 ! 








看 的 典范 。 





























已 
中 指定 。 
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不 








决 取 内 存 容 
中 的 dmesg 命令 就 与 0xE820 相关 ， 可 见 其 功能 是 很 大 的 ， 


子 功能 0xE820 和 0xE801 都 
梁 作 也 相对 复杂 。 











( 体 要 1 

















可 以 用 来 获取 内 存 ， 

















- 肚 . 
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目 . 四 As 


这 是 最 简单 的 用 法 ， 





而 0xE801 直接 返回 


口 








区 别 是 0xE820 返 
的 是 内 存 容量 ， 操 作 适 中 ， 不 繁 不 简 。 


EE 起， 停止 运行 。 

它 要 访问 硬件 也 要 依 
程序 接口 (Application Program 
都 是 有 一 定 的 代价 的 (比如 至 少 
到 原点 继续 向 下 执行 )， 所 以 尽量 在 
f 便 是 这 方 
周 用 的 功能 ， 需 要 在 寄存 器 ax 











里 论 概 念 说 得 多 高 大 上 ， 最 终 也 要 在 物理 








其 中 0xE8xx 系列 的 子 


要 


断 中 返回 足 量 

















也 方法 。 比 如 在 Linux 2.6 内 核 
| BIOS 中 断 0x15 实现 的 , 分 别 


9 们 效仿 Linux“ 不 弃 不 舍 ” 的 精神 ， 

[ 果 一 种 方法 获取 失败 , 尝试 男 一 种 方法 ， 
言 息 ， 后 续 程 序 无 法 加 载 ， 只 好 将 机 器 提 
已 安装 的 硬件 信息 ， 由 于 BIOS 及 其 中 断 也 只 是 一 组 软件 ， 
,所 以 , 获取 内 存 信息 , 其 内 部 是 通过 连续 调 
) 来 获取 内 存 信息 
护 起 来 以 便 从 ! 
己 挑 
断 提 供 了 丰富 的 功能 ， 


将 





口 











的 是 内 存 布 

















| 还 





不 过 操作 越 简 单 ， 功 能 也 就 越 薄弱 。 话 说 Linux 





























们 就 按照 功能 强 弱 的 顺序 逐一 介绍 用 


5.1.2 利用 BIOS 中 断 0x15 子 功能 0xe820 获取 内 存 
咱们 先 介 绍 0xE820 子 功 能 ， 这 是 最 灵活 的 内 存 获 取 方 式 。 














法 。 





BIOS 中 断 0x15 的 子 








功能 0xE820 能 够 获取 系统 
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内 存 布 
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本， 




















1 于 系统 内 存 各 部 分 的 类 型 






































性 不 同 ， 































































































BIOS 就 按照 类 型 属性 来 划分 这 片 系 统 内 存 ， 所 以 这 种 查询 呈 迭 代 式 ， 每 次 BIOS 只 返回 一 种 类 型 的 内 存 
言 息 ， 直 到 将 所 有 内 存 类 型 返回 完毕 。 子 功能 0xE820 的 强大 之 处 是 返回 的 内 存 信 息 较 丰富 ， 包 括 多 个 属 
性 字段 ， 所 以 需要 一 种 格式 结构 来 组 织 这 些 数 据 。 内 存 信息 的 内 容 是 用 地 址 范围 描述 符 来 描述 的 ， 用 于 存 
储 这 种 描述 符 的 结构 称 之 为 地 址 范围 描述 符 (Address Range Descriptor Structure，ARDS)， 格 式 见 表 5-1。 
表 5-1 地 址 范围 描述 符 结构 ARDS 
字 节 偏 移 量 属性 名 称 描述 
0 BaseAddrLow 基地 址 的 低 32 位 
4 BaseAddrHigh 基地 址 的 高 32 位 
8 LengthLow 存 长 度 的 低 32 位 ， 以 字 节 为 单位 
12 LengthHigh 为 存 长 度 的 高 32 位 ， 以 字 节 为 单位 
16 Type 本 段 内 存 的 类 型 


就 返回 这 档 











此 结构 中 的 字段 大 小 都 是 4 字 节 ， 
一 个 结构 的 数据 。 注 意 ，ARDS 结构 中 用 
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位 宽度 的 属性 来 描 














及 其 长 度 ， 所 以 表 中 的 基地 址 和 长 度 都 分 为 低 32 位 和 高 32 位 两 部 分 。 


操作 系统 使 ) 


Type 值 














其 中 的 Type 字段 ) 


























表 5-2 
名 














称 























j， 还 是 保留 起 来 不 能 用 。Type 字段 的 











地 址 范围 描述 符 结构 的 Type 字段 


描 述 


j 来 描述 这 段 内 存 的 类 型 ， 这 里 所 谓 的 类 型 是 说 明 这 段 内 存 的 用 ; 


\ 体 意义 见 表 5-2。 








共 5 个 字段 ,所 以 此 结构 大 小 为 20 字 节 。 每 次 int 0x15 之 后 , BIOS 
述 这 段 内 存 基地 址 〈 起 始 地 址 ) 




















途 ， 即 








是 可 以 被 
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AddressRangeMemory 


这 段 内 存 可 以 被 操作 系统 使 
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AddressRangeReserved 











内 存 使 














中 或 者 被 系统 保留 ， 操 作 系统 不 可 以 




















此 内 存 
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为 什么 BIOS 会 按 类 型 来 返回 





未 定义 


e 系统 的 ROM。 


由 于 某 种 原因 





由 于 我 们 在 32 位 环境 下 工作 ， 所 
BaseAddrLow+LengthLow 是 一 片 内 存 区 域 上 限 ， 单 位 是 字 节 。 正 常情 况 下 ， 不 会 出 现 较 大 的 内 存 





































































































未 定义 , 将 来 会 





前 保 





留 。 但 











到 ， 














ROM 用 到 了 这 部 分 内 存 。 
设备 内 存 映射 到 了 这 部 分 内 存 。 

， 这 段 内 存 不 适合 标准 
以 在 ARDS 结构 属性 中 ， 我 们 














内 存 信息 呢 ? 





E 设 


原因 











备 使 用 

















是 这 段 内 存 可 能 是 。 


o 





是 需要 操作 系统 一 样 将 























] 上 
只 用 



















































































































































































视 为 ARR (AddressRangeReserved) 


到 低 32 位 属性 。 





区 域 不 






















































































































































































可 用 的 情况 ， 除 非 安 装 的 物理 内 存 极其 小 。 这 意味 着 ， 在 所 有 返回 的 ARDS 结构 里 ， 此 值 最 大 的 内 存 块 
一 定 是 操作 系统 可 使 用 的 部 分 ， 即 主板 上 配置 的 物理 内 存 容量 。 
BIOS 中 断 只 是 一 段 函 数 例 程 ， 调 用 它 就 要 为 其 提供 参数 ， 现 在 介绍 下 BIOS 中 断 0x15 的 0xe820 子 
先 介绍 下 此 中 断 例 程 的 调用 方法 。 表 5-3 所 示 是 使 用 此 中 断 的 方法 ， 分 输入 和 输出 两 部 分 。 
表 5-3 BIOS 中 断 0x15 子 功能 0xE820 说 明 
调用 或 返 丐 寡 存 器 或 状态 位 参数 用 途 
EAX 子 功能 号 : EAX 寄存 器 用 来 指定 子 功能 号 ， 此 处 输入 为 0xE820 
ARDS 后 续 值 : 内 存 信息 需要 按 类 型 分 多 次 返回 ， 由 于 每 次 执行 一 次 中 断 都 只 返回 一 种 类 
调用 前 输入 这 型 内 存 的 ARDS 结构 ， 所 以 要 记录 下 一 个 待 返 可 的 为 存 ARDS， 在 下 一 次 中 断 调 时 通过 
此 值 告诉 BIOS 该 返回 哪个 ARDS, 这 就 是 后 续 值 的 作用 。 第 一 次 调用 时 一 定 要 置 为 0, EBX 
具体 值 我 们 不 用 关注 ， 字 取决 于 有 具体 BIOS 的 实现 。 每 次 中 断 返 回 后 ，BIOS 会 更 新 此 值 
ES: DI ARDS 缓冲 区 : BIOS 将 获取 到 的 内 存 信息 写 入 此 寄存 器 指向 的 内 存 ， 每 次 都 以 ARDS 格式 返回 
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5.1 获取 物理 内 存 容 量 
续 表 
调用 或 返 匠 寡 存 器 或 状态 位 参数 用 途 
pe ARDS 结构 的 字 节 大 小 : 用 来 指示 BIOS 写 入 的 字 节 数 。 调 用 者 和 BIOS 都 同时 支持 的 大 小 
a 是 20 字 节 ， 将 来 也 许 会 扩展 此 结构 
调用 前 输 
Be 固定 为 签名 标记 0x534d4150， 此 十 六 进 制 数字 是 字符 串 SMAP 的 ASCII 码 : BIOS 将 调用 者 正 
在 请 求 的 内 存 信息 写 入 ES: DI 寄存 器 所 指向 的 ARDS 缓冲 区 后 ， 此 签名 校 验 其 中 的 信息 
CF 位 若 CF 位 为 0 表示 调用 未 出 错 ，CF 为 1， 表示 调用 出 错 
EAX 字符 串 SMAP 的 ASCII 码 0x534d4150 
ES:DI ARDS 缓冲 区 地 址 ， 同 输入 值 是 一 样 的 ， 返 回 时 此 结构 中 已 经 被 BIOS 填充 了 内 存 信息 
返回 后 输出 - 
ee ECX BIOS 写 入 到 ES:DI 所 指向 的 ARDS 结构 中 的 字 节 数 ，BIOS 最 小 写 入 20 字 节 
后 续 值 : 下 一 个 ARDS 的 位 置 。 每 次 中 断 返 回 后 ，BIOS 会 更 新 此 值 ，BIOS 通过 此 值 可 以 
EBX 找到 下 一 个 待 返回 的 ARDS 结构 ， 咱 们 不 需要 改变 EBX 的 值 ， 下 一 次 中 断 调 用 时 还 会 用 到 
它 。 在 CF 位 为 0 的 情况 下 ， 若 返回 后 的 EBX 值 为 0， 表 示 这 是 最 后 一 个 ARDS 结构 
表 中 的 ECX 寄存 器 和 ES: DI 寄存 器 ， 是 典型 的 “ 值 -结果 ”型 


被 调用 


































































































函数 的 参数 ， 一 个 变量 是 缓冲 

















区 指针 ， 另 一 个 变量 是 缓冲 















































后 ， 将 实际 所 写 入 的 字 节 数 记录 到 缓冲 
根据 表 5-3 中 的 说 明 ， 此 中 断 的 调用 步骤 如 下 。 
(1) 填写 好 “ 调 | 














(2) 执行 中 断 调用 





(3) 在 



























































型 参数 ， 即 调 



































方 提 供 了 两 个 变量 作为 











区 大 小 。 被 调用 


函数 在 缓冲 





























CF 位 为 0 的 情况 下 ,“ 返 





区 大 小 变量 中 。 














前 输入 ”中 列 出 的 寄存 器 。 
int Ox15 。 
可 后 输出 ”中 对 应 的 寄存 器 便 会 有 





























对 应 的 结 








5.1.3 利用 











BIOS 中 断 0x15 子 功能 0xe801 获取 内 存 


点 不 便 的 是 此 方法 检测 到 的 内 存 是 分 别 存放 到 两 组 寄存 器 ， 
在 寄存 器 AX 和 CX 中 记录 ， 

=AX*1024。AX、CX 最 大 值 为 0x3c00， 
单位 数量 在 寄存 器 BX 和 DX 中 记录 ， 其 中 BX 和 DX 的 值 是 


单位 数量 


另 一 个 获取 内 存 容 量 的 方法 是 BIOSOx15 : 

















此 方法 虽 


然 简单 ， 但 功能 也 不 强大 ， 最 大 




















断 的 子 功 能 0xE801。 
































其 中 AX 和 CX 的 


























样 





























区 中 写 入 数据 


只 能 识别 4GB 内 存 ， 不 过 这 对 咱们 32 位 地 址 总 线 足够 了 。 稍 微 有 
的 。 低 于 15MB 的 内 存 以 1KB 为 单位 大 小 来 记录 ， 
































值 是 一 样 的 ， 所 以 在 15MB 空间 以 下 的 实际 内 存 容量 
即 0x3c00*1024=15MB。16MB~4GB 是 以 64KB 为 单位 大 小 来 记录 的 ， 
的 ， 所 以 16MB 以 上 空间 的 内 存 实际 大 小 











=BX*64*1024， 不 用 在 意 BX 和 DX 最 大 人 
咱们 还 是 列 个 表 ， 将 大 


是 多 少 ， 前 面 说 过 啦 ， 只 支持 4GB 空间 ， 您 可 以 反 推 一 下 看 看 。 
用 法 分 为 输入 、 输 出 两 部 分 介绍 。 表 5-4 所 示 是 子 功能 0xE801 的 使 用 方法 ， 




























































































































































































较 表 5-3 确实 容易 不 少 。 
表 5-4 BIOS 中 断 0x15 子 功能 0xE801 说 明 
调用 或 返 区 寡 存 器 或 状态 位 用 途 描述 
调用 前 输入 AX Function Code 子 功 能 号 : 0xE801 
CF 位 Carry Flag 若 CF 位 为 0 表示 调用 未 出 错 ，CF 为 1， 表示 调用 出 错 
以 1KB 为 单位 ， 只 显示 15MB 以 下 的 内 存 容量 ,， 故 最 大 值 为 0x3c00， 即 
AX Extended 1 ED 、 
AX 表示 的 最 大 内 存 为 0x3c00*1024=15MB 
返回 后 输出 2 64KB 为 单位 ， 内 存 空 间 16MB 一 4GB 中 连续 的 单位 数量 ， 即 内 存 大 
BX Extended 2 CS A 
小 为 BX*64*1024 字 节 
CX Configured 1 本 AX 
DX Configured 2 本 BX 














和 表 5-3 相 比 ， 表 5-4 多 了 
后 ，AX 和 CX 中 ， 其 值 的 单位 是 1KB， 而 BX 和 DX 的 单位 是 64KB。 


























«| 


用 途 ” 列 
































>» 而 且 是 英文 ， 





一 会 就 知道 用 在 哪 上 














了 。 再 次 提醒 ， 
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当初 我 看 到 这 儿 的 时 人 1 
(1) 为 什么 要 分 


本 人 


骨 











为 了 解决 第 1 个 问题 ， 让 我 们 实际 测试 下 ， 让 事实 








吴 ， 脑 子 中 不 禁 弹 4 








15MB” 和 “16MB 以 上 ”这 两 部 分 来 展示 4GB 内 存 ? 
(2) 为 什么 寄存 器 结果 是 重复 的 ? 如 寄存 器 AX 和 CX 相等 ，BX 和 DX 相等 ? 













































































H 了 两 个 问号 。 


舌 。 测 试 方法 是 修改 bochs 配置 文件 bochsrc.disk 

















中 的 内 存 容量 参数 megs， 然 后 执行 BIOS 中 断 。 测 试 结 果 见 表 5-5。 
表 5-5 BIOS 中 断 0x15 子 功 能 0xE801 实例 
实际 物理 内 存 AX BX 仿 测 到 的 内 存 大 小 
14MB 0x3400 0 AX*1024+BX*64*1024=13MB 
15MB 0x3800 0 AX*1024+BX*64*1024=14MB 
16MB 0x3C00 0 AX*1024+BX*64*1024=15MB 
17MB 0x3C00 0x10 AX*1024+BX*64*1024=16MB 
18MB 0x3C00 0x20 AX*1024+BX*64*1024=17MB 
































表 5-5 中 “实际 物理 内 存 ” 和 “检测 到 的 内 存 大 小 ” 它们 之 间 总 是 差 1IMB， 言 外 之 意 是 总 有 1MB 


内 存 不 可 用 。 这 是 怎么 


回 事 ? 真是 一 波 未 平 


























很 多 问题 都 是 祖 
当时 有 一 些 ISA 设备 要 
就 把 这 部 分 内 存 保 留 下 来 ， 














已 


























这 就 成 了 内 存 空洞 memory hole。 现 在 虽然 很 少 很 少 
保留 下 来 ， 只 不 过 是 通过 BIOS 选项 的 方式 由 用 户 自 

















到 








波 又 起 啊 。 








上 传 下 来 的 ， 即 著名 的 历史 遗留 











地 址 13MB 以 上 的 内 存 





问题 。 
人 为 缓冲 














操作 系统 不 可 以 用 此 段 

















LS 














也 不 相同 ， 不 过 大 概 意思 都 差不多 。 上 
memory hole at address 15m-16m 
将 此 选项 设 为 enable 或 disable 便 开 
话说 ， 起 初 定义 这 个 0xe801 子 功能 ， 就 是 为 了 支持 扩展 ISA 月 





























/ 














如 果 检 测 到 的 内 存 容量 大 于 等 


15MB， 而 BX* 








80286 # 
区 ， 也 就 是 此 缓冲 














有 24 位 

















区 











内 存 空间 。 保 留 的 这 部 分 内 存 
能 看 






































| 后 ， 














2 
Pa 








有 类 似 这 样 的 选项 : 











和 或 关闭 对 这 类 扩展 ISA 设备 上 


16MB，BIOS 0x15 中 断 返 





的 支持 。 
民 务 。 现 在 来 回答 这 个 问题 。 
































口 



































出 内 存 空洞 。 当 
































上 是 这 么 说 的 : 











也 址 线 ， 其 寻 址 空间 是 16MB。 
为 1IMB 大 小 ， 所 以 硬件 系统 
区 域 就 像 不 可 以 访问 的 
到 这 些 老 ISA 设备 了 ， 但 为 了 兼容 ， 
选择 是 否 开 启 。BIOS 厂商 不 同 ， 一 般 的 菜单 选项 名 称 
如 咱们 开机 进入 BIOS 界 孟 








Sem 
黑洞 ， 





这 部 分 空间 还 是 





的 结果 中 ，AX*1024 必然 是 小 于 等 于 




















64*1024 肯定 大 于 0。 所 以 ， 内 存 容量 分 成 两 部 分 











展示 ， 只 要 符合 这 两 个 结果 ， 








然 如 果 物 理 内 存在 16MB 以 下 ， 此 方法 就 不 灵 了 ， 但 检 涡 
1MB。 所 以 实际 的 物理 内 存 大 小 ， 在 检测 结果 的 基 
至 于 第 2 个 疑问 ， 手 册 


出 -| 

















上 一 定 要 加 上 1MB。 


就 能 检查 





1 到 的 内 存 依然 会 小 于 实际 内 存 


Not sure what this difference between the "Extended" and "Configured" numbers are, but they appear to be 


identical, as reported from the BIOS. 




















































































































































































































































































































这 人 句 英文 中 的 两 个 单词 "Extended" 和 "Configured" 已 经 在 表 5-4 的 “用 途 ” 列 中 出 现 了 ， 后 面 数字 相同 
的 为 一 组 ， 比 如 AX 的 用 途 为 Extended 1，CX 的 用 途 为 Configured 1，AX 和 CX 为 一 组 ，BX 和 DX 类 同 。 

这 人 句 英 文大 概 意思 是 : 不 清楚 "Extended” 和 “"Configured" 之 间 的 区 别 ， 但 它们 似乎 是 相同 的 ，BIOS 就 是 
这 样 说 的 。 咱 们 这 里 暂时 就 不 深究 了 ， 毕 竟 咱 们 只 是 想 拿 到 内 存 容量 ， 以 后 等 咱们 有 精力 了 再 深入 学 习 吧 。 

此 中 断 的 调用 步骤 如 下 。 

(1) 将 AX 寄存 器 写 入 0xE801。 

(2) 执行 中 断 调用 int 0x15。 

(3) 在 CF 位 为 0 的 情况 下 ,“ 返 回 后 输出 ”中 对 应 的 寄存 器 便 会 有 对 应 的 结果 。 
5.1.4 利用 BIOS 中 断 0x15 子 功 能 0x88 获取 内 存 

最 后 一 个 获取 内 存 的 方法 也 同样 是 BIOS 0x15 中 断 ， 子 功能 号 是 0x88。 该 方法 使 用 最 简单 ， 但 功能 
也 最 简单 ， 简 单 到 只 能 识别 最 大 64MB 的 内 存 。 即 使 内 存 容 量 大 于 64MB ， 也 只 会 显示 63MB ， 大 家 可 以 
自己 在 bochs 中 试验 下 。 为 什么 只 显示 到 63MB 呢 ? 因为 此 中 断 只 会 显示 1MB 之 上 的 内 存 , 不 包括 这 IMB， 
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咱们 在 使 用 的 时 候 记 得 加 上 1MB。 参 数 见 表 5-6。 

















































































































表 5-6 BIOS 中 断 0x15 子 功 能 0x88 说 明 
调用 或 返回 寡 存 器 或 状态 位 参数 用 途 
调用 前 输入 AH 子 功 能 号 : 0x88 
CF 位 若 CF 位 为 0 表示 调用 未 出 错 ，CF 为 1， 表示 调用 出 错 
返回 后 输出 AX 以 1KB 为 单位 大 小 ， 内 存 空 间 1MB 之 上 的 连续 单位 数量 ， 不 包括 低 端 
1MB 内 存 。 故 内 存 大 小 为 AX*1024 字 节 +1MB 

















中 断 返 回 后 ，AX 寄存 器 中 的 值 ， 其 单位 是 IKB 。 此 中 断 的 调用 步骤 如 下 。 
(1) 将 AX 寄存 器 写 入 0x88 。 

(2) 执行 中 断 调用 int 0x15。 

(3) 在 CF 位 为 0 的 情况 下 ,“ 返 回 后 输出 ”中 对 应 的 寄存 器 便 会 有 对 应 的 结果 。 










































































5.1.5 ”实战 内 存 容量 检测 


以 上 介绍 了 三 种 检测 内 存 的 方法 ， 是 时 候 将 它们 一 网 打 尽 测试 一 把 啦 。 
不 知道 各 位 怎么 想 的 ， 反 正 我 已 经 迫不及待 地 想 上 机 器 上 测试 一 下 啦 ， 上 沫 ， 见 代码 5-1。 


代码 5-1 (project/c5/a/boot/loader.S ) 














Sinclude "boot.inc" 
section loader vstart=LOADER BASE ADDR 
LOADER STACK TOP equ LOADER BASE ADDR 

















a 

2 

3 

4 

2 ;构建 gdt 及 其 内 部 的 描述 符 
此 处 是 定义 GCDT， 未 有 新 变化 




























































































… 略 
20 times 60 dq 0 
.… 略 
25 ; total mem bytes 用 于 保存 内 存 容量 ， 以 字 节 为 单位 ， 此 位 置 比较 好 记 
26 ; 当前 偏 移 loader .bin 文件 头 0x200 字 节 
; loader .bin 的 加 载 地 址 是 0x900 
27 ; 故 total mem _ bytes 内 存 中 的 地 址 是 0xb00 
; 将 来 在 内 核 中 咱们 会 引用 此 地 址 
28 total mem bytes dd 0 
DO Oe er 
30 
31; 以 下 是 定义 gqt 的 指针 ， 前 2 字 节 是 gqt 界限 ， 后 4 字 节 是 gqt 起 始 地 址 


32 gdt ptr dw GDT _ LIMIT 
33 dd GDT BASE 








35; 人工 对 齐 :total mem bytes4+gdt ptr6tards buf244+tards_nr2， 共 256 字 节 
36 ards buf times 244 db 0 




























































































































































































37 ards nr dw 0 3 记录 ARDS 结构 体 数 量 

38 

39 loader start: 

40 

41 ; int 15h eax = 0000E820h ,edx = 534D4150h ('SMAP') 获取 内 存 布局 

42 

43 XOLF ebx, ebx ;第 一 次 调用 时 ，ebx 值 要 为 0 

44 mov edx, 0x534d4150 ;edx 只 赋值 一 次 ， 循 环 体 中 不 会 改变 

45 mov di, ards buf ;ards 结构 缓冲 区 

46 .e820 mem get loop: ;循环 获取 每 个 ARDS 内 存 范 围 描述 结构 

47 mov eax, 0x0000e820 ;执行 int 0x15 后 ，eax 值 变 为 0x534qd4150， 
; 所 以 每 次 执行 int 前 都 要 更 新 为 子 功能 号 

48 mov ecx, 20 ;ARDS 地 址 范围 描述 符 结 构 大 小 是 20 字 节 

49 咎 人 ei 

50 jc .e820 failed so try e801 

; 若 cf 位 为 1 则 有 错误 发 生 ， 尝 试 0xe801 子 功能 

51 adqd di, cx ;使 di 增加 20 字 节 指向 缓冲 区 中 新 的 ARDS 结构 位 置 
忆 2 inc word [ards nr] ; 记录 ARDS 数量 

53 cmp ebx, 0 ; 若 ebx 为 0 且 cf 不 为 1， 这 说 明 ards 全 部 返 世 





; 当前 已 是 最 后 一 个 
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54 jnz .e820 mem get loop 


56 ;在 所 有 ards 结构 中 
; 找 出 (base_aqq_low + length low) 的 最 大 值 ， 即 内 存 的 容量 



































































































































5 mov cx, [ards nr] 

; 遍历 每 一 个 ARDS 结构 体 , 循环 次 数 是 ARDS 的 数量 

58 mov ebx, ards buf 

59 xor edx, edx ;edx 为 最 大 的 内 存 容量 ， 在 此 先 清 0 
60 .find max mem area: 

:无需 判断 type 是 否 为 1, 最 大 的 内 存 块 一 定 是 可 被 使 用 的 

61 mov eax [ebx] ;base add low 

62 addq eax, [ebx+8] ;length low 

63 add ebx, 20 ;指向 缓冲 区 中 下 一 个 ARDS 结构 
64 cmp edx, eax 

; 冒 泡 排 序 , 找 出 最 大 , edx 寄存 器 始终 是 最 大 的 内 存 容量 

65 jge .next ards 

66 mov edx, eax ;edx 为 总 内 存 大 小 

67 .next ards.: 

68 loop .find max mem area 

69 jmp .mem get ok 

VD 

71 };------ int 15h ax = E801h 获取 内 存 大 小 ， 最 大 支持 4G ”------- 
72 ; 返回 后 ，ax cx 值 一 样 , 以 KB 为 单位 ，bx dx 值 一 样 ， 以 64KB 为 单位 








73 ; 在 ax 和 cx 寄存 器 中 为 低 16MB， 在 bx 和 dx 寄存 器 中 为 16MB 到 4GB 
74 .e820 failed so try e801: 

















75 mov axr 0xe801 

76 Int 0x15 

77 jc .e801 failed so try88 ; 若 当 前 e801 方法 失败 ， 就 尝试 0x88 方法 
78 





79 ;1 先 算出 低 15MB 的 内 存 







































































; ax 和 cx 中 是 以 KB 为 单位 的 内 存 数量 ， 将 其 转换 为 以 byte 为 单位 
80 mov cx 0x400 ;cx 和 ax 值 一 样 ，cx 用 作 乘 数 
81 mul cx 
82 shl edx,16 
83 and eax, Ox0000FFFF 
84 or edx,eax 
85 adqd edx, 0x100000 ;ax 只 是 15MB， 故 要 加 1MB 
86 mov esi,edx ; 先 把 低 15MB 的 内 存 容量 存 入 esi 寄存 器 备份 
87 








88 ;2 再 将 16MB 以 上 的 内 存 转 换 为 byte 为 单位 
; ”寄存 器 bx 和 qx 中 是 以 64KB 为 单位 的 内 存 数 量 












































89 XOor eax, eax 

90 mov ax, bx 

91 mov ecx, 0x10000 ;0x10000 十 进 制 为 64KB 

92 mul ecx ; 32 位 乘法 ， 上 默认 的 被 乘 数 是 eax， 积 为 64 位 
;高 32 位 存 入 edx， 低 32 位 存 入 eax 

93 add esi, eax 

; 由 于 此 方法 只 能 测 出 4GB 以 内 的 内 存 ， 故 32 位 eax 足够 了 
































; edx 肯定 为 0， 只 加 eax 便 可 



















































































94 mov edx, esi ;edx 为 总 内 存 大 小 

95 jmp .mem get ok 

96 

97 ;----- int 15h ah = 0x88 获取 内 存 大 小 ， 只 能 获取 64MB 之 内 ----- 

98 .e801 failed so try88: 

99 ;int 15 后 ，ax 存 入 的 是 以 KB 为 单位 的 内 存 容 

100 mov ah, 0x88 

101 int 0x15 

于 02 jc .error hilt 

103 and eax, Ox0000FFFF 

104 

105 ;16 位 乘法 ， 被 乘 数 是 ax， 积 为 32 位 。 积 的 高 16 位 在 dx 中 

; 积 的 低 16 位 在 ax 中 

0 moOv cx- 0x400 

;0x400 等 于 1024, 将 ax 中 的 内 存 容量 换 为 以 byte 为 单位 

107 mul :Cx 

108 shl edx, 16 ;把 dx 移 到 高 16 位 

109 or edx, eax ;把 积 的 低 16 位 组 合 到 edx， 为 32 位 的 积 

110 add edx,0x100000 ;0x88 子 功能 只 会 返回 1MB 以 上 的 内 存 
; 故 实际 内 存 大 小 要 加 上 1MB 

汪汪 法 

112 .mem get ok: 

二 mov [total mem bytes], edx 
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| A byte 单位 


代码 5-1 是 为 了 演示 BIOS 中 断 0x15 的 


中 的 注释 还 是 很 全 的 ， 








后 存 入 total mem by 














再 结合 前 
































看 介绍 的 用 法 ， 大 家 应 该 很 容易 看 懂 


tes 处 

















法， 咱们 和 




















严 以 上 介绍 的 三 种 获取 内 存 的 方法 都 ) 














上 上 了。 代码 









































。 不 过 我 已 经 厚道 惯 了 ， 多 多 少 少 还 















































是 要 给 大 家 说 一 下 ， 代 码 虽 然 非 常 简单 ， 但 毕竟 揣摩 别人 的 思想 还 是 要 花 时 间 的 。 

本 代码 第 28 行 定 义 了 4 字 节 的 变量 total_ mem_bytes， 此 变量 用 于 存储 获取 到 的 内 存 容量 ， 以 字 节 为 
单位 。 也 是 啊 ， 经 过 千 辛 万 苗 才 获取 到 的 内 存 大 小 当然 要 赶紧 找 个 地 方 藏 起 来 了 ， 哈 哈 ， 有 点 奔 张 了 ， 总 
之 先 存 起 来 留 着 以 后 用 









































在 total_ mem_bytes 





面 有 4 个 段 
节 , 所 以 7 


便 




































































是 变量 total_ mem_bytes 加 载 到 内 存 : 
第 35 一 37 行 是 提前 定义 的 组 六 








定义 的 地 方 上 面 有 
































行 该 中 册 
编程 省 事 ， 处 到 














一 次 便 会 得 到 

















址 是 ards_ buf， 但 缓冲 
个 ARDS 结构 。 所 以 
其 分 配 244 字 节 ， 哈 
使 其 在 文件 内 的 1 














口 




















先 估计 


人 





区 大 


小 是 多 少 合适 呢 
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和 区， 为 的 是 存储 
个 ARDS 结构 的 数据 ， 按 理 
的 思路 是 将 所 有 ARDS 都 得 到 后 再 统一 遍历 ， 所 以 我 们 就 申请 个 大 


| 个 数 吧 ， 不 够 了 再 加 
点 奇怪 是 不 ， 为 什么 有 零 有 整 的 ? 这 是 为 了 手 了 
扁 移 地 址 为 0x300。 这 纯 属 个 人 喜好 ， 就 是 想 凑 个 整数 ， 显 





儿 行 












































注释 ， 曾 述 了 total_ mem_bytes 的 地 址 是 0xb00。 理 由 是 它 前 
苗 述 符 的 定义 ， 还 有 预 留 60 个 段 描 述 模 位 times 60 dq 0。 段 描述 符 大 小 是 8 字 节 ，dg 也 是 8 字 
篇 移 量 是 (4+60)*8=512=0x200 字 节 。 本 程序 的 加 载 地 址 是 0x900,，0x900+0x200=0xb00， 所 以 0xb00 








的 地 址 。 将 来 在 内 核 中 实现 内 存 分 配 系统 时 还 会 ) 








口 


BIOS 0x15 中 断 0xe820 子 功能 返 





























说 缓冲 























到 此 地 址 。 
的 ARDS 结构 。 每 执 





x 的 大 小 等 于 ARDS 结构 的 大 小 就 行 了 ， 但 为 了 




















些 的 缓冲 


又 地 





Xx。 缓冲 











? 已 入 

















《在 本 机 实际 测试 ， 











[一 个 ARDS 结构 是 20 字 节 ， 具 体 多 大 取决 于 到 底 会 有 多 少 
共 返 回 了 6 个 ARDS 结构 )。 在 这 里 先 为 

















得 好 看 。 











[对 齐 下 面 39 行 的 标签 loader_start， 
您 看 ，total mem_bytes 


是 4 字 节 ，gdt ptr 是 6 字 节 ，ards_buf 是 244 字 节 ，ards_nr 是 2 字 节 ， 加 起 来 的 和 是 256 字 节 ， 即 0x100。 加 


上 total_mem_bytes 在 文件 








内 偏 移 地 址 是 0x200， 所 以 loader start 在 文件 内 的 1 














扁 移 地 址 是 0x100+0x200=0x300。 





代码 “ards_buf times” 的 大 小 是 244 字 贡 纯粹 是 凌 出 来 的 ， 无 实际 意义 ， 哈 哈 ， 这 属于 传阅 中 的 强迫 症 行为 。 








上 一 版 本 loader.S (project/c4/a/boot/loader.S〉 中 第 4 行 的 代码 是 jmp loader start， 上 一 版 本 mbrS 


(project/c4/a/boot/mbr.S ) 的 第 55 行 是 跳 转 指令 jmp LOADER_BASE_ADDR， 经 过 这 两 个 跳 转 才 执 行 到 


loader_start 处 的 代码 。 

















在 本 节 版 本 











，loader start 是 loader.S 中 第 一 条 指令 的 起 始 地 址 ， 那 个 跳 转 指令 没有 








了 。 所 以 ,在 本 节 主 引导 记录 程序 mbr.S 中 的 跳 转 指令 已 经 变 成 了 jmp LOADER_BASE ADDR + 0x300, 多 


加 了 个 0x300 字 节 ， 跨 过 前 


序 开头 加 个 跳 转 指令 ， 








面 的 数据 部 分 ， 直 接 跳 到 loader start。 之 所 以 这 样 做 ， 是 为 对 齐 代 码 ， 


























其 机 器 码 要 占 





j 3 对 








入 空间 ， 原 本 在 它 之 后 定义 的 数据 ， 























影响 硬件 执行 的 速度 。 














而 且 ， 将 来 在 























内 核 中 引用 total_mem_ bytes 的 地 址 时 也 要 / 


























因为 在 程 














地 址 未 对 齐 到 偶数 ， 这 会 
j 个 奇数 ， 感 觉 很 别扭 。 


从 代码 的 第 41 行 开始 ， 采 用 BIOS 中 断 0x15 的 三 种 子 功能 来 检测 内 存 。 在 检测 内 存 时 ， 必 然 是 先 使 
用 功能 最 全 、 检 测 功能 最 强大 的 方法 ， 功 能 最 弱 的 、 检 测 能 力 有 限 的 方法 应 该 是 在 “万 般 无 












































过 
奈 


下 才 用 ， 


要 放 在 最 后 ， 以 避免 无 法 检测 出 真实 的 内 存 容 量 。 从 强 到 弱 的 子 方法 依次 是 0xe820、0xe801、0x88 。 



































































































































第 41 一 69 行 用 的 子 功能 0xe820 方法 。 此 方法 需要 提前 准备 好 一 块 数据 缓冲 区 用 于 存放 返回 的 ARDS 
结构 ， 此 缓冲 区 我 们 在 上 面 已 经 准备 好 了 ， 就 是 ards_buf。 按 照 0xe820 的 调用 方法 ，es: di 存放 缓冲 区 地 
址 ， 由 于 es 在 mbr 中 已 经 赋值 了 ， 所 以 在 第 47 行 “mov di, ards_buf”， 只 为 di 赋值 便 可 。 





每 执行 一 次 int 0xl 















































输入 即 可 。 














5 后 ， 寄 存 器 eax、ebx、ecx 都 会 更 新 。eax 的 值 
的 ASCII 码 ，ebx 为 新 的 后 续 值 ，ecx 为 实际 写 入 缓冲 
eax 和 ecx 寄存 器 每 次 1 
ARDS 结构 后 ， 便 将 生 增 加 一 个 ARDS 结构 大 小 (这 里 是 20 字 节 )， 以 指向 组 六 


周 用 前 都 要 更 新 为 正确 




















之 前 的 子 功能 号 变 成 了 字符 串 SMAP 




















区 中 的 字 节 数 。 其 中 ebx 咱们 不 用 

















涉 ， 原 方 不 动 地 作为 











的 输入 参数 ， 所 以 放 在 了 循环 体 ! 








。 接 下 来 每 得 到 一 个 














可 





区 中 的 下 一 个 ARDS 存放 的 位 


置 ， 然 后 将 变量 ards_ nr 加 1， 以 记录 ARDS 的 个 数 ， 用 于 在 后 面 的 代码 中 遍历 所 有 ARDS， 找 出 最 大 内 存 块 。 











第 $6~69 行 是 找 昌 
遍历 完 所 有 ARDS， 值 














直接 跳 转 到 .mem_get_ ok， 将 此 容量 
edx。 在 此 说 明 下 ， 三 种 方法 





8 最 大 的 




















内 存 块 。 思 路 是 对 每 一 个 ARDS 结构 中 的 BaseAddrLow 与 LengthLow 相 加 求 和 





最 大 的 则 为 内 存 容 量 ， 






























































| 于 BaseAddrLow+LengthLow 的 单位 是 字 节 而 无 需 转 换 ， 
效 写 入 变量 total_ mem bytes， 





9 














之 后 便 














lL 体 代码 为 第 113 行 的 mov [total_ mem_bytes], 
探测 到 的 内 存 容量 都 是 统一 跳 转 到 .mem_get ok 处 后 以 字 节 形式 写 入 到 变 


三 | 
里 
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total_ mem bytes， 所 以 三 种 方法 中 内 存 容量 都 要 用 edx 来 保存 。 


行 执 行 中 断后 ， 第 79 一 86 行 先 计算 出 低 15MB 内 存 空间 的 容量 。 这 里 面 月 
法 中 ， 由 于 mul 指令 固定 的 乘 数 是 寄存 器 AX， os 提供 男 一 个 乘 数 就 行 了 ， 



































第 71 一 95 行 是 利用 子 功能 0xe801 探测 内 存 容 量 。 由 于 方法 本 身 比较 简单 ， 所 以 代码 量 







































































很 短 。 在 76 





月 到 了 乘法 指令 mul， 在 16 位 乘 
于 是 乘法 指令 格式 是 





mul 16 位 内 存 或 16 位 寄存 器 。 结 果 ( 积 ) 是 32 位， 高 16 在 DX 寄存 器 ， 低 16 位 在 AX 寄存 器 


以 1024。 
把 CX 的 值 覆盖 为 0x400， 即 1024。 这 里 



































由 于 寄存 器 AX 和 CX 的 单位 是 KB， 这 里 要 将 获得 的 结果 转换 成 字 








































































































前 面 说 过 啦 ， 寄 存 器 AX 和 CX 值 相同 ， 随 便 用 哪个 做 乘 数 皆 可 ， 
的 是 16 位 操作 数 乘法 ， 积 的 高 16 位 在 DX 寄存 器 ， 低 16 位 












































节 ， 所 以 寄存 器 AX 或 CX 要 乘 
1 于 固定 的 操作 数 AX， 所 以 


在 AX 寄存 器 。 所 以 将 EDX 左 移 16 位 后 再 与 AX 做 或 运算 便 得 到 了 完整 32 位 的 积 。 在 第 85 行将 edx 加 


了 1MB, 原因 是 获取 到 的 内 存 总 比 实际 大 小 少 IMB， 故 在 此 “补偿 ”。 后 面 的 乘法 指令 会 破坏 寄存 器 EDX 
的 值 ， 所 以 第 86 行将 结果 备份 到 寄存 器 ESI。 


转换 为 字 节 。 这 里 面 用 到 















































第 88 一 95 行 是 计算 16MB 之 上 的 内 存 容量 ， 结 果 存 放 在 寄存 器 BX 和 DX， 站 
32 位 操作 数 的 乘法 ，32 位 乘法 固定 的 乘 数 是 EAX， 同 样 也 是 再 提 























es 



































位 是 64KB， 所 以 也 要 将 其 

















供 一 个 操作 数 


就 行 了 。 所 以 其 指令 格式 为 mul 32 位 内 存 或 32 位 寄存 器 。 积 为 64 位 结果 ， 高 32 位 在 EDX 寄存 器 ， 低 32 位 





在 EAX 寄存器。 第 90 行 

















oR i 

















XOT CaX, CaxX 











清 0)，EAX 为 固定 的 乘 数 ， 另 一 个 乘 数 是 0x10000， 即 64KB。 由 于 0xe801 子 功能 只 能 测 出 4GB 之 内 的 内 存 








合 里 





似 ， 


原因 是 我 们 将 很 快 实现 打 印 函 数 了 ， 这 里 就 不 先 “ 凑 合 ” 打印 了 。 不 过 我 们 












































旺 ， 所 以 只 需要 乘积 的 低 32 位 结果 ， 也 就 是 寄存 器 EAX 的 值 就 够 了 ， 最 后 再 将 备份 在 寄存 器 ESI 中 的 低 
15MB 空间 的 内 存 容量 同 EAX 相 加 ， 存 入 变量 total_ mem _bytes 中 。 












































容易 看 懂 ， 不 多 说 了 。 




















第 98 一 110 行 是 用 子 功能 0x88 方法 探测 内 存 容量 ， 功 能 简单 ， 代 码 更 











方法 说 完了 , 该 是 实际 运行 检测 的 时 候 了 。 虽然 内 存 容量 检测 出 来 了 ， 


















































简单 ， 实 际 代 码 同上 个 方法 类 








但 代码 中 并 没有 将 它 显示 出 来 ， 
依然 能 够 在 bochs 中 检验 结果 ， 








加 





大 家 肯定 都 想到 了 ， 对 ， 就 是 通过 调试 手段 来 查看 变量 total_mem_bytes 的 内 存 就 行 啦 。 事 不 宜 迟 ， 我 们 








贴 这 张 图 的 目的 就 是 想 告 诉 大 伙 儿 ， 代 码 改 了 ， 打 印 这 段 字符 的 BIOS 0x10 中 断 “ 下 线 ” 啦 。 


看 一 下 实际 运行 情况 吧 。 
检测 前 得 先知 道 机 器 上 到 底 装 了 多 少 内 存 才 行 , 否则 谁 知道 检测 的 结果 

否则 还 得 拆 机 箱 拔 内 存 条 ， 当 然 是 开玩笑 了 ， 还 是 有 其 他 软件 方法 能 够 测试 出 来 的 。 
] 来 指定 内 存 大 小 ， 


机 上 
看 bochs 虚拟 机 的 配置 文件 bochsrc.disk 就 行 了 ， 其 中 的 megs 参数 


















































门 是 在 虚拟 






































| .gy 























是 否 正确 。 幸亏 咱 






































[work@localhost bochs]$ cat -n bochsrc.disk 








4 图 5-1 虚拟 机 内 存 容量 























由 图 5-1 可 见 ， 机 器 上 装 了 32MB 内 存 。megs 指定 的 内 存 以 MB 为 六 





位 ， 只 要 给 



































咱们 只 需要 查 








如 图 





5-1 所 示 。 


上 数值 部 分 就 好 啦 。 


激动 人 心 的 时 候 到 了 ，bochs 走 起 。 好 入 不 开 bochs 了 ， 跟 大 伙 儿 一 块 复习 下 。 到 bochs 安装 目录 下 执行 。 














(1) bin/bochs -fbochsrc.disk 回 车 。 
(2) 弹出 提示 菜单 : Please choose one: 这 说 明 默 认 是 选项 6， 怕 
(3) 在 bochs 控制 台中 键入 命令 c 回 车 。 

之 后 程序 就 跑 起 来 了 ， 在 虚拟 机 中 的 运 
这 张 图 不 但 没有 帮助 ， 似 乎 还 帮 了 “ 倒 忙 ? 


























上 

















行 效果 如 图 5-2 所 示 。 





























保护 模式 中 经 常 显 示 这 段 广 字 ， 我 怕 误 导 大 家 。 
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回 车 。 





， 就 连 之 前 的 屏幕 左下 角 的 字符 串 “2 loader in real.” 都 没 了 。 


因为 以 后 在 





前 面 


站 
经 





说 过 啦 ， 





CTRL + 3rd button enables nouse |NUH | 


变量 
人 A 时 








到 


A 

















地 址 就 行 了 , 说 干 就 
































， 先 








j Cul+C 组 合 键 中 断 





5-2 ”bochs 调试 检测 
total_ mem_bytes 的 地 址 是 0xb00， 所 以 咱们 在 bochs 控 





USER CG 阐 E Th 的 


CONAIG 




































































制 台 中 用 xp 指令 来 查看 该 
bochs 的 运行 , 再 输入 命令 xp 0xb00 回 车 ， 欲 知 详情 见 图 5-3。 


















































File Edit View Search Terminal Help 
ahead and start the simulation. 


You can also start bochs with the -q option to skip these menus. 


1 
2 
3 
4. 
5 
6 
区 


Save options to... 


. Restore the Bochs state from... 
. Begin simulation 
. Quit now 


PLease choose one: [6] 
00000000000i[ ] installing x module as the Bochs GUI 
00000000000i[ ] using log file 
Next at t=0 


(0) [OxQQQQOfFffffff0] f000:fffg (unk. 


^CNext at 1 
0) [9x000000g96ce6] 0008:00000ce6 
<bochs:3> c~” 

^CNext at t=157600000 

0) [Ox000000000ce6] 0008:00000ce6 
<bochs:4> xp 0xb00 

[bochs] : 
OQx00000b00 <bogus+ 0>: 0xg02000000 
<bochs :5> 




















成 十 进 制 正 是 32MB， 
这 里 提供 个 进 制 转 换 
尺码 很 简单 ， 就 
| echo |awk 
俩 用 方法 也 很 简单 ， 





和 C 语言 
列 如 : 


























如 图 5-3 所 示 ， 在 执行 xp 0xb00 后 ， 结 果 是 
可 见 检测 结果 是 正确 的 。 
却 本 calculator sh， 为 了 方便 大 家 ， 我 将 其 放 在 随 书 代 码 的 tool 目录 中 。 





. Restore factory default configuration 
. Read options from... 
. Edit options 


bochs .out 


ctxt): jmp far f000:eQ5b ; ea5be000 


[c^ 是 Ctr+C 组 合 键 的 效果 ] 


t=135221434” 





(unk. ctxt): jmp .-2 (QOx00000ce6) 


(unk. ctxt): jmp .-2 (Ox00000ce6) 





A 图 5-3 


























xp 命令 查看 物理 内 存 















































32.000000 


32.000000 
我 们 4 


虽然 


= 


个 子 功能 没 


全 





int 0x15 执行 了 6 次 ， 返 


行 » 


的 printf 一 样 。 
sh calculator.sh Ox02000000/1024/1024f 回 后 。 












































是 结果 。 用 浮 点 数 格式 f 来 显示 结 
介绍 了 三 个 检测 方 沪 












































是 0x02000000， 图 中 已 经 用 框框 标 出 来 了 。0x2000000 换算 
大 家 用 计算 器 转换 一 下 便 知 道 了 。 如 果 大 家 不 嫌弃 ， 小 弟 
































用 的 是 awk 的 printf 函数 。 


"{printf(\"%$2\n\", SIL) 


第 1 个 参数 是 待 转换 的 数字 ， 一 般 进 制 都 支持 ， 第 2 个 参数 是 输出 的 格式 。 用 法 












































| 
证 
上 











的 好 处 是 避免 用 整数 时 的 取 整 ， 误 以 为 整除 了 。 


,但 这 个 0x02000000 却 是 BIOS 0x15 中 断 子 功能 0xe820 的 功劳 ,另外 两 
上 。 大 家 可 以 在 bochs 中 跟 一 下 代码 执行 的 情况 ， 本 程序 实际 运行 情况 是 在 方法 0xe820 中 ， 
回 了 6 个 ARDS 结构 。 
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说 了 这 么 久 ， 内 存 检测 部 分 终于 完成 了 ， 对 物理 内 存 做 到 心中 有 数 后 ， 下 面 咱们 该 开始 步 入 虚拟 内 存 啦 。 


区 启用 内 存 分 页 机 制 ， 畅 游 虚拟 空间 


在 此 之 前 , 我 们 的 程序 虽然 已 经 进 了 保护 模式 , 地 址 空间 到 达 了 前 所 未 有 的 4GB, 但 其 依然 是 受 限制 
的 ， 就 像 共 享 网 络 带 宽 一 样 ， 此 进程 要 和 其 他 进程 包括 操作 系统 共享 这 4GB 内 存 空间 。 我 们 把 段 基 址 + 
段 内 偏 移 地 址 称 为 线性 地 址 ， 线 性 地 址 是 唯一 的 ， 只 能 属于 某 一 个 进程 。 

在 我 们 的 机 器 上 即使 只 有 512MB 的 内 存 ， 每 个 进程 自己 的 内 存 空 间 也 是 4GB， 不 用 说 大 家 也 都 知道 
这 是 指 虚 拟 内 存 空间 。 我 想 大 多 数 同学 也 仅仅 是 知道 虚拟 地 址 的 概念 ， 未 必 知 道 虚拟 地 址 的 实现 原理 。 就 
像 大 家 都 知道 电脑 开机 必须 要 接 上 电源 才 行 , 但 不 是 所 有 人 都 知道 电 是 怎样 将 整个 硬件 系统 发 动 起 来 的 一 
样 。 本 节 就 要 将 这 层 神秘 面纱 揭 开 ， 跟 大 家 说 说 这 个 神秘 面纱 后 面 的 那些 事 儿 。 


5.2.1 内 存 为 什么 要 分 页 


一 直 以 来 我 们 都 直接 在 内 存 分 段 机 制 下 工作 ， 目 前 未 出 问题 看 似 良 好 ， 的 确 ， 目 前 咱们 的 应 用 过 于 简 
单 了 ， 就 一 个 loader 在 跑 ， 能 出 什么 问题 呢 ? 可 是 想象 一 下 ， 当 我 们 物理 内 存 不 足 时 会 怎么 办 呢 ? 比如 系 
统 里 的 应 用 程序 过 多 , 或 者 内 存 碎片 过 多 无 法 容纳 新 的 进程 , 或 者 曾经 被 换 出 到 硬盘 中 的 内 存 段 需要 再 次 
重新 装 到 内 存 , 可 是 内 存 中 找 不 到 合适 大 小 的 内 存 区 域 怎么 办 ?也 许 有 人 会 说 ,这 简单 啊 ,停止 想象 喘 …… 
嘿嘿 ， 开 玩笑 而 已 ， 问 题 还 是 要 解决 的 。 

也 许 文 字 说 得 并 不 是 很 清楚 ， 下 面 以 图 示 说 明 这 些 情况 。 

图 5-4 所 示 模 拟 了 多 个 进程 并 行 的 情况 。 第 1 步 中 ， 系 统 里 有 3 个 进程 正在 运行 ， 进 程 A、B、 C 各 占 
了 10MB、20MB、30MB 的 内 存 空间 ， 物 理 内 存 还 是 挺 宽裕 的 ， 还 剩 下 15MB 可 用 。 到 了 第 2 步 就 斐 催 了 ， 
此 时 进程 B 已 经 运行 结束 ， 腾 出 了 20MB 的 内 存 ， 可 是 待 加 载运 行 的 进程 D 需要 20MB+3KB 的 内 存 空间 ， 即 
20483KB 。 现 在 的 运行 环境 未 开启 分 页 功能 ,“ 段 基 址 + 段 内 偏 移 ”产生 的 线性 地 址 就 是 物理 地 址 ， 程 序 中 引用 
的 线性 地 址 是 连续 的 ， 所 以 物理 地 址 也 连续 。 虽 然 总 共 剩 下 35MB 内 存 可 用 ， 可 问题 是 明摆着 的 ， 现 在 连续 
的 内 存 块 只 有 原来 进程 B 的 20MB 和 最 下 面 可 用 内 存 13MB 。 哪 一 块 都 不 够 进程 D 用 的 ， 这 怎么 办 呢 ? 


















































































































































































































































































































































































































































































































































































































































































































































内 存 内 存 
| 段 Al | i Al 
进程 A A2 进程 A A2 
10M 全 10M A3 
段 B1 
进程 B 段 B2 一 一 > 进程 B 运 行 结束 ， 
20M 让 20M 又 来 了 个 进程 D 
王 
进程 进程 C 
3 属 芝 3 属 过 
段 C3 段 C3 
可 用 内 存 可 用 内 存 20483KB 
15M 15M (20M+3KB) 























4 图 5-4 ”进程 在 分 段 机 制 下 运行 

















两 个 解决 方案 。 

。 等 待 进程 C 运行 完 后 腾 出 内 存 ， 这 样 连续 可 用 的 内 存 就 够 运行 进程 D 了 。 

。 将 进程 A 的 段 A3 或 进程 C 的 段 C1 换 出 到 硬盘 上 ， 腾 出 一 部 分 空间 ， 加 上 邻接 的 20MB， 足 够 容 
纳 进程 D。 









































































































































用 户 还 以 为 死机 了 呢 ， 说 不 定 一 气 之 下 就 给 重启 了 ， 算 啦 ， 这 个 方法 不 好 ， 看 第 二 个 吧 。 
































































































































第 二 个 方案 看 上 去 先进 很 多 ， 原 理 是 将 老 进程 不 常用 的 段 换 出 到 硬盘 ， 腾 出 空间 给 新 进程 用 ， 
程 再 次 需要 该 段 时 ， 再 从 硬盘 上 将 该 段 载 和 内存， 如 图 5-5 所 示 。 内 在 
看 上 去 方案 完美 无 忆 可 击 ， 虽然 要 用 到 低速 的 硬盘 , 但 至 少 能 干 。 ，A 
活 。 这 就 是 当 系统 物理 内 存 不 足 的 情况 下 , 硬盘 灯会 不 停 闪烁 的 原因 。 WA| 
不 过 这 一 切 需要 硬件 的 配合 才能 实现 ， 咱 们 一 会 儿 介 绍 下 这 种 内 存 管 


























理 ， 不 过 在 这 之 前 先 扯 点 别 的 。 
我 曾经 一 度 搞 不 清楚 操作 系统 和 硬 
功能 是 操作 系统 自己 实现 的 ， 还 是 硬件 















































进程 D 
20M+3KB 
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牛 的 内 在 联系 ， 例 如 ， 某 种 
直接 支持 的 ? 甚至 在 更 早 些 进程 C 












































时 候 ， 由 于 知识 掌握 的 不 足 ， 有 些 问题 
来 才 搞 清楚 ， 操 作 系统 和 硬件 之 间 是 相 























有 了 这 样 的 需求 后 ，CPU 厂商 决定 采用 









































进而 发 展 起 来 的 。 比 如 ,起 初 的 操作 系统 无 法 对 内 存 段 做 访问 限制 


迷惑 到 不 知 该 如 何 表达 ， 后 和 
互 依赖 、 相 互 推动 、 相 互 促 
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段 描述 符 来 实现 相关 功能 ， 








第 一 个 方案 比较 简单 直接 ， 但 就 是 要 等 待 ， 而 且 咱 们 也 不 知道 程序 C 啥 时 候 执行 完 ， 等 个 没完 没 了 ， 


等 老 进 





























在 硬件 一 级 上 添加 了 GDTR 和 LDTR 寄存 器 来 支持 全 局 描述 符 表 和 3 





局 部 描述 符 表 ， 并 由 硬件 负责 周边 的 安全 检测 。 当 初 CPU 硬件 厂商 




















可 不 是 赁 空 造 出 这 样 一 个 概念 的 ， 是 与 















































到 5-5 内 存 段 换 入 换 出 
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操作 系统 厂商 共同 协商 后 才 





















































有 了 一 套 硬件 方面 的 支持 。 这 不 仅仅 在 计算 机 行业 中 是 这 样 ， 其 他 行业 也 一 样 ， 比 如 机 械 制 造 行业 ， 如 果 
要 生产 一 个 精度 较 高 的 零件 ， 而 目前 的 车 床 无 法 加 工 ， 生产 车 床 的 广 商 就 要 提高 自身 水 平 ， 制 造 出 




















度 更 高 的 车 床 ， 而 不 是 让 零件 去 适应 车 床 而 降低 精度 。 另 外 一 个 最 典型 的 例子 就 是 人 类 的 直立 行走 ， 最 早 


























的 时 候 是 用 四 鹏 行走， 人 在 思想 上 想 把 双手 腾 出 来 做 其 他 事 ， 所 以 号 体 便 给 予 了 “硬件 






































成 了 只 用 下 肢 行走 ， 这 是 典型 的 软件 督 















































促 硬 件 发 展 。 


” 文 持 ， 慢 慢 发 展 










































































前 迈进 。 但 跑 起 来 之 后 ， 心 脏 会 加 速 跳动 ， 



































虽然 操作 系统 和 CPU 相互 促进 ， 但 说 到 底 ， 操 作 系统 是 软件 ， 软 件 中 的 指令 靠 CPU 来 执行 ， 
算 机 是 有 生命 的 ， 软 件 相当 于 思想 、 灵 魂 ， 而 硬件 才 是 真正 的 身体 ， 思 想 指 导 身 体 的 行为 。 
但 并 不 是 思想 指导 了 所 有 的 行为 ， 就 拿 人 类 的 运动 来 说 ， 虽 们 的 大 脑 产生 了 跑 的 意识 后 ， 左 腿 右 腿 就 交 蔡 向 












































如 果 计 





















































肺 也 加 速 了 呼吸 的 频率 ， 这 并 不 是 咱们 主动 控制 的 ， 这 些 器 官 的 行为 





































































































说 这 些 就 是 想 告 诉 大 家 ， 我 们 所 写 的 代码 仅仅 是 完成 了 某 件 事 的 一 部 分 而 已 ， 也 许 是 大 部 分 ， 









































部 分 是 CPU 硬件 上 负责 的 ， 这 部 分 咱们 不 用 管 ， 由 CPU 自动 完成 。 比 如 ， 调 用 一 个 函数 时 ，CPU 
返回 地 址 压 入 栈 ， 进 入 中 断 时 ，CPU 除了 压 入 返回 地 址 、 标 志 寄 存 器 外 ， 还 要 根据 当前 特权 级 决 























压 入 当前 栈 段 寄存 器 及 指针 …… 这 样 的 例子 太 多 了 ， 不 再 一 一 列举 。 





















































东 扯 西 扯 地 说 了 这 么 多 后 ， 开 始 说 下 例子 中 内 存 管 理 的 原理 ， 内 存 段 是 怎样 被 换 出 的 。 




















苗 述 符 存在 于 描述 符 表 中 〈GDT 或 LDT) 






























































在 保护 模式 下 ， 段 描述 符 是 内 存 段 的 身份 证 。CPU 在 引用 一 个 段 时 ， 都 要 先 查 看 段 描述 符 。 很 多 时 


























身体 里 的 植物 神经 控制 。 也 就 是 说 ， 咱 们 在 跑步 时 ， 虽 然 大 脑 思想 上 只 负责 跑步 的 动作 ， 不 用 向 身体 发 命令 ; 


心脏 加 速 、 呼 吸 加 速 等 ， 但 这 些 器 官 的 行为 确实 存在 着 ， 而 且 是 在 生理 一 级 上 自动 完成 不 受 意识 控制 的 。 


还 有 
自动 将 


上 日 
定 是 否 


























候 ， 段 





， 但 与 此 对 应 的 段 并 不 在 内 存 中 ， 也 就 是 说 ，CPU 人 允许 在 描述 符 表 中 




































































已 注册 的 段 不 在 内 存 中 存在 ， 这 就 是 它 提供 给 软件 使 用 的 策略 ， 我 们 利用 它 实现 段 式 内 存 管 理 。 如 果 该 描述 符 中 
















































































的 P 位 为 1， 表 示 该 段 在 内 存 中 存在 。 访 问 过 该 段 后 ，CPU 将 段 描述 符 中 的 A 位 置 1， 表 示 近 来 刚 访问 过 该 段 。 





相反 ， 如 果 了 位 为 0， 说 明 内 存 中 并 不 存在 该 段 ， 这 时 候 CPU 将 会 抛 出 个 NP 上 段 不 存在 ) 异常 ， 转 而 去 执行 中 





























断 描 述 符 表 中 NP 异常 对 应 的 中 断 处 理 程序 ， 此 中 断 处 理 程序 是 操作 系统 负责 提供 的 ， 该 程序 的 工作 是 将 相应 的 
































段 从 外 存 〈 比 如 硬盘 ) 中 载 入 到 内 存 ， 并 将 段 描述 符 的 P 位 置 1， 中 断 处 到 




















检查 ， 继 续 碍 看 该 段 描述 符 的 P 位 ， 此 时 






























































已 经 为 1 了 ， 在 检查 通过 后 ， 将 段 描述 符 的 A 位 置 1。 




















以 上 是 CPU 加 载 内 存 段 的 过 程 ， 内 存 段 是 何 时 移出 到 外 存 上 的 呢 ? 




















段 描 述 符 的 A 位 由 CPU 置 1， 但 清 0 工作 可 是 由 操作 系统 来 完成 的 。 此 位 干吗 用 的 呢 ? 如 果 仅 仅 / 
E 是 软件 和 硬件 相互 配合 的 体现 ， 操作 系 统 每 发 现 该 位 为 1 后 就 将 该 位 



































该 段 被 访问 过 , 这 也 意义 不 大 啊 。 其实 这 站 





函数 结束 后 返回 ，CPU 重复 执行 这 个 





























3 来 表示 





























187 


清 0, 这 样 一 来 , 在 一 个 周期 内 统计 该 位 为 1 的 次 数 就 知道 该 段 的 使 用 频率 了 ,从 而 可 以 找 出 使 用 频率 最 低 的 段 。 
当 物 理 内 存 不 足 时 ， 可 以 将 使 用 频率 最 低 的 段 换 出 到 硬盘 ， 以 腾 出 内 存 空 间 给 新 的 进程 。 当 段 被 换 出 到 硬盘 后 ， 
操作 系统 将 该 段 描述 符 的 P 位 置 0。 当 下 次 这 个 进程 上 CPU 运行 后 ， 如 果 访 问 了 这 个 段 ， 这 样 程序 流 就 回 到 了 
刚 开 始 CPU 检查 出 P 位 为 0、 紧 接着 抛 出 异常 、 执 行 操 作 系统 中 断 处 理 程序 、 换 入 内 存 段 的 循环 。 

另外 ， 内 存 中 的 数据 是 二 进 制 的 ， 段 被 换 出 到 硬盘 上 也 以 二 进 制 形 式 存 储 ， 数 据 内 容 都 是 一 样 的 ， 只 
是 存储 介质 不 同 而 已 , 不 要 因为 陌生 而 觉得 段 的 换 入 换 出 深 不 可 测 ， 这 无 非 是 一 段 二 进 制 数 据 在 内 存 和 外 
存 之 间 拷 贝 来 拷贝 去 而 已 ， 其 过 程 就 像 将 一 个 txt 文件 读 到 内 存 中 修改 后 再 保存 到 硬盘 一 样 。 

第 二 个 方法 虽然 解决 了 内 存 不 足 的 问题 ， 但 也 有 缺陷 。 比 如 物理 内 存 特别 小 ,无 法 容纳 任何 一 个 进程 的 
段 ， 这 就 没 法 运行 进程 了 ， 更 没 法 做 段 的 换 入 换 出 。 也 许 有 人 会 说 ， 这 是 用 户 的 问题 ， 这 么 小 的 内 存 还 拿 出 
来 用 ， 这 不 是 “ 逗 比 ” 吗 ? 您 还 别 说 ， 一 会 儿 介绍 的 内 存 分 页 机 制 ， 理 论 上 只 要 4KB 内 存 就 可 以 让 程序 运 
行 下 去 。 另 外 一 种 情况 是 若 进 程 的 段 比 较 大 ， 换 出 时 要 将 整个 段 全 部 搬 到 外 存 上 ， 这 种 IO 操作 太 多 了 机 器 
啊 应 奇 慢 无 比 ， 用 户 是 无 法 接受 的 。 还 有 没有 更 好 的 方法 呢 ? 
想 一 想 ， 出 现 这 种 问题 的 原因 是 什么 ? 问题 的 本 质 是 在 目前 只 分 段 的 情况 下 ，CPU 认为 线性 地 址 等 
于 物理 地 址 。 而 线性 地 址 是 由 编译 器 编译 出 来 的 ， 它 本 喘 是 连续 的 ， 所 以 物理 地 址 也 必须 要 连续 才 行 , 但 
我 们 可 用 的 物理 地 址 不 连续 。 换 句 话说 ， 如 果 线 性 地 址 连续 ， 而 物理 地 址 可 以 不 连续 ， 不 就 解决 了 吗 。 

按照 这 种 思路 , 我 们 首先 要 做 的 是 解除 线性 地 址 与 物理 地 址 一 一 对 应 的 关系 , 然后 将 它们 的 关系 重新 
建立 。 通 过 茶 种 映射 关系 ， 可 以 将 线性 地 址 映射 到 任意 物理 地 址 。 
有 很 多 实现 映射 的 方法 ， 比 如 可 以 写 个 哈 希 算法 ， 将 线性 地 址 做 key， 而 value 是 物理 地 址 。 不 过 ， 
这 都 是 软件 实现 的 算法 ， 时 间 复 杂 度 再 低 ， 效 率 肯 定 不 如 硬件 “ 短 、 平 、 快 ” 因为 硬件 中 的 操作 更 直接 ， 
并 且 已 经 在 电路 上 做 过 优化 ， 而 软件 的 效率 主要 取决 于 代码 的 算法 和 编译 器 的 优化 能 力 , 即使 能 产生 出 最 
优 的 机 器 码 ， 也 是 被 当 作 普通 指令 处 理 : 先 要 到 内 存 中 取 指 ， 译 码 ， 再 执行 ， 不 说 别 的 ， 就 光 是 取 指 这 步 
就 已 经 很 慢 了 ， 毕 竞 内 存在 CPU 眼 里 是 低速 设备 。 所 以 ， 对 于 地 址 转换 这 种 实时 性 较 高 的 需求 ，CPU 已 
经 给 予 了 我 们 最 大 的 硬件 支持 ， 在 CPU 实现 中 ， 这 种 映射 关系 是 通过 一 张 表 来 实现 的 ， 该 表 就 是 我 们 所 
说 的 页 表 ， 碍 找 页 表 的 工作 也 是 由 硬件 完成 的 。 这 张 表 是 什么 样 的 呢 ? 我 们 在 下 一 节 中 给 出 答案 。 


5.2.2 一 级 页 表 


为 了 给 大 家 说 清楚 分 页 机 制 , 我 们 先 从 宏观 上 说 一 下 CPU 地 址 变换 过 程 ， 先 让 大 家 有 个 直观 的 印象 。 
分 页 机 制 其 实 是 建立 在 分 段 机 制 之 上 的 。 这 是 不 是 有 些 让 大 家 意外 呢 ? 其 实 这 并 不 是 说 分 页 机 制 依赖 
于 分 段 机制 , 只 是 这 内 存 分 段 机 制 属于 Intel IA32 架构 骨子里 的 东西 , 改 是 改 不 掉 的 , 除非 从 头 再 造 个 CPU 
出 来 ,所 以 分 页 机 制 只 能 在 现 有 分 段 机 制 大 局 已 定 的 情况 下 诞生 ,它们 两 者 的 关系 是 怎样 的 呢 ? 让 我 们 先 
从 保护 模式 下 的 分 段 机 制 开始 梳理 。 
尽管 在 保护 模式 中 段 寄 存 嚣 中 的 内 容 已 经 是 选择 子 , 但 选择 子 最 终 就 是 为 了 要 找到 段 基 址 ， 其 内 存 访 
问 的 核心 机 制 依然 是 “ 段 基 址 : 段 内 偏 移 地 址 ”， 这 两 个 地 址 在 相 加 之 后 才 是 绝对 地 址 ， 也 就 是 我 们 所 说 
的 线性 地 址 ， 此 线性 地 址 在 分 段 机 制 下 被 CPU 认为 是 物理 地 址 ， 直 接 拿 来 就 能 用 ， 也 就 是 说 ， 此 线性 地 
址 可 以 直接 送 上 地 址 总 线 。 将 段 基 址 和 段 内 偏 移 地址 相 加 求 和 的 工作 是 由 CPU 的 段 部 件 自 动 完 成 的 。 整 
个 访问 内 存 的 过 程 如 图 5-6 所 示 。 
分 页 机 制 要 建立 在 图 5-6 所 示 分 段 机 制 的 基础 上 ， 也 就 是 说 ， 段 部 件 的 工作 依然 免不了 ， 所 以 ， 分 页 
只 能 是 在 分 段 之 后 进行 的 ， 其 过 程 如 图 5-7 所 示 。 
图 5-7 说 明 ，CPU 在 不 打开 分 页 机 制 的 情况 下 ， 是 按照 默认 的 分 段 方式 进行 的 ， 段 基 址 和 上 段 内 偏 移 地 
址 经 过 段 部 件 处 理 后 所 输出 的 线性 地 址 ，CPU 就 认为 是 物理 地 址 。 如 果 打 开 了 分 页 机 制 ， 段 部 件 输出 的 
线性 地 址 就 不 再 等 同 于 物理 地 址 了 ， 我们 称 之 为 虚拟 地 址 ， 它 是 逻辑 上 的 ， 是 假 的 ， 不 应 该 被 送 上 地 址 总 
线 ( 因 为 地 址 只 是 个 数字 ,任何 数字 都 可 以 当 作 地 址 ， 这 里 说 的 “不 应 该 ”是 指 应 该 人 为 保证 送 上 地 址 总 
线 上 的 数字 是 正确 的 地 址 )。CPU 必须 要 拿 到 物理 地 址 才 行 ， 此 虚拟 地 址 对 应 的 物理 地 址 需要 在 页 表 中 查 
找 ， 这 项 查找 工作 是 由 页 部 件 自动 完成 的 。 为 了 要 搞 清楚 页 部 件 的 工作 原理 ， 必 须要 搞 清楚 这 两 件 事 。 
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Ox1000 段 部 件 。 0xi080 
段 基 址 一 一 生 基 址 “| 线性 地 址 


偏 移 地 址 一 Aitt| | 
















































































Ox80 
是 否 
nL 打开 
段 基 址 ee 线性 地 址 Ox1100 页 部 件 Ox1100 
及 一 段 基 址 | x 
训 光 地 十 一 | 偏 移 地 址 人 P| 内 存 段 | ox1000 给 过 二 《D> 一 Ox1000 
0x80 页 
物理 地 址 
取决 于 页 表 
内 存 内 存 
和 图 5-6 ”内存 分 段 机 制 下 地 址 访问 4 图 5-7 分 页 机 制 
































(1) 分 页 机 制 的 原理 。 
(2) 页 表 的 结构 。 
下 面 我 们 将 从 这 两 方面 入 手 ， 循 序 渐进 地 展开 分 页 机 制 原理 。 
经 过 段 部 件 处 理 后 ,保护 模式 的 寻 址 空间 是 4GB， 注意 啦 ， 这 个 寻 址 空间 是 指 线 性 地 址 空间 ， 它 在 逻 
辑 上 是 连续 的 。 分 页 机 制 的 思想 是 : 通过 映射 ， 可 以 使 连续 的 线性 地 址 与 任意 物理 内 存 地 址 相关 联 ， 逻 辑 
上 连续 的 线性 地 址 其 对 应 的 物理 地 址 可 以 不 连续 。 
分 页 机 制 的 作用 有 两 方面 。 
。 将 线性 地 址 转换 成 物理 地 址 。 
大 小 相等 的 页 代替 大 小 不 等 的 段 。 
这 两 方面 的 作用 如 图 5-8 所 示 。 
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4GB 线性 地 址 空间 4GB 虚 拟 地 址 空间 。 ”4GB 物 理 地 址 空间 
已 分 配 页 
未 分 配 页 
分 页 机 制 Bd 
~/ 面 
代 | / A 
代码 自 人 页 机 克 | 、_/ 
人 小 小 Sa / ”| | 
人 小 / ~、 
数据 段 相等 的 页 2 
段 ee 
进程 内 存 空间 分 自 进程 内 存 空间 分 页 。 虚拟 页 被 打 散 到 物理 页 














和 图 5-8 分 页 机 制 的 作 


由 于 有 了 线性 地 址 到 真实 物理 地 址 的 这 层 映 射 , 经 过 段 部 件 输出 的 线性 地 址 便 有 了 另外 一 个 名 字 , 虚 
拟 地 址 。 
下 面 根据 图 5-8 给 大 家 介绍 下 操作 系统 在 分 页 机 制 下 加 载 进程 的 过 程 。 
图 5-8 表示 的 是 一 个 进程 的 地 址 转换 过 程 ， 从 线性 空间 到 虚拟 空间 再 到 物理 地 址 空间 ， 每 个 空间 大 小 
都 是 4GB。 图 上 的 4GB 物理 地 址 空间 属于 所 有 进程 包括 操作 系统 在 内 的 共享 资源 ， 其 中 标注 为 已 分 配 页 
的 内 存 块 被 分 配给 了 其 他 进程 ， 当 前 进程 只 能 使 用 未 分 配 页 。 此 转换 过 程 对 任意 一 个 进程 都 是 一 样 的 ， 也 
就 是 说 ， 每 个 进程 都 有 自己 的 4GB 虚拟 空间 。 
前 面 说 过 啦 ， 分 页 机 制 建立 在 分 段 机 制 之 上 ， 与 其 脱离 不 了 干系 ， 即 使 在 分 页 机 制 下 的 进程 也 要 先 经 过 逻辑 
上 的 分 段 才 行 ， 每 加 载 一 个 进程 ， 操 作 系统 按照 进程 中 各 段 的 起 始 范 围 ， 在 进程 自己 的 4GB 虚拟 地 址 空间 中 寻 


189 



























































































































































































































































Ea 


























找 可 用 空间 分 配 内存 段 ， 此 虚拟 地 址 空间 可 以 是 页 表 ， 也 可 以 是 操作 系统 维护 的 某 种 数据 结构 ， 总 之 此 阶段 的 分 
配 是 逻辑 上 的 ， 并 没有 真正 写 入 物理 内 存 。 在 分 页 机 制 下 ， 分 配 情形 如 图 5-8 中 所 示 的 虚拟 地 址 空间 中 的 代码 段 
和 数据 段 。 代 码 段 和 数据 段 在 逻辑 上 被 拆 分 成 以 页 为 单位 的 小 内 存 块 。 这 时 的 虚拟 地 址 虚 如 其 名 ,不 能 存放 任何 
数据 。 接 着 操作 系统 开始 为 这 些 虚 拟 内 存 页 分 配 真实 的 物理 内 存 页 ， 它 查找 物理 内 存 中 可 用 的 页 ， 然后 在 页 表 中 
登记 这 些 物理 页 地 址 ， 这 样 就 完成 了 虚拟 页 到 物理 页 的 映射 ， 每 个 进程 都 以 为 自己 独 享 4GB 地 址 空间 。 

以 上 在 宏观 上 笼统 地 介绍 了 分 页 机 制 下 操作 系统 加 载 用 户 进程 的 整个 流程 ， 先 让 大 家 心中 有 数 ， 了 解 
我 们 下 面 所 说 的 内 容 是 什么 。 也 许 您 对 此 过 程 并 不 十 分 理解 ， 不 过 没关系 ， 下 面 咱们 开始 从 头 说 起 。 

映射 这 个 概念 大 家 应 该 比较 清楚 ， 对 应 的 英文 单词 是 map， 意 为 地 图 。 地 图 是 对 实际 地 理 空间 的 一 种 
抽象 ， 地 图 上 的 每 个 位 置 都 代表 某 个 真实 地 理 空间 ， 这 种 地 图 上 与 地 理 上 一 一 对 应 的 关系 就 称 为 映射 。 

在 内 存 地 址 中 ， 最 简单 的 映射 方法 是 逐 字 节 映射 ， 即 一 个 线性 地 址 对 应 一 个 物理 地 址 。 比 如 线性 地 址 
为 0x0， 其 对 应 的 物理 地 址 可 以 是 0x0、0x10 或 其 他 你 喜欢 的 数字 ， 若 线性 地 址 为 0x1， 对 应 的 物理 地 址 
为 0x1、0x11 或 其 他 你 喜欢 的 数字 。 我 们 需要 找 个 地 方 来 存储 这 种 映射 关系 ， 这 个 地 方 就 是 页 表 (Page 
Table )。 页 表 就 是 个 N 行 1 列 的 表格 ， 页 表 中 的 每 一 行 (只 有 一 个 单元 格 ) 称 为 页 表 项 (Page Table Entry， 
PTE)， 其 大 小 是 4 字 节 ， 页 表 项 的 作用 是 存储 内 存 物理 地 址 。 当 访问 一 个 线性 地 址 时 ， 实 际 上 就 是 在 访 
问 页 表 项 中 所 记录 的 物理 内 存 地 址 。 

页 表 与 物理 内 存 关 系 示 意 如 图 5-9 所 示 ， 为 了 不 误导 大 家 ， 提 前 声明 ， 图 5-9 仅仅 是 线性 地 址 与 物理 
地 址 逐 字 节 上 映射 的 示意 图 ， 真 正 的 页 表 不 是 逐 字 节 映射 ， 图 5-9 仅 为 展示 页 表 与 物理 地 址 映射 原理 ， 我 们 
要 循序 渐进 嘛 。 

如 果 采 用 这 种 线性 地 址 与 物理 地 址 一 一 映射 的 方案 。 

(1) 表 中 就 应 该 有 4G 个 页 表 项 。 

(2) 32 位 的 地 址 要 用 4 字 节 的 页 表 项 来 存储 ， 页 表 总 共 大 小 是 4Byte*4G =16GB 。 

分 页 机 制 本 质 上 是 将 大 小 不 同 的 大 内 存 段 拆 分 成 大 小 相等 的 小 内 存 块 。 以 上 方案 其 实 就 是 将 4GB 空 
间 划 分 成 4G 个 内 存 块 ， 每 个 内 存 块 大 小 是 1 字 节 。 页 表 也 是 存储 在 内 存 中 的 ， 为 了 表示 32 位 地 址 ， 每 
个 页 表 项 必须 要 4 字 节 ， 若 按 此 方案 ， 光 是 页 表 就 要 占 16GB 内 存 ， 得 不 偿 失 ， 显 然 方案 不 合理 。 

以 上 方案 不 成 立 的 原因 是 内 存 块 数 量 太 大 了 ， 也 就 是 说 ， 在 总 的 4GB 地 址 空间 恒定 不 变 的 情况 下 ， 
内 存 块 尺寸 选 的 太 小 了 。 为 了 找到 合适 的 内 存 块 大 小 ， 我 们 做 下 列 分 析 与 尝试 。 

任意 进 制 的 数字 都 可 以 分 成 高 位 部 分 和 低位 部 分 若 将 低位 部 分 理解 为 单位 大 小 ， 高 位 部 分 则 是 这 种 
单位 的 数量 。 例 如 六 万 的 十 进 制 可 表示 为 60000， 也 可 以 表示 为 60 千 ， 也 就 是 将 60000 分 成 高 位 60 和 低 
位 1000 两 部 分 。 

32 位 地 址 表示 4GB 空间 ， 可 以 将 32 位 地 址 分 成 高 低 两 部 分 ， 低 地 址 部 分 是 内 存 块 大 小 ， 高 地 址 部 分 是 
内 存 块 数 量 ， 它 们 是 这 样 一 种 关系 : 内 存 块 数 * 内 存 块 大 小 =4GB。 故 我 们 可 以 在 图 5-10 所 示 的 32 位 地 址 上 滑 
动 滑 块 找到 合适 的 内 存 块 尺寸 。 滑 块 右边 是 内 存 块 尺 寸 ， 滑 块 左边 是 内 存 块 数量 。 

线性 地 址 逐 字 节 映射 到 物理 地 址 。 ”内 存 







































































































































































































































































































































































































































































































































































































































































































































































































































































假设 的 地 址 映射 ， 非 真正 页 表 
假设 的 页 表 
-| Oxfa 
于 左右 滑动 滑 块 ， 调 整 内 存 块 尺 寸 和 内 存 块 数量 
4G 个 Ox3 0x9 31 20 12 0 
页 表 项 Oxfa je 二 | | | 32 位 地 址 
0x9 要 Ox3 全 
于 | oa 数 块 
Ox1 是 汉王 
mi 内 存 块 数量 。 ”内存 块 尺寸 
4 图 5-9 页 表 与 物理 内 存 关系 示意 4 图 5-10 ”寻找 合适 的 页 尺寸 






































为 了 节省 页 表 空 间 ， 势 必要 将 滑 块 往 左 调整 ， 以 使 内 存 块 尺寸 变 大 ， 这 样 内 存 块 数量 变 小 ， 从 而 减少 了 页 表 
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项 数量 。 如 果 滑 块 指向 第 20 位 ， 内 存 块 大 小 为 2 的 20 次 方 , 即 1MB， 内 存 块 数量 为 2 的 12 次 方 ， 即 4K 
个 。 若 滑 块 指向 第 12 位 ， 内 存 块 大 小 则 为 2 的 12 次 方 ， 即 4KB， 内 存 块 数量 则 为 2 的 20 次 方 ，1M， 即 
1048576 个 。 这 里 所 说 的 内 存 块 ， 其 官方 名 称 是 页 ，CPU 中 采用 的 页 大 小 恰恰 就 是 4KB， 也 就 是 图 5-10 
中 滑 块 的 落 点 处 。 

页 是 地 址 空间 的 计量 单位 ， 并 不 是 专属 物理 地 址 或 线性 地 址 ， 只 要 是 4KB 的 地 址 空间 都 可 以 称 为 一 
页 ， 所 以 线性 地 址 的 一 页 也 要 对 应 物理 地 址 的 一 页 。 一 页 大 小 为 4KB， 这 样 一 来 ，4GB 地 址 空间 被 划分 
成 4GB/4KB=1M 个 页 , 也 就 是 4GB 空间 中 可 以 容纳 1048576 个 页 , 页 表 中 自然 也 要 有 1048576 个 页 表 项 ， 



















































































































































































































































































































































































这 就 是 我 们 要 说 的 一 级 页 表 。 一 级 页 表 如 图 5-11 内 存 

所 示 。 
5-11 所 示 是 一 级 页 表 模 型 ， 由 于 页 大 小 是 

4KB, 所 以 页 表 项 中 的 物理 地 址 都 是 4k 的 整数 倍 ， 页 表 

故 用 十 六 进 制 表 示 的 地 址 ， 低 3 位 都 是 0。 就 拿 第 10 

3 个 页 表 项 来 说 , 其 值 为 0x3000, 表示 该 页 对 应 的 ee 

物理 地 址 是 0x3000。 页 志 项 [cooo 二 和 
可 能 ， 您 心里 一 直 有 个 疑问 : 页 表 如 何 使 用 0x9000 0x3000 

呢 ? 也 就 是 如 何 将 线性 地 址 转换 成 物理 地 址 呢 ? X00 0x2000 
还 是 用 图 5-10 帮助 理解 ， 滑 块 正 落 到 在 32 Cs 

位 地 址 的 第 12 位 。 右边 第 11 一 0 位 用 来 表示 页 的 RS 

大 小 ,也 就 是 这 12 位 可 以 作为 页 内 寻 址 。 左 边 第 Ee 






































31 一 12 位 用 来 表示 页 的 数量 ， 同 样 这 20 位 也 用 来 索引 一 个 页 (索引 范围 0~0xfffff)， 表 示 第 几 个 页 ， 
对 吧 。 
其 实 也 可 以 这 样 理解 : 任意 一 个 地 址 最 终 会 落 到 某 一 个 物理 页 中 。32 位 地 址 空间 共有 1M (1048756) 
个 物理 页 ， 首先 要 做 的 是 定位 到 某 个 具体 物理 页 , 然后 给 出 物理 页 内 的 偏 移 量 就 可 以 访问 到 任意 1 字 节 的 
内 存 啦 。 所 以 ， 用 20 位 二 进 制 就 可 以 表示 全 部 物理 页 啦 。 标 准 页 都 是 4KB，12 位 二 进 制 便 可 以 表达 4KB 
之 内 的 任意 地 址 。 
在 32 位 保护 模式 下 任何 地 址 都 是 用 32 位 三 进 制 表 示 的 , 包括 虚拟 地 址 也 是 。 经 以 上 分 析 ， 虚 拟 地 址 的 高 
20 位 可 用 来 定位 一 个 物理 页 ， 低 12 位 可 用 来 在 该 物理 页 内 寻 址 。 这 是 如 何 实现 的 呢 ? 物理 地 址 写 在 页 表 的 页 
表 项 中 ， 段 部 件 输出 的 只 是 线性 地 址 ， 所 以 问题 就 变 成 了 : 怎样 用 线性 地 址 找到 页 表 中 对 应 的 页 表 项 。 
在 此 之 前 ， 大 家 要 知道 两 件 事 。 
(1) 分 页 机 制 打开 前 要 将 页 表 地 址 加 载 到 控制 寄存 器 cr3 中 ， 这 是 启用 分 页 机 制 的 先决 条 件 之 一 ， 在 
介绍 二 级 页 表 时 会 细 说 。 所 以 ， 在 打开 分 页 机 制 前 加 载 到 寄存 器 cr3 中 的 是 页 表 的 物理 地 址 ， 页 表 中 页 表 
项 的 地 址 自然 也 是 物理 地 址 了 。 
(2) 虽然 内 存 分 页 机 制 的 作用 是 将 虚拟 地 址 转换 成 物理 地 址 , 但 其 转换 过 程 相当 于 在 关闭 分 页 机 制 下 
进行 ， 过 程 中 所 涉及 到 的 页 表 及 页 表 项 的 寻 址 ， 它 们 的 地 址 都 被 CPU 当 作 最 终 的 物理 地 址 (本 来 也 是 物 
理 地 址 ) 直接 送 上 地 址 总 线 ， 不 会 被 分 页 机 制 再 次 转换 〈 和 否则 会 递归 转换 下 去 )。 
上 才 说 过 啦 ， 如 何 通过 线性 地 址 找到 其 对 应 的 页 表 项 才 是 转换 的 关键 。 既 然 页 表 位 于 内 存 中 ， 所 以 只 
要 提供 页 表 项 的 物理 地 址 便 能 够 访问 到 页 表 项 。 页 表 本 身 属于 线性 表 结 构 ， 相 当 于 页 表 项 数组 ,访问 其 1 
任意 页 表 项 成 员 ， 只 要 知道 该 表 页 项 的 索引 (下 标 〉 就 够 了 。 
分 析 过 后 ， 地 址 转换 过 程 原理 如 下 。 
一 个 页 表 项 对 应 一 个 页 ， 所 以 ， 用 线性 地 址 的 高 20 位 作为 页 表 项 的 索引 ， 每 个 页 表 项 要 占用 4 字 节 
大 小 ， 所 以 这 高 20 位 的 索引 乘 以 4 后 才 是 该 页 表 项 相对 于 页 表 物 理 地 址 的 字 节 偏 移 量 。 用 cr3 寄存 器 : 
的 页 表 物 理 地 址 加 上 此 偏 移 量 便 是 该 页 表 项 的 物理 地 址 ， 从 该 页 表 项 中 得 到 映射 的 物理 页 地 址 ， 然 后 用 线 
性 地 址 的 低 12 位 与 该 物理 页 地 址 相 加 ， 所 得 的 地 址 之 和 便 是 最 终 要 访问 的 物理 地 址 。 
曾经 有 同学 对 地 址 转换 过 程 感到 迷惑 , 误 以 为 启用 分 页 后 , 页 表 项 地 址 也 是 虚拟 地 址 , 还 需要 被 转换 ， 
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转换 过 程 无 限 递归 下 去 ， 这 显然 是 不 对 的 。 
以 上 所 说 的 转换 步骤 多 少 都 有 点 麻烦 ， 既 然 地 址 转换 算法 已 经 是 固定 的 了 ， 何 不 使 其 在 硬件 一 级 自动 
完成 呢 ? 有 道理 ， 所 以 CPU 中 集成 了 专门 用 来 干 这 项 工作 的 硬件 模块 ， 我 们 把 该 模块 称 为 页 部 件 。 当 程 








序 中 给 出 一 个 线性 地 址 时 ， 页 部 
总 结 一 下 页 部 件 的 工作 : 用 
中 的 物理 地 址 相 加 ， 所 求 的 和 便 是 最 终 线性 地 址 对 应 的 物理 地 址 。 

























































































| 下 


F 分 析 线 性 地 址 ， 按 照 以 上 算法 ， 自 动 在 页 表 中 检索 到 物理 地 址 。 
性 地 址 的 高 20 位 在 页 表 中 索引 页 表 项 , 用 线性 地 址 的 低 12 位 与 页 表 项 
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所 示 。 








中 们 还 是 通过 例子 来 理解 转换 过 程 吧 。 合 mov ax，[0x1234] 来 说 ， 其 地 址 转换 完整 过 程 如 图 5-12 




























内 存 

一 级 页 表 一 一 一 一 

= A 0xfa000 
i a 国 

作为 页 表 项 案 3 | 站 页 表 oe | | ox9000 
Pen | | Ox3000 
| | 0x2000 
线性 地 址 低 12 位 | 物理 地 址 -一 一 i 

4 和。 |-0x9254 -一 


( 低 12 位 是 0x234) 
页 部 件 











4 图 5-12 ”通过 一 级 页 表 将 线性 地 址 转换 成 物理 地 址 过 程 






































假设 咱们 是 在 平坦 模型 下 工作 ， 不 管 段 选择 子 值 是 多 少 ， 其 所 指向 的 段 基 址 都 是 0， 指 令 mov ax， 
[0x1234] 中 的 0x1234 称 为 有 效 地 址 ， 它 作为 “ 段 基 址 : 段 内 偏 移 地 址 ”中 的 段 内 偏 移 地 址 。 这 样 段 基 址 
为 0， 段 内 偏 移 地 址 为 0x1234， 经 过 段 部 件 处 理 后 ， 输 出 的 线性 地 址 是 0x1234。 由 于 咱们 是 演示 分 页 机 





































































































制 ， 必 须 假定 系统 已 经 打开 了 分 页 机 制 ， 所 以 线性 地 址 0x1234 被 送 入 了 页 部 件 。 页 部 件 分 析 0x1234 的 高 




















20 位 ， 用 十 六 进 制 表示 高 20 位 是 0x00001。 将 此 项 作为 页 表 项 索引 ， 再 将 该 索引 乘 以 4 后 加 上 cr3 寄存 
器 中 页 表 的 物理 地 址 ， 这 样 便 得 到 索引 所 指 代 的 页 表 项 的 物理 地 址 ， 从 该 物理 地 址 处 (页 表 项 中 ) 读 取 所 




















映射 的 物理 页 地 址 : 0x9000。 线 性 地 址 的 低 12 位 是 0x234， 它 作为 物理 页 的 页 内 偏 移 地 址 与 物理 页 地 址 
0x9000 相 加 ， 和 为 0x9234， 这 就 是 线性 地 址 0x1234 最 终 转换 成 的 物理 地 址 。 


































































































一 级 页 表 说 了 这 么 多 ， 完 全 是 为 了 讲述 页 表 原 理 ， 这 样 就 能 更 好 地 理解 下 面 要 讲 的 二 级 页 表 ， 它 们 在 



























































原理 上 一 脉 相 承 。 
们 再 见 啦 。 
5.2.3 ”二 级 页 表 





大 











为 目前 现代 操作 系统 一 般 都 是 用 的 二 级 页 表 ， 咀 们 的 系统 也 采用 二 级 页 表 ， 下 一 节 咀 




















前 面 讲述 了 页 表 的 原理 
要 搞 个 二 级 页 表 呢 ?理由 如 下 。 











并 以 一 级 页 表 作为 原型 讲述 了 地 址 转换 过 程 。 既然 有 了 一 级 页 表 ， 为 什么 还 





























(1) 一 级 页 表 














便 是 4MB 大 小 。 

















最 多 可 容纳 1M (1048576) 个 页 表 项 ， 每 个 页 表 项 是 4 字 节 ， 如 果 页 表 项 全 满 的 话 ， 

















(2) 一 级 页 表 ! 
用 户 进程 要 占用 低 3GB。 















































所 有 页 表 项 必须 要 提前 建 好 ， 原 因 是 操作 系统 要 占用 4GB 虚拟 地 址 空间 的 高 1GB， 












































(3) 每 个 进程 都 有 自己 的 页 表 ， 进 程 一 多 ， 光 是 页 表 占 用 的 空间 就 很 可 观 了 。 
归根 结 底 ， 我 们 要 解决 的 是 : 不 要 一 次 性 地 将 全 部 页 表 项 建 好 ， 需 要 时 动态 创建 页 表 项 。 如 何 解 


决 昵 ? 
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二 级 页 表 很 好 地 解决 了 该 问题 。 我 们 来 说 下 什么 是 二 级 页 表 。 





无 论 是 几 级 页 表 ， 标 准 页 的 尺寸 都 是 4KB， 这 一 点 是 不 变 的 。 所 以 4GB 线性 地 址 空间 最 多 有 1M 个 





























标准 页 。 一 级 页 表 是 将 这 1M 个 标准 页 放置 到 一 张 页 表 中 ， 二 级 页 表 是 将 这 1M 个 标准 页 平均 放置 IK 个 















































页 表 中 。 每 个 页 表 中 包含 有 1K 个 页 表 项 。 页 表 项 是 4 字 节 大 小 ， 页 表 包 含 1K 个 页 表 项 ， 故 页 表 大 小 为 








4KB， 这 恰恰 是 一 个 标准 页 的 大 小 。 




















拆 分 出 了 这 么 多 个 页 表 ， 如 何 使 用 它们 呢 ? 为 此 ， 专 门 有 个 页 目录 表 来 存储 这 些 页 表 。 每 个 页 表 的 物 




























































































是 4KB 大 小 ， 同 样 也 是 标准 页 的 大 小 。 


































































































于 物理 内 存 之 中 ， 如 图 5-13 所 示 。 

















物理 内 存 


上 | 物理 页 已 分 配 
[|] 物理 页 未 分 配 























物理 页 地 址 
页 目录 表 0o24 个 | 物理 交 tb 
页 表 项 可 
人 | 页 表 物理 页 地 址 一 一 一 一 
| 物理 页 地 址 
BE 村 
1024 个 (| 页 表 物理 页 地 址 二 家 吾 二 移 带 页 











页 目录 项 








/人 
fe Ee 
物理 页 地 址 2 


页 表 物 理 页 地 址 六 
物理 页 地 址 | 一 7 














-一 














别 阐 莹 洲 语 订 吕 








物理 页 地 址 








吧 潮 苞 履 订 冰 淹 四 到 

















A 图 5 一 13 级 页 表 占 用 内 存 示意 





























理 地 址 在 页 目录 表 中 都 以 页 目录 项 (Page Directory Entry， PDE) 的 形式 存储 ， 页 目录 项 大 小 同 页 表 项 一 
样 ， 都 用 来 描述 一 个 物理 页 的 物理 地 址 ， 其 大 小 都 是 4 字 节 ， 而 且 最 多 有 1024 个 页 表 ， 所 以 页 目录 表 也 








页 表 是 用 于 管理 内 存 的 数据 结构 ， 其 也 要 占用 内 存 ， 所 以 页 目录 表 和 页 表 所 占用 的 物理 页 ， 同 样 混迹 


图 5-13 中 ， 页 目录 表 中 共 1024 个 页 表 ， 也 就 是 有 1024 个 页 目录 项 。 一 个 页 目录 项 中 记录 一 个 页 表 
物理 页 地 址 ， 物 理 页 地 址 是 指 页 的 物理 地 址 ， 在 页 目录 项 及 页 表 项 中 记录 的 都 是 页 的 物理 地 址 ， 页 大 小 都 
是 0x1000， 即 4096， 因 此 页 地 址 是 以 000 为 结尾 的 十 六 进 制 数字 。 每 个 页 表 中 有 1024 个 页 表 项 ， 每 个 页 























































































































































































































表 项 中 是 一 个 物理 页 地 址 ， 最 终 数 据 写 在 这 页 表 项 中 指定 的 物理 页 中 。 页 表 项 中 分 配 的 物理 页 地 址 在 真正 
































物理 内 存 中 离散 分 布 ， 毫 无 规律 可 言 ， 操 作 系统 负责 这 些 物 理 页 的 分 配 与 释放 。 由 于 页 目录 表 和 页 表 本 身 






































都 要 占用 内 存 ， 且 为 4B 大 小 ， 故 它们 也 会 由 操作 系统 在 物理 内 存 中 分 配 一 物理 页 存放 。 






























































































































































图 中 最 粗 的 线 











存放 页 目录 表 物 理 页 ， 稍 细 一 点 的 线 指向 的 是 用 来 存放 页 表 的 物理 页 ， 其 他 最 细 的 线 是 页 表 项 中 分 配 的 物 
理 页 , 页 表 结 构 本 身 与 其 他 数据 混 布 渗透 在 物理 内 存 中 ,页 表 所 占用 的 物理 页 在 外 在 形式 上 与 其 他 数据 占 





























用 的 物理 页 没有 什么 不 同 ， 只 有 CPU 知道 它们 的 作用 不 同 。 页 表 在 建立 之 初 ， 物 理 内 存 各 部 分 的 布局 还 
































是 相对 较 整洁 的 ， 随 着 操作 系统 分 配 或 释放 内 存 的 动作 越 来 越 频 繁 ， 物 理 内 存 的 布局 将 更 加 零散 。 
二 级 页 表 与 一 级 页 表 在 原理 上 相同 , 但 结构 上 已 经 有 了 很 大 不 同 ,它们 在 虚拟 地 址 到 物理 地 址 转换 方 





















































法 上 也 有 很 大 不 同 。 


























我 们 已 经 知道 ， 前 面 所 说 的 一 级 页 表 转 换 方法 ,是 将 32 位 虚拟 地 址 拆 分 成 两 部 分 ， 高 20 位 用 了 








定位 一 个 物 
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在 二 级 页 表 是 这 样 的 : 





每 个 页 表 中 可 容纳 1024 个 物 到 


理 页 ， 低 12 位 用 于 物理 页 内 的 仿 




















。 在 二 级 页 表 转 换 中 ， 依 然 朋 



































EE 页， 故 每 个 页 表 可 表示 的 内 存 容 

















1024 个 页 表 ， 故 所 有 页 表 可 表示 的 





内 存 容量 











所 以 说 ， 任 意 一 个 32 位 物理 











地 址 ， 它 必然 在 茶 个 页 表 之 内 的 某 个 物理 














要 先 找到 其 所 


属 的 页 表 。 页 目 
































录 中 1024 个 页 表 ， 只 需要 10 位 二 进 














10 位 〈 第 31 一 22 














PDE 中 有 页 表 物 理 页 地 址 。 找 到 页 表 后 , 到 底 是 页 表 中 
故 只 需要 10 位 二 进 制 就 能 够 表示 了 。 所 以 虚拟 地 二 














位 ) 用 来 在 页 目录 





定位 


个 页 表 ， 


量 是 1024*4KB=4MB 。 


页 中 。 我 们 定位 某 一 个 4 

















有 32 位 虚拟 地 址 的 不 同 部 分 来 定位 物理 页 。 





十 右 





页 目录 中 











wf 








时 是 1024*4MB=4GB， 这 已 经 达到 了 32 位 地 址 空间 的 最 大 容量 。 
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剖 就 能 够 表示 了 ， 所 以 ， 














虚拟 地 址 


尹 理 页 ， 必 然 








bn 
[= 


的 高 

















也 就 是 这 高 10 
































物理 页 ， 也 就 是 在 页 表 ! 
二 进 制 便 可 以 表达 4KB 之 
经 以 上 分 析 ， 二 级 页 
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内 的 人 





F 意 地 二 


定位 一 个 页 表 项 PTE， 
止 ， 故 线性 

















表 地 址 转换 原理 





是 将 32 位 虚拟 


位 用 


于 定位 页 








的 页 目 














了 


























那 一 个 物理 页 呢 ? 











目的 
PTE ' 


中 间 10 位 
有 分 配 的 4 






























































的 作 





ls} 
41: 





也 就 是 定位 到 了 某 个 页 表 。 中 间 10 位 作为 物理 








高 10 位 作为 页 表 的 索引 ， 用 于 在 页 目录 表 中 定位 一 个 页 目录 ] 
E 页 的 索引 ， 用 于 在 页 表 内 定位 到 某 个 页 表 项 


,经 定位 到 











配 的 物理 页 地 址 ， 也 就 是 定位 到 了 某 个 物理 页 。 


同 
4 字 节 
























































和 ， 便 是 页 

















一 级 页 表 一 样 ， 访 问 和 
大 小 ， 给 出 了 PDE 和 PTE 索引 后 ， 还 需要 在 背后 悄 
要 访问 的 绝对 物理 地 址 。 转 换 过 程 背 

(1) 用 虚拟 地 址 的 高 10 位 乘 以 4， 作 为 页 目 
录 项 的 物 理 地 址 。 


























(2) 用 虚拟 地 址 的 
所 得 的 和 ， 




















间 1 
便 是 页 表 项 的 物理 
(3) 虚拟 地 址 的 高 10 位 和 中 间 10 位 分 别 是 PDE 和 PTE 的 索引 











值 啦 » 
里 页 地 址 ， 所 


就 不 是 索引 
中 得 到 的 物 
这 种 自 






































Hl 








0x1234567 









E 何 页 表 内 








读 取 该 页 目录 项 ， 从 
0 位 乘 以 4， 作 为 页 表 内 的 人 
地 址 。 读 取 该 页 表 项 ， 从 中 获取 到 分 配 的 物 到 





的 数据 都 要 通过 4 


后 的 具体 步骤 如 下 。 








1 于 页 表 中 可 容纳 1024 个 物理 页 ， 
(第 21~12 位 ) 用 来 在 页 表 中 定位 具体 的 








勿 理 页 地 址 。 由 于 标 # 
地 址 中 余下 的 12 位 《〈 第 11~0 位 ) 用 于 页 内 1 
邮 址 拆 分 成 高 10 位 、 中 间 10 位 、 低 12 位 三 部 分 
录 项 中 有 页 表 物 理 地 址 ， 
PTE， 页 表 项 中 有 分 


项 PDE， 页 目 




















录 项 PDE， 























住 页 都 是 4KB，12 位 


它们 



































氏 12 位 作为 页 内 





凯 移 上 








于 7 









































匆 理 二 


Ni 



































录 表 内 的 1 











和 


























的 和 便 是 最 终 转 换 的 物理 地 址 。 























1 页 部 件 





自动 完成 的 。 











Ox0 
段 基 址 


偏 移 地 址 


段 部 件 







线 
性 
地 0x1234567 

















0000 0001 0010 0011 0100 0101 0110 0111 


页 目录 物理 地 址 + 


Ox4*4 


一 一/ 
Ox234*4 


Ox567 




















» Ox1000 





+0Ox10 
十 OXC 
十 Ox8 
十 Ox4 





中 一 Ooxfa000 








vy 
中 Oxfa567 
+ Ox8d0 
+ Ox8cc 








TF ~ 了 +Ox8 
+ Ox4 
+ OxO 

















cr3 寄 存 器 








+0Ox0O 














页 目录 物理 地 址 
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A 


页 目录 


页 部 件 


> 


页 表 
物理 地 址 
Ox1000 








受 | 


5-14 








级 页 表 虚 拟 地 址 到 物理 地 址 转换 





局 移 地 址 ， 加 上 页 
矢 取 到 页 表 的 物理 地 址 。 
局 移 地 址 ， 加 上 在 第 1 步 : 
页 地址 。 
值 ， 所 以 它们 需要 乘 以 4。 但 


也 址 。 由 于 页 目录 项 PDE 



























































过 程 如 图 5-14 所 示 。 


内 存 





的 物理 页 内 寻 址 。 
和 页 表 项 PTE 都 是 
4 乘 以 4， 再 加 上 页 表 物 理 地 址 ， 这 


























录 表 的 物理 地 




















和 和 




















| Oxfa000 











0x9000 





0x3000 





0x2000 





0x1000 











0x0000 





到 的 页 表 物 理 地 址 ， 














低 12 位 





表示 的 范围 是 0 一 0xfff， 作 为 页 内 偏 移 最 合适 ， 所 以 虚拟 地 址 的 低 12 位 加 上 第 2 步 
化 较 强 的 工作 ， 还 是 
还 是 举例 子 来 说 ， 比 如 mov ax，[0x1234567]。 


5.2 ”启用 内 存 分 页 机 制 ， 畅 游 虚拟 空间 





图 5-14 中 页 目录 项 、 页 表 项 中 的 地 址 值 都 是 为 演示 而 虚构 的 ， 咱 们 对 照 着 图 示 细 说 下 转换 过 程 。 












































平坦 模型 下 段 基 址 为 0， 指令 mov ax，[0x1234567]， 经 过 段 部 件 处 理 ， 输 出 的 线性 地 址 为 0x1234567， 





























由 于 是 在 分 页 机 制 下 ， 此 地 址 被 认为 是 虚拟 地 址 ， 需 要 被 页 部 件 转换 。 页 部 件 首 先 要 把 地 址 拆 分 成 高 10 





位 、 中 间 10 位 、 低 12 位 三 部 分 。 其 实 低 12 位 最 容易 得 出 ， 十 六 进 制 的 每 1 位 代表 4 位 二 进 制 ， 所 以 低 
位 直接 就 是 0x567。 高 10 位 和 中 间 10 位 , 不 容易 一 眼看 出 来 , 所 以 还 是 将 它们 换算 成 二 进 制 看 比较 容易 。 
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这 


4 的 积 与 第 一 步 中 得 到 的 页 表 地 址 相 加 ， 所 得 的 和 便 是 页 表 项 物理 地 址 。 这 里 是 0x234*4=0x8d0， 页 表 项 物理 














0x1234567 的 二 进 制 形式 是 : 0000 0001 0010 0011 0100 0101 0110 0111。 
高 10 位 是 0000 0001 00， 十 六 进 制 为 0x4。 

中 间 10 位 是 10 0011 0100， 十 六 进 制 为 0x234。 

低 12 位 是 0101 0110 0111， 十 六 进 制 为 0x567。 
































第 一 步 : 为 了 得 到 页 表 物 理 地 址 ， 页 部 件 用 虚拟 地 址 高 10 位 乘 以 4 的 积 与 页 目录 表 物 理 地 址 相 加 ， 所 得 
的 和 便 是 页 目录 项 地 址 ， 读 取 该 页 目录 项 ， 获 取 页 表 物 理 地 址 。 这 里 是 0x4*4=0x10， 页 表 物 理 地 址 存储 在 cr3 
寄存 器 中 ， 由 于 是 过 程 演示 ， 无 需 给 出 具体 数值 ， 我 们 只 需要 用 0x10 作为 页 表 中 的 偏 移 地 址 便 能 够 找到 对 应 
的 页 目录 项 。 如 图 页 目录 表 和 页 表 中 ， 对 于 内 存 地 址 我 们 给 出 的 都 是 偏 移 量 ， 所 以 地 址 前 都 有 个 加 号 “+”。 




















































































































































































































我们 找到 了 最 上 面 的 页 目录 项 ， 其 值 为 0x1000。 这 意味 着 要 找 的 页 表 位 于 物理 地 址 0x1000。 


第 二 步 : 为 了 得 到 具体 的 物理 页 ， 需 要 找到 页 表 中 对 应 的 页 表 项 。 页 部 件 用 虚拟 地 址 中 间 10 位 的 值 乘 以 















































地 址 是 0x8d0+0x1000=0x18d0。 在 该 页 表 项 中 的 值 是 0xfa000， 这 意味 着 分 配 的 物理 页 地 址 是 0xfa000。 










































































地 址 相 加 ， 所 得 的 和 便 是 最 终 的 物理 地 址 。 这 里 是 0xfa000+0x567=0xfa567。 





虚拟 地 址 空间 中 。 图 5-15 所 示 是 多 个 进程 并 行 时 ， 在 各 自 栈 段 
虚拟 空间 中 的 情况 。 





直 都 说 它们 是 4 字 节 大 小 ， 用 来 存储 物理 页 地 址 ， 但 一 直 


未 
如 


地 址 ， 这 才 20 位 。 按 到 


在 建立 页 表 时 ， 会 在 页 目录 项 及 页 表 项 中 写 入 合适 的 值 
所 谓 “ 合 适 ”， 是 指 提前 设计 好 的 ， 马 上 咱们 就 知道 了 。 [| 


在 加 载 进程 时 讲述 有 关 部 分 。 | 























经 过 这 三 步 后 ， 页 部 件 将 虚拟 地 址 0x1234567 转换 成 物理 地 址 0xfa567。 




































































第 三 步 : 为 了 得 到 最 终 的 物理 地 址 ， 用 虚拟 地 址 低 12 位 作为 页 内 侦 移 地 址 与 第 二 步 中 得 到 的 物理 页 


5-14 中 ， 页 目录 的 页 目录 项 ， 页 表 中 的 页 表 项 ， 它 们 中 记录 的 物理 地 址 都 是 随意 写 上 去 的 ， 纯 粹 
是 为 演示 ， 所 以 大 家 不 要 纠结 它们 是 怎么 来 的 。 咱 们 以 后 每 个 进程 都 有 自己 的 页 表 






























































数据 段 









































每 个 任务 都 有 自己 的 页 表 ， 内 存 是 程序 竞技 的 江湖 ， 。 进程 A | ka 










































































另外 ， 任 务 在 切换 时 ， 页 表 也 需要 跟着 切换 ， 我 们 将 数据 段 























到 了 现在 ， 我 们 该 说 说 页 目录 项 和 页 表 项 的 事 啦 ， 一 进程 B | 作 吕 有 





Do = 一 

这 样 一 来 ,每 个 任务 都 以 为 自己 “独霸 武林 ” 活 在 自己 的 0 | | 
| es 
| 






























































物理 内 存 





















































































































































曾 见 过 它们 的 真实 面目 。 下 面 给 大 家 呈 上 它们 的 结构 ， 
图 5-16 所 示 。 4 图 5-15 每 个 进程 都 己 的 虚拟 空间 
31 121198 7 6 5 4 3 2 1 0 
页 表 物理 页 地 址 31~12 位 | AVL | G | 0 | DA[Pcp [|PwT|us[Rw[P 
页 目录 项 
31 121198 7 65 4 3 2 1 0 
物理 页 地 址 31~12 位 ”| AVL |G|PAT|D|A|PCD |PWT |Us|Rw|P 
页 表 项 














和 图 5-16 页 目录 项 及 页 表 项 






































您 看 ， 它 们 确实 如 之 前 所 述 ，4 字 节 大 小 ， 但 其 内 容 并 不 全 是 物理 地 址 ， 只 有 第 12 一 31 位 才 是 物理 
说 32 位 地 址 应 该 用 32 位 来 表示 啊 ， 否 则 不 就 误差 严重 了 吗 。 是 这 样 的 ， 因 为 页 
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录 项 和 页 表 项 中 的 都 是 物理 


页 地 址 ， 标 准 页 大 小 是 4KB， 故 地 址 都 是 4K 的 倍数 ， 

















位 是 0， 所 以 只 需要 记录 物 到 














地 址 高 20 位 就 可 以 啦 。 这 样 4 
























































氏 到 高 逐 位 介绍 。 





他 属性 ， 下 面 对 这 些 属性 从 
P，Present， 意 为 存在 位 








作 系 统 的 页 式 虚 拟 内 存 管理 
RW，Read/Write， 意 为 


US，User/Supervisor， 意 为 普 


3) 特权 的 程序 都 可 























立 。 若 为 1 表示 该 页 存在 于 物 到 
通过 P 位 和 相应 的 pagefault 异常 来 实现 的 。 


办 起 
读 写 位 。 若 为 1 表示 可 读 可 写 ， 若 为 0 表示 可 读 不 可 写 。 














这 







































































内 存 中 ， 若 为 0 表示 该 表 不 在 物 至 


也 就 是 地 址 的 低 12 


出 来 的 12 位 〈 第 0~11 位 ) 可 以 用 来 添加 其 


内 存 中 。 操 





前 用 户 / 超 级 用 户 位 。 若 为 1 时， 表示 处 于 User 级 ， 任 意 级 别 (0、1、2、 
以 访问 该 页 。 若 为 0， 表示 处 于 Supervisor 级 ， 特 权 级 别 为 3 的 程序 不 允 i 


秆 访问 该 页 ， 










































































































































































该 页 只 允许 特权 级 别 为 0、1、2 的 程序 可 以 访问 。 

PWT，Page-level Write-Through， 意 为 页 级 通 写 位 ， 也 称 页 级 写 透 位 。 若 为 1 表示 此 项 采用 通 写 方式 ， 
表示 该 页 不 仅 是 普通 内 存 ， 还 是 高 速 缓存 。 此 项 和 高 速 缓存 有 关 ,“ 通 写 ” 是 高 速 缓存 的 一 种 工作 方式 ， 
本 位 用 来 间接 决定 是 否 用 此 方式 改善 该 页 的 访问 效率 。 这 里 咱们 直接 置 为 0 就 可 以 啦 。 

PCD，Page-level Cache Disable， 意 为 页 级 高 速 缓存 禁止 位 。 若 为 1 表示 该 页 启用 高 速 缓存 ， 为 0 表 
示 禁 止 将 该 页 缓存 。 这 里 咱们 将 其 置 为 0。 

A，Accessed， 意 为 访问 位 。 若 为 1 表示 该 页 被 CPU 访问 过 啦 ， 所 以 该 位 是 由 CPU 设置 的 。 还 记得 段 





























痢 述 符 




















的 A 位 和 P 位 吗 ? 这 两 位 在 一 起 可 以 实现 段 式 虚拟 内 存 管 理 























项 中 的 A 位 也 可 以 ) 











] 来 记录 某 一 内 存 页 的 使 用 频率 (操作 系统 定期 将 i 








数 )， 从 而 
位 置 0， 下 次 访问 该 




















当 内 存 不 足 时 ， 可 以 将 使 用 频率 较 低 


D，Dirty， 意 为 脏 页 位 。 





























E。 和 它们 一 样 ， 这 里 页 目录 项 和 页 表 
玄 位 清 0, 统计 一 段 时 间 内 变 成 1 的 次 














的 页 面 换 出 到 外 存 ( 如 硬盘 )， 同 时 将 页 
煌 处 理 程 


序 将 硬盘 上 的 页 再 次 换 入 ， 同 















































页 引起 pagefault 异常 时 ， 中 
当 CPU 对 一 个 页 面 


















































仅 针 对 页 表 项 有 效 ， 
PAT, Page Attri 
比 位置 0 即 可 。 





了 




















并 不 会 修改 页 目录 项 中 
bute Table， 意 为 页 属性 


的 D 位 。 




















录 项 或 页 表 项 的 P 
时 将 P 位 置 1。 



































执行 写 操作 时 ， 就 会 设置 对 应 页 表 项 的 D 位 为 1。 此 项 


FE 表 位 ， 能 够 在 页 面 一 级 的 粒度 上 设置 内 存 属性 。 比 较 复杂 ， 将 























A 人 晶 








GGlobal， 意 为 全 局 位 。 











于 内 存 地 址 转换 也 是 颇 费 周折 ， 先 得 ; 





























Lookaside Buffer) 中 
此 G 























位 

















查 页 表 的 ， 所 以 为 了 提高 获取 物理 


来 指定 该 页 是 否 为 全 
缓存 TLB 中 一 直 保存 ， 给 出 虚拟 














拆 分 虚拟 地 址 ， 然 后 又 要 查 页 有 








录 ， 又 要 






































地 址 的 速度 ， 将 虚拟 地 址 与 物 
们 会 细 说 。 在 此 先知 道 TLB 是 用 来 缓存 地 址 转换 结果 
局 页 ， 为 1 表示 是 全 局 页 ， 为 0 表示 不 是 全 局 页 。 知 为 全 
扯 直 接 就 出 物理 地 址 啦 ， 无 需 那 三 步骤 转换 。 由 了 


























，TLB 以 后 





用 
LJ 
















































































里 地 址 转换 结果 存储 在 TLB (Translation 





的 高 速 缓 存 就 ok 啦 。 








局 页 ， 该 页 将 在 高 速 





FTLB 容量 比较 小 (一 般 








a 











速度 较 快 的 存储 设备 容量 都 比较 小 





方式 ， 一 是 用 invlpg 


AVL， 意 为 Available 位 ， 表 示 可 
们 也 不 到 








的 值 ， 那 1h 





























上 
)， 所 以 这 里 面 就 存放 使 用 频率 较 高 的 页 面 。 顺 便 说 


























>» 























人 句 , 


空 TLB 有 两 种 















































指令 针对 单独 虚拟 地 址 条 目 清理 ， 或 者 是 重 














折 加 载 cr3 寄存 器 ， 这 将 直接 ; 


空 TLB。 












































j， 谁 可 以 用 ? 当然 是 软件 





F， 操 作 系统 可 














会 吧 。 











该 位 ，CPU 不肖 


会 该 位 














似乎 关于 页 表 的 部 分 已 经 说 了 不 少 了 , 也 许 大 伙 儿 都 已 经 等 不 及 了 , 在 想 究竟 什么 时 候 才能 启 ) 

















看 我 们 讲述 的 原理 





比较 多 ， 占 的 篇 幅 











P= 





项 及 页 表 项 后 ,实际 
的 都 是 小 事 ， 用 不 了 多 少 篇 














面 
启用 分 页 机 制 ， 















































上 我 们 只 完成 了 局 


和 
互 
田 o 


顺序 做 好 三 件 寻 





] 分 页 机 





由 的 第 一 步 ， 我 们 距 启 | 








分 页 机 








Puy] 
o 





我 们 要 按 





(1) 准备 好 页 目录 表 及 页 表 。 








(2) 将 页 表 地 志 


(3) 寄存 器 cr0 





上}: 写 入 控 种 


| 





寄存 器 cr3。 
的 PG 位 置 1。 
































在 介绍 完了 页 目录 项 及 页 表 项 后 , 我 们 便 知道 如 何 创 





建 一 个 页 目 

















看 咱们 看 看 后 面 的 两 部 分 。 









































页 表 同 描 
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述 符 表 一 样 ， 是 个 内 存 中 的 数 所 
以 页 表 也 有 个 专门 的 寄存 器 来 存储 其 地 址 。 其 


居 结 构 ， 处 到 








ps 


比较 长 ， 俗 话说 ， 魔 刀 不 误 砍 柴 工 嘛 。 在 我 们 刚刚 
判 还 有 一 


录 表 和 页 表 了 ,这 相当 于 我 们 已 经 有 


器 要 使 用 它们 ， 必 须要 知道 它们 的 物 到 








页 表 。 
述 完 了 页 目录 
些 工作 要 做 ， 后 
































地 址 ， 所 





























站 











9 们 多 次 提 到 的 众多 控 














实 这 就 是 前 四 











判 寄存 器 〈 目 前 处 到 

















和 
















































































中 的 控制 寄存 器 有 cr0 一 cr7) 中 的 一 个 : cr3 寄存 器 。 控 制 寄存 器 cr3 用 于 存储 页 表 物 理 地 址 ， 所 以 cr3 寄 
存 器 又 称 为 页 目录 基 址 寄存 器 (Page Directory Base 31 1211 5 4 3 210 
Register，PDBR)。 其 结构 如 图 5-17 所 示 。 页 目录 表 物理 地 址 31~12 位 PCD | PWT 

由 于 页 目录 表 所 在 的 地 址 要 求 在 一 个 自然 页 内 ， 即 页 4 图 5-17 页 目录 基 址 寄存 器 PDBR ( 控制 寄存 器 cr3 
































目录 的 起 始 地 址 是 4KB 的 整数 倍 ， 低 12 位 地 址 全 是 0。 所 以 ， 只 要 在 cr3 寄存 器 的 第 31 一 12 位 中 写 入 物理 地 
址 的 高 20 位 就 行 了 。 另 外 ，cr3 寄存 器 的 低 12 位 中 ， 除 第 3 位 的 PWT 位 和 第 4 位 的 PCD 位 外 ， 其 余 位 都 没 
用 。PWT 位 和 PCD 位 在 介绍 页 表 项 时 说 过 了 ， 它 们 用 于 设置 高 速 缓存 相关 的 特性 ， 在 此 将 其 置 为 0 即 可 。 这 
样 一 来 低 12 位 全 部 为 0， 故 只 需要 把 页 目录 表 物 理 地 址 的 高 20 位 写 入 cr3 寄存 器 即 可 。 

因为 控制 寄存 器 是 可 以 与 通用 寄存 器 互相 传递 数据 的 ， 所 以 为 cr3 寄存 器 赋值 则 没有 那么 复杂 ， 可 以 用 现成 
的 mov 命令 ，mov 指令 中 控制 寄存 器 与 通用 寄存 器 互 传 数据 的 格式 是 : mov cr[0~7]，1r32 或 movr32, cr[0~7]。 

坚持 一 下 ， 离 启用 分 页 机 制 ， 我 们 只 差 一 步 啦 。 

前 两 步 是 打开 分 页 机 制 的 铺垫 ， 现 在 看 第 3 步 。 启 动 分 页 机 制 的 开关 是 将 控制 寄存 器 cr0 的 PG 位 置 1， 
PG 位 是 cr0 寄存 器 的 最 后 一 位 : 第 31 位 。 如 果 大 家 忘记 了 cr0 寄存 器 结构 , 请 参见 图 4-10 控制 寄存 器 CR0。 
PG 位 为 1 后 便 进入 了 内 存 分 页 运行 机 制 ， 段 部 件 输 出 的 线性 地 址 成 为 虚拟 地 址 (顺便 说 一 下 , 第 0 位 是 PE 
位 ， 用 来 进入 保护 模式 的 开关 )。 在 将 PG 位 置 1 之 前 ， 系 统 都 是 在 内 存 分 段 机 制 下 工作 ， 段 部 件 输出 的 线 
性 地 址 便 直 接 是 物理 地 址 ， 也 就 意味 着 在 第 2 步 中 ，cr3 寄存 器 中 的 页 表 地 址 是 真实 的 物理 地 址 。 

好 啦 ， 有 关 页 表 的 部 分 ， 真 的 到 此 为 止 啦 ， 说 完了 ， 咱 们 必须 要 动手 实践 一 下 啦 。 


5.2.4 规划 页 表 之 操作 系统 与 用 户 进程 的 关系 


分 页 的 第 一 步 要 准备 好 一 个 页 表 ， 我 们 的 页 表 是 什么 样子 呢 ? 现在 我 们 要 设计 一 个 页 表 啦 。 

设计 页 表 其 实 就 是 设计 内 存 布局 , 不 过 在 规划 内 存 布局 之 前 ,我们 需要 了 解 用 户 进程 与 操作 系统 之 间 的 关系 。 

前 面 讲 保护 模式 时 ， 我 们 知道 ,为 了 计算 机 安全 ， 用 户 进 程 必须 运行 在 低 特权 级 ， 当 用 户 进 程 需要 访问 
硬件 相关 的 资源 时 ， 需 要 向 操作 系统 申请 ， 由 操作 系统 去 做 ,之 后 将 结果 返回 给 用 户 进程 。 进程 可 以 有 无 限 
多 个 ， 而 操作 系统 只 有 一 个 ， 所 以 ， 操 作 系统 必须 “共享 ”给 所 有 用 户 进程 。 它 们 的 关系 如 图 5-18 所 示 。 
5-18 不 仅 展 示 了 用 户 进程 共享 操作 系统 的 逻辑 依赖 关系 ， 还 用 插 槽 展示 了 它们 的 配合 关系 ， 用 户 
进程 要 想 完 成 某 件 工作 ， 需 要 与 操作 系统 结合 在 一 起 才 行 ， 那 用 户 进程 和 操作 系统 它们 是 什么 关系 呢 ? 

要 完成 一 件 事 ， 用 户 进程 做 的 事情 只 能 算 个 半成品 ， 您 可 以 理解 成 : 用 户 的 代码 加 上 所 需要 的 操作 系 
统 中 的 部 分 代码 才 算 完 整 的 程序 ， 为 什么 说 是 操作 系统 中 的 部 分 代码 呢 ? 原因 很 简单 ， 因 为 操作 系统 严格 
来 说 是 一 套 功 能 的 集合 ， 用 户 进程 所 需要 的 部 分 可 能 仅仅 是 其 中 的 一 小 部 分 ， 并 不 是 所 有 功能 都 会 用 到 。 
用 户 进程 能 用 哪些 功能 ， 是 由 操作 系统 决定 的 ， 不 是 用 户 想 用 什么 就 用 什么 ， 而 是 操作 系统 提供 什么 它 就 
用 什么 。 完 整 的 程序 概念 如 图 5-19 所 示 。 
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操作 系统 代码 











完整 的 程序 


] 。 上 操作 系统 进 0 
sz 程 个 
已 用 户 进程 d 












































用 户 进程 代码 
1 用 户 进程 共享 操作 系统 
2 用 户 进 程 与 操作 系统 配合 “在 一 起 ”才能 完成 工作 用 户 程序 代码 + 所 调用 的 操作 系统 代码 = 完整 的 程序 
和 图 5-18 进程 共享 操作 系统 和 图 5-19 完整 的 程序 



































它 和 操作 系统 需要 共同 配合 才能 完成 一 件 事 ,， 它们 的 关系 有 如 服务 提供 商 和 客户 的 关系 。 服务 提 供 商 
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提 任 














必须 没有 ， 得 拿 到 商 





t 一 些 服务 ， 客 户 只 能 




















] 这 些 











品 才 算 完 


























流 送 到 您 家 ， 这 才 拿 到 了 商品 ， 到 此 才 算 完事 了 。 


以 上 购物 的 例 

















上 述 所 说 的 用 户 进程 和 操作 系统 的 关系 ,都 是 基于 用 户 进程 共享 操 
足 这 个 基本 要 求 : 共享 。 


如 何在 页 表 中 实现 共享 呢 ? 这 个 简 身 
说 起 来 简单 ， 这 该 怎么 做 呢 ? 我 们 可 以 把 4GB 虚拟 地 址 空 
。 比 如 我 们 之 前 都 听 说 过 ， 


另 一 部 分 








就 归 用 户 进程 使 ) 
内 存 的 低地 址 。 比 如 Linux， 它 就 ; 

页 表 的 设计 是 要 根据 内 存 分 布 和 
高 3GB 以 上 的 部 分 划分 给 操作 系统 ，0~3GB 是 用 户 进程 自 

















子 就 是 典型 的 用 户 程序 和 操作 系统 的 关系 , 中 
包 商 才 是 充当 了 操作 系统 的 角色 ， 根 和 



























































惠 | 






































人 更 村 








运行 在 虚拟 地 址 的 3GB 以 上 ， 
青 况 来 决定 的 ， 我 们 也 学 习 Linux 


人 


服务 ， 也 就 是 说 客户 依赖 于 服务 提供 商 提 供 的 服务 项 
主导 客户 。 比如 咀 们 在 网 上 买 东西 , 咱们 只 需要 挑选 好 商品 后 写 好 地 址 , 然后 下 订单 就 成 了 。 
事 。 所 以 ,之 后 的 事情 就 交 给 电 商 了 ， 他 们 为 你 从 库 中 


] 挑 商品 下 单 这 件 事 
买 家 的 需求 找到 所 需要 的 资源 ， 然 后 通过 物流 ， 将 商品 











只 要 操作 系统 属于 用 户 进程 的 虚拟 地 址 空 
间 分 成 两 部 分 ， 一 
操作 系统 在 4GB 内 存 的 








的 作法 ， 在 | 


























》 是 服务 提供 


挑选 商品 ， 然 后 | 


就 相当 于 进程 , 而 网 











商 的 
完了 吗 ? 
] 物 








这 事 
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部 分 专门 




















高 地 址 ， 用 户 进程 
其 他 用 户 进程 都 运行 在 3GB 以 下 。 
j 户 进程 4GB 虚拟 地 址 空 








(结果 ) 返回 。 





芷 系统 的 。 我 们 设计 的 页 表 也 要 满 


x 间 就 好 了 。 


划 给 操作 系统 ， 


年 4GB 
























































己 的 虚拟 空 


zs 间 。 为 了 实现 


共享 操作 





系统 ， 


间 的 
让 所 有 用 























aie 


户 进 程 3GB~4GB 的 虚拟 地 址 空间 都 指向 同一 个 操作 系统 ， 也 就 是 所 有 进程 的 虚拟 地 址 3GB 一 4GB 本 质 上 都 是 














指向 的 同一 片 物理 























自己 也 反复 断 句 


























将 聊 聊 具体 实现 。 


























5.2.5 启用 分 页 机 制 


我 们 即将 打开 分 页 机 制 , 从 此 我 们 的 程序 将 在 虚拟 地 址 空 





es 




















分 页 机 于 





日 们 实践 一 把 看 看 。 
在 实践 之 前 ， 我 们 的 脑子 





页 地 址 ， 这 片 物理 























] 户 进程 时 咱 


页 上 是 操作 系统 的 实体 代码 。 实 现 起 来 
虚拟 地 址 空间 3GB~4GB 对 应 的 页 表 项 中 所 记录 的 物理 页 地 址 是 相同 的 就 行 中 
了 几 次 ， 不 过 这 个 在 加 载 | 




















们 





























也 比较 容易 ，5 














口 型 





。 哈哈 ， 


要 保证 所 有 
这 人 句 话 确实 有 点 长 











] 户 进程 
长 ,我 





























了 细 说 ， 在 此 我 们 只 需要 完成 内 存 空 s 间 划分 就 行 
以 上 我 们 讨论 的 结果 是 : 虚拟 地 址 空间 的 0~3GB 是 用 户 进程 ，3GB 一 4GB 是 操作 系统 。 下 一 节 我 们 























有 页 表 。 我 人 



































页 目录 表 和 页 表 都 存在 于 物理 内 存 之 中 ， 
页 目录 表 的 位 置 ， 我 们 就 放 在 物理 地 址 0x100000 处 。 为 了 让 页 表 和 页 目录 表 紧 凑 一 些 
的 )， 咱 们 让 页 表 紧 挨 着 页 目录 表 。 页 目录 本 身 
物理 布局 如 图 5-21 所 示 。 
[ PTE 1023 PDE 页 目录 项 
PTE 页 表 项 
FET 4KB 物理 页 
PTE 0 
PTE 1023 
1024 医 加 
个 而 江 二 4KB 物理 页 
PTE 0 同 网 
PTE 1023 
页 表 包 括 
O41 < | 4KB 物理 页 
PTE 0 
PDE 1023 
人 ] 是 gr 1 | 天 一 一 4KB 物理 页 
目 录 表 1 PDE 1 
PDE 0 | 
页 目录 表 与 页 表 的 关系 
全 图 5-20 页 目录 表 与 页 表 的 关系 
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间 中 运行 。 有 














了 前 国 

















了 。 


[的 理 仑 知识 ， 说 干 就 干 ， 


FP 得 有 个 页 表 的 印象 ， 我 们 页 表 将 按照 如 下 方式 部 署 ， 如 图 5-20 所 示 。 
上 得 有 页 目录 表 ， 页 目录 表 中 的 是 页 目录 项 ， 其 中 记录 的 是 页 表 的 物理 地 址 及 相关 





属性 ， 所 以 还 得 








] 实 际 的 页 目录 表 及 页 表 也 将 按照 此 空间 位 置 部 署 ， 地 址 的 最 下 面 是 页 目录 表 ， 往 上 依次 是 页 表 。 














它 总 该 有 个 “ 安 喘 ”的 地 址 。 我 们 把 它们 安装 在 哪里 呢 ? 



































































































































占 4KB， 所 以 第 一 个 页 表 的 物理 地 址 是 0x1 








(这 不 是 必须 
01000。 它 们 的 


页 目录 表 及 页 表 布 局 


表 目 录 表 








页 表 项 1023 











页 表 项 1 
页 表 项 0 
页 目录 项 1023 




















页 目录 项 1 
页 目录 项 0 














Ox101000 


Ox100000 




















5-21 页 








录 表 与 页 表 内 存 布 




















可 





首先 关于 分 页 功能 的 全 部 代码 是 代码 5-3， 并 不 是 下 面 的 代码 5-2， 代 码 5-2 只 是 在 代码 5-3 中 调用 的 
函数 ， 它 用 于 建立 页 目录 表 和 页 表 ， 我 想 先 把 它 给 大 家 交待 清楚 ， 知 道 了 实际 内 存 安 排 后 有 利于 理解 后 面 
分 页 机 制 的 其 他 部 分 。 如 果 大 伙 儿 心急 的 话 ， 可 以 先 看 看 代码 5 3， 从 全 局 上 看 看 代码 流程。 



























































































































































代码 5-2 是 为 了 完成 启用 内 存 分 页 机 制 三 步 曲 之 第 一 步 : 准备 好 页 目录 及 页 表 。 其 中 原委 下 面 听 小 弟 
慢 慢 说 来 。 


代码 5-2 (project/c5/b/boot/loader.S ) 


和 创建 页 目录 及 页 表 。 --------------- 
182 setup page: 、 
183 ; 先 把 页 目录 占用 的 空间 逐 字 节 清 0 





















































184 mov ecx, 4096 

业 上 功 mov esi, 0 

186 .clear page dir: 

187 mov byte [PAGE DIR TABLE POS + esi], 0 
188 inc esi 

189 loop .clear page dir 

E90 














191 ;开始 创建 页 目录 项 (PDE) 
192 .create pde: ; 创建 Page Directory Entry 































































































£93 mov eax, PAGE DIR TABLE POS 

194 add eax, Ox1000 ; 此 时 eax 为 第 一 个 页 表 的 位 置 及 属性 

195 mov ebx, eax ; 此 处 为 ebx 赋值 ， 是 为 .create _pte 做 准备 ，ebx 为 基 址 
196 

下 93 下 面 将 页 目录 项 0 和 0xc00 都 存 为 第 一 个 页 表 的 地 址 ， 每 个 页 表 表 示 4MB 内 存 








198 ; ”这 样 oxc03fffff 以 下 的 地 址 和 0x003fffff 以 下 的 地 址 都 指向 相同 的 页 表 
199 ; ”这 是 为 将 地 址 映射 为 内 核 地 址 做 准备 








































































































































































































































































































































































































































































































200 or eax, PG US U | PG RWW | PGP 

; 页 目录 项 的 属性 RW 和 P 位 为 1，US 为 1， 表示 用 户 属性 ， 所 有 特权 级 别 都 可 以 访问 
201 mov [PAGE DIR TABLE POS + 0x0], eax ; 第 1 个 目录 项 

;在 页 目录 表 中 的 第 1 个 目录 项 写 入 第 一 个 页 表 的 位 置 (0x101000) 及 属性 (7) 
202 mov [PAGE DIR TABLE POS + 0xc00]，eax 
; 一 个 页 表 项 占用 4 字 节 
; 0xc00 表示 第 768 个 页 表 占 用 的 目录 项 ，0xc00 以 上 的 目录 项 内 核 空间 
203 ;也 就 是 页 表 的 Oxc0000000~ OxfEffEfEE 共计 1G 属于 内 核 
; 0x0~0xbfffffff 共计 3G 属 程 

204 sub eax, 0x1000 
205 mov [PAGE DIR TABLE POS + 4092], eax 
; 使 最 后 一 个 目录 项 指向 页 目录 表 自 己 的 地 址 
206 
207 ;下 面 创建 页 表 项 (PTE) 
208 mov ecx, 256 ; 1M 低 端 内 存 / 每 页 大 小 4k = 256 
209 mov esi, 0 
210 mov edx, PG_US_U PG RWW | PGP ; 属性 为 7，US=1，RN=1，P=1 
211 .create pte: ; 创建 Page Table Entry 
A mov lepxtesi*4], edx 
; 此 时 的 ebx 已 经 在 上 面 通过 eax 赋值 为 0x101000， 也 就 是 第 一 个 页 表 的 地 址 
213 add edx,4096 
214 inc esi 
之 于 9 loop .create pte 
216 
217 ;创建 内 核 其 他 页 表 的 PDE 
218 mov eax, PAGE DIR TABLE POS 
219 add eax, 0x2000 ; 此 时 eax 为 第 二 个 页 表 的 位 置 
220 or eax，PG US U | PG RW W | PG P ; 页 目录 项 的 属性 Us、RW 和 P 位 都 为 1 
2 mov ebx, PAGE DIR TABLE POS 
222 mov ecx, 254 ; 范围 为 第 769 ~ 1022 的 所 有 目录 项 数量 
223 mov esi, 769 
224 .create kernel pde: 
22 二 mov [ebxtesi*4], eax 
226 inc esi 
227 add eax, 0x1000 
228 loop .create kernel pde 
229 ret 











先 跟 大 家 笼统 地 说 下 代码 5-2 的 工作 ， 大 致 上 分 成 两 部 分 ， 第 一 部 分 先 建立 个 页 目录 表 ， 后 面 的 第 
部 分 建立 个 页 表 。 
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| 于 我 们 的 系统 不 是 像 Linux 导 

















的 原理 以 及 简单 的 实现 ， 所 以 ,代码 量 一 定 要 小 ， 这 样 大 家 才 有 可 能 坚持 下 来 。 目 

















们 的 定位 就 是 学 习 操作 系统 








pg 样 的 庞然大物 ， 现 在 啥 都 讲究 个 “定位 ” 





























就 是 70KB 以 内 ， 所 以 咱们 还 是 充分 利 











] 低 端 1MB 内 存 ， 以 后 会 把 内 核 加 载 到 

















三 分 地 上 折腾 就 行 啦 。 当 然 ， 依 然 可 以 将 




















测 完成 之 后 ， 内 核 体积 大 概 











放 到 1MB 之 上 的 任意 位 置 ， 看 您 自己 的 安排 啦 ， 在 本 书 中 ， 


氏 端 1MB 之 内 ， 就 在 这 一 亩 
咱们 






































的 mbr、loader、 操 作 系 统 内 核 都 将 放置 厂 














交待 完了 ， 大 家 有 没有 疑问 ? 比 妇 


























0 我 刚刚 说 的 内 核 在 物理 

















E 这 1MB 空间 内 ， 当 然 这 1MB 是 指 物理 内 存 的 0 一 0Oxfffff。 
内 存 1MB 之 内 ， 但 之 前 又 说 将 内 核 地 址 映 





射 到 虚拟 地 址 3GB 之 上 。 这 如 何 做 到 ?也许 有 同学 马上 已 经 抢答 了 ， 对 嗪 ， 就 是 将 虚拟 地 址 0xc0000000 


Ws 








T 





的 1MB 地 址 映射 到 物理 内 
正式 工作 开始 啦 。 











2 














存 1MB 之 内 。 





























第 181 一 189 行 先 清空 页 




















将 它 
4096 个 字 节 ， 这 里 























Mp 








录 表 所 占 的 内 存 ， 

门 统一 初始 化 为 0。 我 这 个 人 太 小 心 啦 ， 采 取 
4 loop 循环 指令 逐个 清 0。 loop 指令 会 
为 4096， 每 次 循环 一 次 后 ，ecx 会 减 1， 直 到 ecx 为 0。 值 




















于 内 存 中 有 




















大 量 随机 数据 ， 还 是 小 心 一 点 好 ,1 








们 先 



































得 说 的 是 PAGE . 
































定义 在 include.inc 中 ， 这 个 宏 用 于 定义 页 目录 表 的 物理 地 址 。 
列 出 了 部 分 新 增 内 容 。 

















见 代码 5-3， 











代码 5-3 





1b 

PG RW R equ 00b 
PG RW W equ 10b 
PG US S equ 000b 


PG US U equ 100b 


代码 5-3 中 的 第 9 行 PAGE DIR TABLE POS | 








是 我 们 会 把 页 目 
页 目录 项 PDE 和 页 表 项 PTE ' 


PG_US_S 举例 ， 它 表示 PTE 和 PDE 的 
最 右边 的 两 个 0 是 


























loader 和 kernel 


的 属性 ， 是 用 二 进 制 直接 定义 的 ， 





























( project/c5/b/boot/include/boot.inc ) 








的 是 逐 字 节 清 0 的 方式 。 页 
用 到 ecx 做 循环 计数 器 ， 所 以 为 ecx 寄存 器 赋值 
DIR_TABLE,_POS 这 个 宏 ， 
那 我 们 现在 插播 个 小 插 | 





录 表 大 小 是 4KB， 也 就 是 














Cra 


它 
介绍 下 新 的 属性 ， 
























































j 于 定义 页 目录 表 的 物理 : 

















地 址 ， 


它 的 值 为 0x100000， 也 就 








录 表 放置 到 物理 内 存 0x100000。 这 是 出 了 低 端 1MB 空间 的 第 一 个 字 节 。 第 43 一 48 行 是 | 


























大 


















































此 各 二 进 制 数 字 都 以 字符 b 结尾 。 拿 





US 属性 值 为 S$， 这 里 把 S 的 值 定义 为 000b， 注 意 ， 昌 然 写 了 3 个 0， 
























































占 位 的 ， 只 有 最 左边 的 0 才 表 示 US 的 值 ， 


大 

















此 US 位 的 值 为 0， 这 表示 此 PTE 或 PDE 指向 


的 内 存 不 能 被 特权 级 3 的 任务 访问 ， 处 理 器 只 允许 特权 级 为 0、1、2 的 任务 访问 该 PTE 或 PDE 指向 的 内 存 。 




















您 懂 的 ,PG_US_U 




















的 意思 是 US 位 的 值 为 1, 处 理 




















器 允许 任何 特权 级 






































表示 PTE 或 PDE 指向 的 物 


理 内 存 页 框 已 位 于 内 











存 中 ， 这 个 P 位 的 作 | 


的 任务 访问 PTE 或 PDE 指向 的 内 存 .PG P 
已 经 和 大 伙 儿 介绍 过 了 ， 当 物理 内 存 不 


























足 时 ， 操 作 系统 的 虚拟 内 存 管 理 机 制 有 可 能 会 将 ; 
PTE 的 P 位 便 被 操作 系统 置 为 0， 处 理 器 访问 该 
处 理 程序 ， 该 程序 会 将 所 缺 的 页 从 筷 






































常 注册 了 中 出 
行 结束 后 ， 处 理 器 会 
或 PTE 指向 的 物理 内 存 可 写 、 

代码 5-2 的 第 187 行 ， 是 利 
inc esi， 每 次 使 esi 








































































































玄 PDE 或 PTE 指向 















































结束 啦 ， 赶 紧 回 到 代码 5-2。 








A 


的 物理 页 框 换 出 到 磁盘 
PDE 或 PTE 时 会 触发 page_fault 缺 页 异常 ， 操 作 系 统 为 该 异 
盘 上 重新 加 载 到 内 存 中 ， 并 将 P 位 置 为 1。 中断 处 理 
再 次 该 PDE 或 PTE， 发 现 P 位 为 1， 顺 利通 过 。PG_RW_W 和 PG RW _R 分 别 表示 PDE 
只 读 。 好 啦 ， 插 | 
] PAGE _DIR_TABLE POS 作为 基 址 ，esi 
自 增 1， 逐 步 完 成 4096 字 节 的 清 0 工作 。 











上 上， 此 时 PDE 或 
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厅 运 








芷 为 变 址 ， 然 后 通过 188 行 的 


























第 191 一 205 行 是 创建 页 目录 项 ， 














由 了 



































第 197~205 行 。 寄 存 器 eax 是 页 





孙 ] 


代码 中 的 注释 已 经 很 详尽 了 ， 这 里 不 再 
项 的 内 容 〈 提 醒 一 下 ，PG_US_U | PG_RW_W | PG_P 逻辑 或 的 结果 


陈述 。 重 点 说 一 下 








是 0x7)， 分 别 将 其 存 入 到 页 目录 项 的 第 0 项 和 第 768 项 ，0xc00/4=768。 页 目 








用 
pg 


说 ， 这 两 处 都 是 指向 同一 个 页 表 。 首 
要 指向 的 物理 
儿 在 说 创建 页 表 时 就 知 


200 








地 址 范 转 


| 






































道 啦 。 








E 明 确 一 下 ， 它 们 共同 所 指 问 的 这 个 页 表 地 址 是 0x101000， 它 将 
是 0 一 0xfffff， 只 是 1MB 的 空间 ， 其 余 3MB 并 未 分 配 。 这 是 我 们 设计 好 的 。 一 




















录 项 代表 一 个 页 表 ， 也 就 





是 
来 
会 





为 什么 要 在 两 处 指向 同一 个 页 表 ? 原因 是 我 们 在 加 载 内 核 之 前 ， 程 序 中 运行 的 一 直 都 是 loader， 它 本 

身 的 代码 都 是 在 1MB 之 内 , 必须 保证 之 前 段 机 制 下 的 线性 地 址 和 分 页 后 的 虚拟 地 址 对 应 的 物理 地 址 一 致 。 
第 0 个 页 目录 项 代表 的 页 表 ， 其 表示 的 空间 是 0~0x3fffff， 包 括 了 1MB (0 一 0xfffftf)， 所 以 用 了 第 0 项 来 
保证 loader 在 分 页 机 制 下 依然 运行 正确 。 那 为 什么 也 要 把 该 地 址 放置 到 第 768 项 呢 ? 前 面 说 过 啦 ， 我 们 将 
来 会 把 操作 系统 内 核 放 在 低 端 1M 物理 内 存 空 间 ， 但 操作 系统 的 虚拟 地 址 是 0xc0000000 以 上 ， 该 虚拟 地 
址 对 应 的 页 目录 项 是 第 768 个 。 这 个 算 起 来 容易 ，0xc0000000 的 高 10 位 是 0x300， 即 十 进 制 的 768。 这 
样 虚拟 地 址 0xc0000000 一 0xc03fffff 之 间 的 内 存 都 指向 的 是 低 端 4MB 之 内 的 物理 地 址 , 这 自然 包括 操作 系 
统 所 占 的 低 端 1MB 物理 内 存 。 从 而 实现 了 操作 系统 高 3GB 以 上 的 虚拟 地 址 对 应 到 了 低 端 IMB， 也 就 是 
[前 所 说 我 们 内 核 所 占 的 就 是 低 端 1MB。 
第 204 一 205 行 的 目的 是 在 页 目录 的 最 后 一 个 页 目录 项 中 写 入 页 表 自 己 的 物理 地 址 。eax 原来 的 值 是 
0x101007， 这 是 第 一 个 页 表 的 页 目录 项 。 将 eax 减 去 0x1000 后 ，eax 的 值 为 0x100007。 也 许 您 在 想 ， 为 
什么 使 用 属性 PG_US_U， 而 不 是 PG_US_S? 原因 是 这 样 的 ，PG_US_U 和 PG_US_S 是 PDE 或 PTE 的 属 
性 , 它 用 来 限制 某 些 特权 级 的 任务 对 此 内 存 空 间 的 访问 (无 论 该 内 存 空间 中 存放 的 是 指令 , 还 是 普通 数据 )。 
PG_US_U 表示 PDE 或 PTE 的 US 位 为 1， 这 说 明 处 理 器 允许 任意 4 个 特权 级 的 任务 都 可 以 访问 此 PDE 
或 PDE 指向 的 内 存 。 PG_US_S 表示 PDE 或 PTE 的 US 位 为 0, 这 说 明 处 理 器 允许 除 特 权 级 3 外 的 其 他 特 
权 级 任务 访问 此 PDE 或 PDE 指向 的 内 存 。 此 时 若 使 用 属性 PG_US_S 也 没 问 题 , 不 过 将 来 我 们 会 实现 init 
进程 ， 它 是 用 户 级 程序 ， 而 它 位 于 内 核 地 址 空间 ， 也 就 是 说 将 来 我 们 会 在 特权 级 3 的 情况 下 执行 init， 这 
会 访问 到 内 核 空间 ， 这 就 是 此 处 用 属性 PG_US_U 的 目的 ， 好 啦 ， 这 就 解释 到 这 ， 我 们 继续 。eax 本 身 是 
页 目录 项 ， 现 在 将 其 加 入 到 页 目录 表 中 最 后 一 个 页 目录 项 中 ， 目 的 是 为 了 将 来 能 够 动态 操作 页 表 。 在 这 里 
大 伙 儿 先 有 这 么 个 概念 ， 在 讲述 完 代码 后 咱们 再 细 说 。 

第 207~215 行 是 创建 页 表 ， 我 们 前 面 所 说 的 “设计 好 的 ” 就 是 指 这 个 页 表 。 此 页 表 是 页 目录 中 的 第 0 
个 页 目录 项 对 应 的 页 表 ， 它 用 来 分 配 物理 地 址 范围 0~0x3fffff 之 间 的 物理 页 ， 这 也 就 是 虚拟 地 址 0x0 一 0x3fffff 
和 虚拟 地 址 0xc0000000~0xcO3fffff 对 应 的 物理 页 。 一 个 页 表 表 示 的 内 存 容量 是 4MB， 但 我 们 目前 只 用 到 了 第 
1 个 IMB 空间 ， 所 以 我 们 只 为 这 1MB 空间 对 应 的 页 表 项 分 配 物理 页 。 每 个 物理 页 是 4KB ， 所 以 只 需要 
1MB/4KB=256 个 页 表 项 即 可 。 同 样 是 用 loop 指令 循环 为 页 表 项 赋值 , 所 以 ecx 作为 循环 计数 器 被 赋值 为 256。 

大 家 可 以 看 出 ， 第 213 行 的 “add edx，4096” edx 是 物理 页 的 页 表 项 ， 每 次 edx 加 上 4KB， 其 物理 
地 址 是 连续 分 配 的 ， 即 在 低 端 1MB 内 存 中 ， 虚 拟 地 址 等 于 物理 地 址 。 

第 217 一 228 行 创建 除 第 768 个 页 表 之 外 的 其 他 页 表 对 应 的 PDE， 也 就 是 内 核 空 间 中 除 第 0 个 页 表 儿 
的 其 余 所 有 页 表 对 应 的 目录 项 。 虽 然 前 面 已 经 创建 了 第 768 个 页 表 的 PDE 了 , 但 它 只 是 一 个 页 表 的 空间 。 
尽管 我 们 的 内 核 甚 至 连 4MB 的 内 存 空间 都 绰绰有余 ， 也 就 是 说 1 个 页 表 足 矣 应 付 了 ， 只 需要 在 页 目录 表 
中 安装 一 个 PDE 就 够 了 , 但 为 了 真正 实现 内 核 被 所 有 进程 共享 , 还 是 在 页 目录 表 中 为 内 核 额 外 安装 了 254 
个 页 表 的 PDE〈 第 255 个 PDE 已 经 指向 了 页 目录 表 本 身 )， 也 就 是 内 核 空 间 的 实际 大 小 是 1GB 减 去 4MB 
的 差 ， 当 然 了 ， 必 须要 为 页 表 中 具体 的 PTE 分 配 物理 页 框 后 才 算 真正 的 内 存 空 间 ， 此 处 还 不 算 ， 此 处 在 
页 目录 表 中 把 内 核 空间 的 目录 项 写 满 ， 目 的 是 为 将 来 的 用 户 进程 做 准备 ， 使 所 有 用 户 进程 共享 内 核 空 间 。 
这 方面 内 容 有 些 超 前 了 , 但 还 是 给 大 伙 儿 提前 解释 下 , 我 们 将 来 要 完成 的 任务 是 让 每 个 用 户 进程 都 有 独立 
的 页 表 ， 也 就 是 独立 的 虚拟 4GB 空间 。 其 中 低 3GB 属于 用 户 进程 自己 的 空间 ， 高 1GB 是 内 核 空间 ， 内 
核 将 被 所 有 用 户 进程 共享 。 为 了 实现 所 有 用 户 进程 共享 内 核 ， 各 用 户 进程 的 高 1GB 必须 “都 ”指向 内 核 
所 在 的 物理 内 存 空 间 ， 也 就 是 说 每 个 进程 页 目录 表 中 第 768 一 1022 个 页 目录 项 都 是 与 其 他 进程 相同 的 〈 各 
进程 页 目录 表 中 第 1023 个 目录 项 指向 页 目录 表 自 身 )， 因 此 在 为 用 户 进程 创建 页 表 时 ， 我 们 应 该 把 内 核 页 
表 中 第 768 一 1022 个 页 目录 项 复制 到 用 户 进程 页 目录 表 中 的 相同 位 置 。 一 个 页 目录 项 对 应 一 个 页 表 地 址 ， 
页 表 地 址 固定 了 ， 后 来 新 增 的 页 表 项 也 只 会 加 在 这 些 固定 的 页 表 中 。 如 果 不 这 样 的话 ， 进 程 陷 入 内 核 时 ， 
假设 内 核 为 了 某 些 需求 为 内 核 空 间 新 增 页 表 (通常 是 申请 大 量 内 存 )， 因 此 还 需要 把 新 内 核 页 表 同 步 到 其 
他 进程 的 页 表 中 ， 和 否则 内 核 无 法 被 “完全 ”共享 ， 只 能 是 “部 分 ”共享 。 所 以 ， 实 现 内 核 完 全 共享 最 简单 
的 办 法 是 提前 把 内 核 的 所 有 页 目录 项 定 下 来 , 也 就 是 提前 把 内 核 的 页 表 固 定 下 来 , 这 是 实现 内 核 共享 的 关 
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键 。 这样 一 来 ， 内 核 所 在 的 空间 完全 被 所 有 进程 共享 所 有 进程 都 可 以 使 用 内 核 提 供 的 服务 ， 内 核 若 为 任 
意 一 个 用 户 进程 在 内 核 空间 中 创建 了 某 些 资 源 的 话 ， 其 他 进程 都 可 以 访问 到 该 资源 。 由 于 我 们 尚未 接触 到 
用 户 进程 方面 的 内 容 , 怕 您 越 看 越 晕 乎 , 让 我 们 具体 一 点 说 , 如 果 此 处 仅仅 是 安装 第 768 个 页 目录 项 的 话 ， 
第 769 一 1022 个 目录 项 是 空 的 ,将 来 即使 把 第 768 一 1022 个 目录 项 复制 给 用 户 进程 时 ， 内 核 空 间 也 仅 是 其 
低 4MB 被 所 有 进程 共享 ， 万 一 在 某 些 情况 下 内 核 使 用 的 空间 超过 4MB， 要 用 到 第 769 个 页 目录 项 对 应 的 
页 表 ， 由 于 此 处 未 提前 准备 该 目录 项 ， 创 建 的 新 页 表 ( 的 PDE〉 只 会 安装 在 当时 那个 进程 的 页 目录 表 中 ， 
而 切换 了 其 他 进程 后 ,新 进程 的 页 目录 表 中 并 不 包含 新 页 表 的 PDE， 因 此 无 法 访问 到 最 新 的 内 核 空间 。 如 
果 您 觉得 晕 乎 也 没关系 , 毕竟 这 涉及 了 一 些 超前 的 内 容 , 以 后 到 实现 用 户 进程 的 时 候 您 就 会 了 解 啦 , 好 啦 ， 
原理 介绍 过 了 ， 代 码 部 分 还 是 很 简单 的 ， 同 创建 pte 的 思路 类 似 ， 不 多 说 了 。 

第 229 行 是 通过 ret 指令 返回 ， 自 此 函数 setup_page 结束 。 

说 完了 setup_page 函数 后 ,我 们 可 以 正式 演奏 启用 分 页 的 三 步 曲 啦 。 跟 建 页 表 相 比 ， 这 个 过 程 比较 容 
易 ， 我 们 马上 就 要 进入 分 页 模式 啦 。 请 看 代码 5-4。 

































































































































































































































































































































































































































































代码 5-4 (project/c5/b/boot/loader.S ) 
149 ); 创建 页 目录 及 页 表 并 初始 化 页 内 存 位 医 
150 call setup _ page 



















































































151 
152 ;要 将 描述 符 表 地 址 及 偏 移 量 写 入 内 存 gat_ptr， 一 会 儿 用 新 地 址 重新 加 载 
153 sgdt [gdt ptr] ; 存储 到 原来 gqt 所 有 的 位 

154 

















155 ;将 gdt 描述 符 中 视频 段 描述 符 中 的 段 基 址 +0xc0000000 
156 mov ebx, [gqt ptr + 2] 
157 or dword [ebx + 0x18 + 4], Oxc0000000 

;视频 段 是 第 3 个 段 描述 符 ， 每 个 描述 符 是 8 字 节 ， 故 0x18 
158 ; 段 描述 符 的 高 4 字 节 的 最 高 位 是 段 基 址 的 第 31 ~ 24 位 


160 ;将 gqt 的 基 址 加 上 0xc0000000 使 其 成 为 内 核 所 在 的 高 地 址 
161 add dword [gdt ptr + 2], Oxc0000000 
















































































163 add esp, 0xc0000000 ; 将 栈 指针 同样 映射 到 内 核 地 址 




















165 ; 把 页 目录 地 址 赋 给 cr3 
166 mov eax PAGE DIR TABLE POS 
167 mov cr3, eax 




















169 ;打开 cr0 的 pg 位 (第 31 位 ) 
170 mov eax cr0 

171 or eax, 0x80000000 

1712 mov er0; eax 




































































TY3 

174 ;在 开启 分 页 后 ， 用 gqt 新 的 地 址 重新 加 载 

175 lgdt [gdt ptr ; 重新 加 载 

证 

177 mov byte [gs:160], 'V' 

;视频 段 段 基 址 已 经 被 更 新 ， 字符 v 表示 virtual addr 
业 了 有 

179 jmp $ 


代码 5-4 是 启用 分 页 的 全 部 代码 ， 也 就 是 完成 了 分 页 机 制 的 三 步 曲 。 

第 150 行 先 建立 页 目录 表 和 所 需要 的 页 表 ， 这 就 是 刚才 咱们 所 说 的 代码 5-2 中 的 函数 ， 开 启 分 页 的 第 
: 先 准 备 好 页 表 。 
第 132 一 153 行 ， 是 为 了 重启 加 载 GDT 做 准备 。 因 为 我 们 在 页 表 中 会 将 内 核 放 置 到 3GB 以 上 的 地 址 ， 
我 们 也 把 GDT 放 在 内 核 的 地 址 空间 ， 在 此 通过 sgdt 指令 ,将 GDT 的 起 始 地 址 和 偏 移 量 信息 dump 像 倒 
水 一 样 ) 出 来 ， 依 然 存 放 到 gdt_ptr 处 ， 一 会 儿 竺 条件 成 熟 时 ， 我 们 再 从 地 址 gdt_ptr 处 重新 加 载 GDT。 
第 155 一 158 行 是 修改 显存 段 的 段 描述 符 的 段 基 址 ， 因 为 将 来 内 核 运 行 在 3GB 以 上 ， 打 印 功能 将 来 
也 是 在 内 核 中 实现 ， 肯 定 不 能 让 用 户 进 程 直 接 能 控制 显存 。 故 显存 段 的 段 基 址 也 要 改 为 3GB 以 上 才 行 。 
大 家 都 知道 32 位 虚拟 地 址 空间 共 4GB， 若 用 十 六 进 制 表示 ， 最 高 位 (第 31 位 ) 每 变化 4 位 就 表示 1GB 
空间 ， 也 没什么 高 深 的 ， 其 实 就 是 16 位 /4GB=4 位 /1GB， 意 为 每 1GB 内 存 空间 需要 4 位 来 表示 。 所 以 ， 
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0x00000000 一 Ox3fffffff 是 第 1 个 1GB 内 存 ,0x40000000 一 0Ox7fffffff 
3 个 1GB 内 存 ,0xc0000000 一 0Oxffffffff 是 第 4 个 1GB 内 存 。 内 核 是 3GB 以 上 ,范围 就 是 第 4 个 1GB， 


| 


S] 
息 中 





故 虚 拟 地 址 0xc0000000 一 0Oxffffffff 才 是 内 核 地 贱 
的 值 包括 两 部 分 ， 前 部 分 是 2 字 节 大 小 的 偏 移 量 ， 
即 “mov ebx, [gdt_ptr + 2]”。 之 后 ebx 是 GDT 的 地 址 。 由 


gdt_ptr 处 


得 到 GDT 地 址 ， 所 以 在 156 行 gdt ptr 加 了 2， 
是 GDT 中 第 3 个 描述 符 ， 
的 基地 址 


于 显存 段 描述 符 
段 描述 符 。 




















这 里 要 将 段 描述 符 
大 伙 儿 观察 这 个 数 ， 只 有 最 高 位 是 c， 其 他 位 都 为 0， 段 描述 符 中 记录 段 基 址 最 高 位 

















的 高 4 字 节 的 最 高 1 字 节 ， 所 以 ebx 不 仅 要 加 上 0x18， 还 要 加 上 0x4。 为 了 省 事 ， 
的 指令 “or dword [ebx + 0x18 + 4], 0xc0000000”。 
在 修改 完了 显存 段 描述 符 后 ， 现 在 可 以 修改 GDT 基 址 啦 ， 我 们 把 GDT 也 移 到 内 核 空 间 中 。 所 以 第 
接 将 gdt_ptr+2 处 的 GDT 基 址 加 了 0xc0000000。 其 实 这 不 是 必须 的 ， 如 果 分 页 后 不 重复 加 载 


做 或 运算 。 最 后 曾 














161 行 ， 











it 是 第 157 行 

















5.2 ”启用 内 存 分 页 机 制 ， 畅 游 虚拟 空间 
是 第 2 个 1GB .0x80000000 一 0xbfffffff 











目 。 











其 后 是 4 字 节 大 小 GDT 基 址 。 这 里 先 要 
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GDT 的 话 ， 也 可 以 不 修改 GDT 基 址 。 





大 伙 】 


外 














图 





5-23 所 示 。 


165 一 172 行 是 启 月 
启用 cr0 寄存 器 的 pg 位 。 
在 一 切 妥 妥 的 之 后 ， 
为 了 检查 在 分 页 机 制 下 我 们 的 程序 是 否 
“mov byte [gs:160], 'V'” 中 下 
好 啦 ， 代 码 是 说 完了 ， 必 














OF 




















区 改 为 3GB 以 上 ， 所 以 在 原 有 地 址 的 基础 上 要 加 


i 述 符 大 小 是 8 字 节 ， 所 以 ebx 要 加 上 0x18 才能 访问 显存 
上 0xc0000000。 

的 部 分 是 在 段 描述 符 
门 直接 将 整个 4 字 贡 
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L 千 万 不 要 忘记 把 栈 地 址 也 修改 成 内 核 使 用 的 地 址 ， 所 以 163 行 直 接 把 esp 加 了 0xc0000000。 








































































































的 160 是 指 第 二 行 开始 的 位 置 ， 








在 分 页 后 ，GDT 的 基 址 会 变 成 3GB 之 | 











5-23 : 
段 基 址 ， 




















上 面 的 

















己 经 是 0xc00b8000， 不 








么 区 | 


3=22 

















匡 框 是 新 的 GDT 的 段 基 址 ， 














<bochs:3> info gdt 


日 分 页 机 制 的 第 二 步 及 第 三 步 ， 将 页 目录 表 物 理 地 址 赋值 给 cr3 寄存 器 后 ， 随 后 
在 第 174 行 把 GDT 重新 加 载 啦 。 
作 正 常 ， 在 第 177 行 直接 在 新 的 显存 地 址 中 写 入 字符 V， 
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2 字 节 , 每 行 是 80 个 字符 , 你 懂 的 。 








个 字符 是 


子 付 征 























须要 运行 一 下 看 看 啦 。 运 行 效果 如 图 5-22 所 示 。 


ge.n 
USER Copy Pogte 


| 





分 页 模式 下 的 运行 效果 
上 的 虚拟 地 址 ， 显 存 段 基 址 也 变 成 了 3GB 这 上 的 虚拟 地 址 ， 如 




















外 的 框框 是 显存 段 描述 符 的 





已 经 变 成 了 0xc0000900, 下 


























是 0xb8000 了 。 


Global Descriptor Table |(base=QxcO000900, Limit=31) : 


GDT[Ox00]=??? descriptor hi=0Qx00000000, lo=0x00000000 
GDT[OQx01]=Code segment, base=Qx00000000, limit=Oxffffffff, Execute-Only, Non-Co 


forming，Accessed ， 


32-bit 


[Op | 
GDT[OQx03]=Data segment, |base=QxcO0b8000| Limit=0x00008fff，Read/Write，Accessed 


You can List individuaL entries with "info gdt [NUM]” or groups with 


NUM] [NUM] 
<bochs :4> 








"info gdt 
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页 后 6DT 的 变化 


203 


5.2.6 用 虚拟 地 址 访问 页 表 


我 们 已 经 进入 了 分 页 机 制 运行 模式 ， 数 据 在 内 存 中 以 物理 地 址 来 寻 址 ， 最 终 是 在 物理 地 址 上 进行 IO 
操作 ， 这 意味 着 ， 以 后 我 们 访问 任何 物理 地 址 都 需要 通过 虚拟 地 址 进行 啦 。 
页 表 是 一 种 动态 的 数据 结构 ， 有 时 候 需 要 给 页 表 “ 增 肥 ” 比如 申请 一 块 内 存 时 ， 需 要 往 里 面 添加 页 
表 项 或 者 页 目录 项 。 有 了 时候 也 需要 为 页 表 “ 减 肥 ” 比如 在 释放 一 块 内 存 时 ， 页 表 中 相应 的 页 表 项 或 页 目 
录 项 都 要 清 零 。 这 正 是 二 级 页 表 灵 活 的 地 方 ， 根 据 需 要 动态 增 减 。 
可 是 ， 页 表 也 位 于 内 存 中 ， 修 改 页 表 的 操作 也 需要 通过 内 存 地 址 才 行 。 而 且 我 们 说 过 啦 ， 页 表 是 将 虚 
拟 地 址 转换 成 物理 地 址 的 映射 表 ， 在 分 页 机 制 下 ， 如 何 用 虚拟 地 址 访问 到 页 表 自 身 呢 ? 
其 实 有 两 种 方式 ， 一 种 方式 是 最 简单 的 ， 让 虚拟 地 址 直接 与 物理 地 址 一 一 对 应 。 就 像 咱们 低 端 1MB 
的 虚拟 内 存 空间 一 样 ， 其 与 物理 内 存 1MB 是 一 一 对 应 的 , 在 0 一 1MB 之 间 , 访问 其 中 任何 一 个 虚拟 地 址 ， 
最 终 都 转换 成 与 其 等 值 的 物理 地 址 。 我 们 可 以 让 虚拟 地 址 的 0~4GB 与 物理 地 址 的 0~4GB 一 一 对 应 起 来 ， 
这 样 ， 访 问 哪 块 物理 地 址 ， 直 接 访 问 其 虚拟 地 址 就 好 了 。 这 么 做 的 优点 是 简单 直接 ， 但 缺点 是 并 不 能 很 好 
地 体现 虚拟 地 址 的 优势 : 虚拟 地 址 可 以 与 任何 一 个 物理 地 址 对 应 ， 这 种 乱 序 的 映射 关系 才 是 虚拟 地 址 的 魅 
力 所 在 。 我 们 既然 是 来 学 习 操 作 系 统 原 理 的 ， 那 我 们 就 不 偷懒 了 ， 一 切 以 学 习 为 目的 ， 所 以 我 们 采用 另 一 
种 方式 ， 让 虚拟 地 址 与 物理 地 址 乱 序 映射 。 
其 实在 前 面 讲述 分 页 机 制 时 ， 我 们 就 已 经 为 这 种 方式 埋 下 了 伏笔 ， 还 记得 我 们 在 最 后 一 个 页 目录 项 中 
填 入 了 页 目录 表 的 物理 地 址 吗 ? 就 是 代码 5-2 第 205 行 的 “mov [PAGE DIR_TABLE POS + 4092]，eax”， 
这 名 代码 就 是 用 虚拟 地 址 访问 页 表 的 关键 步骤 。 虽 然 我 们 为 此 占用 了 一 个 页 目录 项 ， 也 就 是 少 了 4KB 的 
内 存 空 间 ， 但 我 们 占用 的 是 最 顶端 的 4KB， 很 少 有 程序 能 将 4GB 虚拟 内 存 空 间 全 部 占 满 ， 我 们 姑且 先 抱 
着 侥幸 的 心理 进行 ， 一 般 情 况 不 会 出 现 问题 。 

先 得 做 到 通过 虚拟 地 址 访问 页 表 , 才能 使 通过 虚拟 地 址 修改 页 表 成 为 可 能 。 下 面 咱们 先 从 虚拟 地 址 入 
手 ， 找 到 能 访问 页 表 的 “虚拟 入 口 >。 由 于 大 家 刚刚 接触 到 分 页 ， 所 以 咱们 循序 渐进 ， 先 从 “正常 ”的 虚 
拟 地 址 开始 。 

开启 分 页 之 后 ,除了 可 以 在 物理 内 存 0x100000 处 后 看 到 页 目录 表 外 ,我 们 还 可 以 在 虚拟 机 中 利用 info tab 
命令 看 到 页 表 中 虚拟 地 址 到 物理 地 址 的 映射 关系 。info 是 用 来 查看 各 种 数据 的 命令 ，tab 表示 页 表 。 图 5-24 
所 示 是 咱们 目前 的 虚拟 地 址 映射 情 


<bochs:4> info tab 
cr3: Ox000000100000 
Ox00000000-0x000fffff -> Ox000000000000-0Qx0000000fffff 
OxcO000000 -OQxcOOfffff -> Ox000000000000-0Qx96000000fffff 
9xffc90000-0xffcogfff -> Ox000000101000-Qx000000101fff 
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Lo 





9xfff00000-9xfffoogfff -> Ox000000101000-Qx000000101fff 
Oxfffff000-OQxffffffff -> Ox000000100000-Qx000000100fff 








4 图 5-24 ”虚拟 地 址 与 物理 地 址 映射 


图 5-24 中 ， 在 键入 info tab 命令 后 ，cr3 寄存 器 显示 的 是 页 目录 表 的 物理 地 址 。 按 -> 分 成 左右 两 列 ， 
左边 列 出 的 是 32 位 虚拟 地 址 范围 ,右边 是 虚拟 地 址 对 应 的 物理 地 址 ,不 过 其 用 48 位 来 表示 ， 这 个 我 也 不 
知道 是 为 什么 ， 可 能 传说 中 的 64 位 扩展 ， 不 过 这 个 不 重要 。 现 在 咱们 分 析 下 各 行 的 映射 结 
看 第 一 行 ， 虚 拟 地 址 0x00000000 一 0x000fffff， 这 是 虚拟 空间 低 端 1M 内 存 ， 其 对 应 的 物理 地 址 是 
0x000000000000 一 0x0000000fffff。 这 是 咱们 的 第 0 个 页 表 起 的 作用 ,可 以 翻 翻 上 面 的 代码 5-2, 就 是 ecx=256 
的 那个 ， 为 256 个 页 表 项 分 配 物理 页 。 
第 二 行 ， 虚 拟 地 址 0xc0000000 一 0xcOOfffff， 这 是 咱们 第 768 个 页 表 起 的 作用 。 由 于 第 0 个 页 目录 项 
和 第 768 个 页 目录 项 指向 的 是 同一 个 页 表 ， 所 以 其 映射 的 物理 地 址 依然 是 0x000000000000 一 
0x0000000fffff。 这 和 咱们 之 前 的 安排 是 一 致 的 。 

以 上 这 两 组 线性 地 址 到 物理 地 址 的 映射 ， 看 上 去 比较 正常 ， 这 毕竟 是 咱们 有 意 安 排 的 。 但 下 面 这 三 行 
映射 就 显得 比较 怪异 了 。 
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0xffc00000 一 0OxffcOOfff -> 0x000000101000~0x000000101fff 
Oxfff00000~0xfffO0fff -> 0x000000101000~0x000000101ffF 
OxfffFF000~OxffFFFFFF -> Ox000000100000~0x000000100ffF 
现在 是 兑现 承诺 的 时 候 了 ,还 记得 之 前 将 咱们 将 页 目录 表 的 地 址 写 入 了 最 后 一 个 页 目录 项 , 就 是 代码 
5-2 第 205 行 的 “mov [PAGE_DIR _ TABLE POS + 4092]，eax”， 由 于 它 的 作用 , 我 们 在 info tab 的 输出 ! 
才 会 看 到 了 这 三 个 怪异 的 虚拟 地 址 。 咱 们 分 析 一 下 ， 这 三 个 奇怪 的 虚拟 地 址 是 怎么 来 的 。 
第 一 个 奇怪 的 虚拟 地 址 映射 : 
Oxffc00000~0xffcO0fff -> 0x000000101000~0x000000101fff 
最 后 一 个 目录 项 是 第 1023 个 目录 项 , 我 们 已 经 知道 ， 虚拟 地 址 的 高 10 位 用 来 访问 页 目录 表 中 的 目录 
项 ， 如 果 高 10 全 为 1 ， 即 1111111111b=0x3ff=1023， 则 访问 的 是 最 后 一 个 目录 项 ,该 目录 项 中 的 高 20 位 是 
页 目录 表 本 身 的 物理 地 址 0x100000。 不 过 ， 由 于 该 地 址 是 经 过 虚拟 地 址 的 高 10 位 索引 到 的 ， 所 以 被 认为 是 
个 页 表 的 地 址 ， 也 就 是 说 ， 页 目录 表 此 时 被 当 作 页 表 来 用 啦 。 线 性 地 址 的 中 间 10 位 用 来 在 页 表 中 定位 一 个 
页 表 项 ， 从 该 页 表 项 中 获取 物理 页 地 址 。 这 时 ， 若 虚拟 地 址 中 间 10 位 为 0000000000b=0x0， 即 检索 到 第 0 
个 页 表 项 ， 此 时 的 页 目录 表 作 为 页 表 ， 故 第 0 个 页 表 项 实际 上 是 页 目录 表 的 第 0 个 页 目录 项 ， 其 中 记录 的 是 
第 一 个 页 表 的 物理 地 址 ， 其 值 是 0x101000， 此 值 被 认为 是 最 终 的 物理 页 地 址 。 如 果 虚 拟 地 址 的 低 12 位 为 
000000000000b=0x000 ， 最 终 的 物理 地 址 是 0x101000+0x000=0x101000 。 故 虚拟 地 址 是 0xffc00000 一 
Oxffc00fff ， 其 被 映射 的 物理 地 址 范围 是 0x00101000~0x00101fff。 第 一 个 奇怪 的 地 址 映射 说 通 了 。 
提取 出 关键 一 点 : 高 10 位 若 为 0x3 任 ， 则 会 访问 到 页 目录 表 中 最 后 一 个 页 目录 项 ， 由 于 页 表 中 也 是 
1024 个 页 表 项 ， 故 中 间 10 位 车 为 0x3 任 ， 则 会 访问 到 页 表 中 最 后 一 个 页 表 项 。 
第 二 个 奇怪 的 虚拟 地 址 映射 : 
Oxfff00000~0xfffO0fff -> 0x000000101000~0x000000101ffF 
虚拟 地 址 0xfffF00000 的 高 10 位 依然 为 0x3ff, 中 间 10 位 是 1100000000b=0x300, 这 是 第 768 个 页 目录 
项 , 该 页 目录 项 指向 的 页 表 与 第 0 个 页 目录 项 指向 的 页 表 相同 。 所 以 虚拟 地 址 0xfff00000 映射 为 物理 地 址 
0x00101000 成 立 ， 这 下 大 家 也 容易 理解 0xfff00fff 映射 为 0x00101fff。 
第 三 个 奇怪 的 虚拟 地 址 映射 ; 
0Oxffffft000~Oxffffffff -> O0x000000100000 一 0x000000100fff 
Oxfffff000 的 高 10 位 是 0x3 企 ， 中 间 10 位 依然 是 0x3ff， 大 家 将 其 换 成 二 进 制 后 就 容易 看 出 来 了 。 如 果 
高 10 位 为 0x3 任 ， 则 会 访问 到 最 后 一 个 页 目录 项 ， 该 页 目录 项 中 是 我 们 的 页 目录 表 的 物理 地 址 。 目 录 项 中 
的 应 该 是 页 表 的 物理 地 址 ， 所 以 此 页 目录 表 被 当 作 页 表 来 用 。 中 间 10 位 也 是 0x3 任 ， 用 它 在 页 表 内 索引 页 
表 项 ， 在 此 是 在 页 目录 表 中 索引 ， 所 以 ， 索 引 到 的 是 最 后 一 个 项 目 ， 页 部 件 认为 该 项 是 页 表 项 , 但 其 实 是 
页 目录 项 ， 该 页 目录 项 中 的 是 页 目录 表 的 物理 地 址 。 虚 拟 地 址 的 低 12 位 是 0x000， 所 以 得 到 的 物理 地 址 
最 终 是 页 目录 表 的 物理 地 址 +0x000= 页 目录 表 的 物理 地 址 。 我 们 的 页 目录 表 物 理 地 址 是 0x00100000。 于 是 
虚拟 地 址 0xfffff000 映射 成 为 物理 地 址 0x00100000 成 立 ， 也 同样 容易 理解 Oxffffffff 映射 为 0x00100fff。 
提炼 再 提炼 ， 如 果 虚 拟 地 址 的 高 20 位 为 0xfffff， 经 过 我 们 的 页 目录 表 上 映射， 将 会 访问 到 页 目录 表 自 
己 的 物理 地 址 。 
基于 这 一 点 , 我 们 在 访问 页 目录 表 中 的 页 目录 项 时 , 可 以 通过 虚拟 地 址 0xfffffxxx 的 方式 , 其 中 的 xxx 
是 页 目录 表 内 的 偏 移 地 址 ， 由 于 它 是 12 位 的 ， 已经 可 以 用 来 表示 4KB 的 范围 了 ， 所 以 并 不 会 被 页 部 件 当 
作 目 录 项 或 页 表 项 的 索引 ， 也 就 是 并 不 会 被 页 部 件 自动 乘 以 4。 故 xxx 是 以 字 节 为 单位 的 偏 移 ， 是 已 经 由 
程序 员 自 己 手工 乘 以 4 后 的 值 。 
总 结 一 下 用 虚拟 地 址 获取 页 表 中 各 数据 类 型 的 方法 。 
。 获取 页 目录 表 物 理 地 址 : 让 虚拟 地 址 的 高 20 位 为 0xfffff， 低 12 位 为 0x000， 即 0xfffff000， 这 也 
是 页 目录 表 中 第 0 个 页 目录 项 自身 的 物理 地 址 。 
e 访问 页 目录 中 的 页 目录 项 ， 即 获取 页 表 物 理 地 址 : 要 使 虚拟 地 址 为 0xfffffxxx， 其 中 xxx 是 页 目录 
项 的 索引 乘 以 4 的 积 。 
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为 页 表 的 索引 ， 





大 














表 项 ， 它 必须 是 已 经 乘 以 4 后 的 值 。 
公式 为 0x3ff<<22+ 中 间 10 位 <<12+ 低 12 位 。 





5.2.7 


快 表 TLB 




















移 量 去 寻 址 目 

















为 是 10 位 的 索引 值 ， 所 以 这 








录 表 物 到 

















局 
该 
框 的 偏 移 量 ， 
每 一 个 虚拟 























中 的 偏 移 量 去 写 


也 址 到 物理 



































器 的 速度 和 内 存 8 


换 速 度 慢 上 加 慢 ， 而 处 理 
虚拟 地 址 到 物理 地 二 

















上 页 表 4 




















Translation Lookaside Buffer 

分 页 机 制 虽 然 很 灵活 ， 但 您 也 看 到 了 ， 为 了 实现 虚拟 
先 要 从 CR3 寄存 器 中 获取 页 目 
1 录 项 pde， 从 pde 中 读 蝇 

















物理 





地 址 , 然后 


简介 






































岂 址 到 物 型 











EE 地址 的 上 映射， 过程 还 是 有 些 麻 烦 
地 址 ， 然 后 用 虚拟 地 址 的 高 10 位 乘 以 4 的 积 
了 用 虚拟 地 址 的 中 间 10 




















访问 页 表 中 的 页 表 项 : 要 使 虚拟 地 址 高 10 位 为 0x3 全 ， 目 的 是 获取 页 目录 表 物 理 地 址 。 中 间 10 位 
不 用 乘 以 4。 低 12 位 为 页 表 内 的 偏 移 地 址 ， 用 来 定位 页 














的 。 
作为 在 页 目录 表 中 的 
位 乘 以 4 的 积 作为 在 

















址 页 表 项 pte， 从 该 pte 
终于 完成 虚拟 地 址 到 物理 地 址 的 映射 。 
EE 地址 的 转换 都 要 重复 以 上 过 程 ,解说 真正 去 做 了 ， 光 描述 这 个 过 程 我 都 觉得 繁 
珊 ， 何况 这 只 是 用 二 级 页 表 做 地 址 映射 的 过 程 ， 要 是 用 三 级 页 表 …… 
的 速度 完全 是 两 个 数量 级 ， 页 表 毕 竞 在 内 存 中 ,转换 过 程 中 频繁 的 内 存 访问 ,使 得 地 址 转 


























直接 得 到 相应 的 页 框 物理 地 址 ， 免 去 中 


岂 不 是 大 大 提高 了 





的 设备 中 ， 攻 




















也 址 转换 速度 。 根 
此 我 们 都 想到 了 缓存 。 处 理 


器 也 不 得 不 停 下 来 等 待 
上 的 转换 ， 最 终 是 想得到 虚拟 地 址 所 对 
间 的 查 表 过 程 






























































内 存 的 响应 。 


“我 都 蔡 处 理 器 喊 累 。 不 只 如 此 ， 处 理 














应 的 物理 

















FP 读 出 页 框 物理 地 址 ， 用 虚拟 地 址 的 低 12 位 作为 该 物理 页 
















































































地 址 ， 如 果 给 出 一 个 虚拟 地 址 后 能 




















， 直 接 用 虚拟 











也 址 

















的 低 12 位 在 该 物理 页 框 中 寻 址 ， 









































据 程序 的 局 部 性 原理 ， 





可 以 将 近来 常 ) 




















j 的 地 址 和 指令 加 载 到 速度 更 快 











存 访问 速度 ， 


Translation Lookaside Buffer， 俗 称快 表 ， 其 结构 如 图 

TLB 中 的 条 目 是 虚拟 地 址 的 高 20 位 到 物理 
it 是 从 虚拟 页 框 到 物 至 
六， 比如 页 表 项 的 RW 属性 。 
器 在 寻 址 之 前 会 
虚拟 地 址 所 映射 


射 结果 , 实际 上 前 
中 还 有 一 些 属 性 





























(匹配 到 相关 条 














址 后 再 更 新 TLB。 











有 了 TLB， 处 理 





) 则 返回 














Ea 





储备 了 











已 专门 用 来 存放 虚拟 地 址 页 框 与 物理 地 址 页 框 


个 高 速 缓 存 ， 可 








5-25 所 示 。 
























































而 且 员 
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表 ， 























绥 存 相当 于 数据 源 的 快照 ， 为 了 保证 缓存 与 数 扩 
缓存 ， 当 内 存 中 的 原 页 表 被 修改 时 ，TLB 中 的 相应 
甚至 推迟 几 分 钟 都 可 以 ， 但 TLB 和 一 般 
问 的 是 TLB，TLB 里 本 




















效 性 ， 否 则 程序 
Xs 














的 有 效 性 ， 它 把 TLB 的 维护 工 
竟 维 护 页 表 的 代码 是 开发 人 员 上 E 
尽管 TLB 对 开发 人 员 不 可 见 ， 














1 于 成 本 等 原因 ， 容 量 一 
































的 物 








地 址 高 20 位 的 映 











页 框 的 映射 。 除 此 之 外 TLB 


以 


的 映射 关系 ， 这 个 调整 缓存 就 是 TLB， 即 











匹配 高 速 的 处 理 器 速率 和 低速 的 内 














虚拟 地 址 的 高 20 位 


物理 地 址 的 高 20 位 


属性 | 《物理 页 框 号 ) 





(虚拟 页 框 号 ) 




















] 虚 拟 地 址 的 高 20 位 作为 索引 来 查找 TLB 中 的 相关 条 目 
页 框 地 址 ， 和 否则 会 查询 内 存 中 的 页 表 ， 获 得 页 框 物理 








役 都 很 小 ，TLB 也 是 ， 
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乍 交 给 操作 








方法 重新 加 载 CR3， 比 如 将 CR3 寄存 器 


也 





方法 是 针对 TLB 中 某 个 条 目的 更 


渚 的 是 程序 运行 所 依赖 的 指令 和 数 提 





b 错 ， 所 以 TLB 必须 实时 更 新 。 可 
到 了 从 内 存 查 询 映射 关系 
































冬 | 冬 | 


， 如 果 命 中 


地 








5-25 TLB 结构 简 
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此 TLB 中 的 数据 只 是 当前 任务 的 部 分 页 
有 P 位 为 1 的 页 表 项 才 有 资格 在 TLB 中 ， 如 果 TLB 被 装 满 了 ， 需 要 将 很 少 使 用 的 条 目 
四 源 同步 变化 ， 这 就 涉及 到 缓存 刷新 的 问题 。 
映射 关系 按理 说 也 要 更 新 。 一 般 的 缓存 可 以 定期 刷新 ， 

的 缓存 可 不 一 样 ， 你 想 ，TLB 是 页 表 的 缓存 ， 处 理 器 寻 址 时 最 先 访 
的 内 存 地 址 ， 任 意 时 刻 都 必须 保证 地 址 的 有 
是 如 果实 时 读 取 内 存 中 的 页 表 去 更 新 TLB 的 话 ， 这 
的 老路 , TLB 反而 成 了 鸡肋 。 为 此 , TLB 并 不 自动 更 新 , 处 理 器 








换 出 。 
TLB 也 是 



























































也 不 负责 TLB 














统 开 发 人 员 ， 上 














的 数 和 
































新 。 处 理 需 
































某 个 虚拟 地 址 对 应 的 条 








， 处 理 吉 是 ) 


日 虚拟 





是 虚拟 地 址 ， 其 指令 格式 为 invlpg m。 注 意 ， 








更 新 虚拟 地 址 0x1234 对 应 

















的 条 ” 























系统 中 会 涉及 到 TLB 的 更 新 操作 ， 这 一 点 应 注意 
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[局 \o 








己 写 的 ， 他 们 肯定 知道 何 时 修改 了 页 表 ， 或 是 修改 了 哪些 条 目 。 
但 依然 有 两 种 方法 可 以 间接 更 新 TLB, 一 个 是 针对 TLB 中 所 有 条 目的 
居 读 出 来 后 再 写 入 CR3， 这 会 使 整个 TLB 失效 。 另 一 个 
提供 了 指令 invlpg (invalidate page)， 它 用 于 在 TLB 中 刷新 
也 址 来 检索 TLB 的 ， 
其 中 m 表示 操作 数 为 虚拟 内 存 地 址 ， 并 不 是 立即 数 ， 比 如 要 
间 令 为 invlpg [0x1234]， 并 不 是 invlpg 0x1234。 将 来 咱们 在 内 存 管理 


因此 很 


日 开发 人 员 手 动 控制 。 这 的 确 是 非常 合理 

















的 ， 毕 























自然 地 ， 指 令 invlpg 的 操作 数 也 





























有 关 TLB 的 介绍 就 到 这 下 节 再 见 。 


区 加 载 内 核 


经 过 了 前 面 漫长 的 旅行 ， 今 天 终于 到 了 有 关内 核 方面 的 内 容 ， 我 想 大 家 的 心情 一 定 是 万 分 激动 的 ， 
竟 这 才 是 真正 的 操作 系统 部 分 。 

前 面 为 了 帮助 大 家 理解 相关 内 容 , 铺垫 了 太 多 的 基础 知识 ， 以 至 于 大 家 对 此 学 习 旅 程 有 望 不 到 边 的 / 
觉 。 我 非常 理解 大 家 ,但 我 也 更 相信 磨 刀 不 误 砍 柴 工 ， 对 底层 知识 的 充分 掌握 才能 更 好 更 快 地 理解 上 层 应 
用 的 变化 万 千 。 

今天 开始 我 们 正式 踏 上 操作 系统 的 学 习 旅程 。 
5.3.1 用 C 语言 写 内 核 
在 这 之 前 ， 我 们 一 直 用 汇编 语言 直接 与 机 器 对 话 ， 如 果 大 家 不 知道 这 个 世界 上 有 高 级 语言 的 话 ， 我 想 
大 家 也 不 会 觉得 写 汇 编 代 码 的 过 程 很 辛苦 ， 哈 哈 ， 幸 福 确 实 是 比较 出 来 的 。 相 对 于 汇编 语言 ， 用 C 语言 
写 内 核 是 非常 爽 的 事 ， 马 上 我 们 就 要 步 入 内 核实 践 中 啦 ， 所 以 现在 和 大 家 聊 聊 C 语言 写 内 核 的 体会 。 

通常 ,我们 写 的 代码 都 是 直接 编译 成 可 执行 文件 ， 那 是 因为 我 们 是 在 写 用 户 程序 ， 操作 系统 为 咱们 提供 了 
很 多 便利 ， 所 以 编译 和 链接 一 气 呵 成 ， 不 需要 咱们 单独 再 指定 什么 ,编译 器 也 和 操作 系统 达成 了 诸多 约定 ， 默 
默 在 后 面 为 咱们 做 了 大 量 的 工作 ， 比 如 程序 编译 出 来 的 虚拟 起 始 地 址 通常 是 0x8048000 左右 。 在 有 操作 系统 为 
咱们 撑腰 时 ， 我 们 确实 不 需要 关注 这 些 与 业务 逻辑 无 关 的 东西 ， 只 要 专注 于 自己 的 工作 就 好 啦 。 可 如 今 ， 我 们 
要 用 C 语言 写 脱离 操作 系统 的 程序 ， 这 回 咱们 就 不 能 再 这 么 省 心 了 ， 必 须要 自己 指定 程序 的 入 口 地 址 。 
另外 ， 我 们 之 前 开发 用 户 程序 ， 有 大 量 的 标准 库 可 以 用 ， 标 准 库 一 般 是 系统 调用 的 封装 ， 所 以 ， 表 面 
上 通过 标准 库 访 问 系统 资源 ， 本 质 上 是 用 系统 调用 来 实现 的 。 当 然 如 果 大 伙 儿 愿意 ， 在 用 户 程序 中 也 可 以 
直接 调用 “系统 调用 ” 在 功能 上 这 是 允许 的 ， 因 为 中 断 描述 符 表 中 系统 调用 对 应 的 中 断 描述 符 ， 它 的 权 
限 是 用 户 程序 可 以 访问 的 ， 否 则 就 无 法 实现 系统 调用 啦 。 就 拿 Linux 来 说 ， 它 的 系统 调用 是 先 往 eax 寄存 
器 中 写 入 系统 调用 号 ， 然 后 通过 0x80 中 断 来 实现 的 。 我 们 可 以 用 汇编 语言 写 一 个 系统 调用 的 代码 ， 用 C 
语言 去 调用 它 或 者 干脆 直接 在 C 语言 中 内 髓 汇编 代码 。 无 论 是 采用 哪 种 形式 ， 汇 编 语言 的 部 分 都 是 诸如 
先 用 mov eax，xx 的 形式 在 eax 寄存 器 中 指定 系统 调用 的 功能 号 ， 然 后 紧 跟着 使 用 中 断 指令 int 0x80 来 引 
人 
调用 。 虽 然 可 以 直接 调用 “系统 调用 ”的 功能 ， 但 不 推荐 这 样 做 ， 毕 竟 标 准 库 中 为 咱们 考虑 了 很 多 优化 策 
略 ， 通 过 标准 库 访问 系统 资源 比 直接 用 系统 调用 效率 更 高 。 也 许 有 同学 不 信 这 个 那 ， 非 要 整 出 个 效率 更 高 
的 库 ， 当 然 这 是 非常 可 能 的 ， 可 是 标准 库 考 虑 的 不 仅 是 效率 ， 还 有 很 多 兼容 规范 在 里 面 ， 所 以 它 可 能 会 为 
了 规范 而 牺牲 效率 。 除 非 为 了 某 些 个 性 化 的 应 用 咱们 才 去 写 自己 的 库 ， 和 否则 还 是 不 要 企图 颠 履 标 准 库 啦 。 
标准 库 可 以 说 是 由 世界 上 成 千 上 万 的 超级 大 脑 完成 的 ， 以 咱们 个 人 之 力 去 和 全 世界 的 极 客 拼 脑 细胞 ,这 是 
不 科学 的 ， 不 如 把 精力 放 在 其 他 方面 ， 好 啦 ， 我 知道 话 又 说 多 啦 ， 大 伙 见 笑 啦 。 

对 于 系统 调用 这 些 平 时 我 们 认为 理所当然 的 功能 ， 如 今 已 经 成 为 了 咱们 的 奢望 。 首 先 咱们 本 身 是 在 写 
操作 系统 ， 而 不 是 用 户 程序 ， 操 作 系统 不 应 该 再 依赖 于 其 他 系统 的 功能 ， 所 以 不 能 在 咱们 的 程序 〈 操 作 系 
统 ) 中 再 调用 宿主 操作 系统 的 系统 调用 功能 。 其 次 ， 同 一 时 刻 只 能 有 一 个 操作 系统 在 运行 ， 咱 们 即使 调用 
了 0x80 中 断 ， 中 断 描述 符 表 里 0x80 对 应 的 中 断 处 理 程序 是 咱们 提供 的 ， 再 也 不 存在 宿主 系统 的 代码 ， 相 
当 于 咱们 在 调用 自己 的 中 断 处 理 程序 ， 而 此 时 我 们 可 能 尚未 准备 好 相应 的 中 断 处 理 程序 。 如 果 系 统 调 用 不 
能 用 ， 就 更 不 能 用 C 标准 库 啦 ， 所 以 只 能 用 C 语言 原生 支持 的 语法 结构 。 不 过 以 后 我 们 会 在 实现 内 核 的 
过 程 中 建立 咱们 自己 的 库 ， 库 中 会 通过 咱们 自己 的 系统 调用 实现 某 些 功能 

以 上 多 说 了 几 句 有 关系 统 调用 的 实现 ， 其 实 我 是 怕 无 法 满足 好 奇 心 强 的 同学 ,很 担心 仅仅 一 句 “ 在 脱 
离 操 作 系 统 下 写 程序 不 能 使 用 系统 调用 ”让 更 多 的 同学 感到 不 解 。 如 果 我 解释 得 还 不 够 ,咱们 以 后 会 在 实 
现 系统 调用 的 时 候 有 所 了 解 。 
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以 下 5 段 文字 是 为 照顾 到 开发 经 验 较 少 的 同学 ， 如 果 您 经 验 较 丰富 ， 可 以 直接 跳 到 下 面 第 六 段 。 
也 许 有 的 同学 喜欢 用 汇编 语言 来 实现 操作 系统 ， 觉 得 用 汇编 来 写 程序 似乎 更 简单 直接 ， 可 控 性 比较 强 ， 有 
种 “一 切 尽 在 掌握 ”的 感觉 。 而 用 C 语言 实现 操作 系统 这 件 事 ， 虽 然 轻 松 很 多 ， 但 似乎 隐约 感觉 到 有 些 慌张 。 
因为 虽然 C 语言 相对 来 说 更 接近 于 人 的 逻辑 思维 ， 但 恰恰 是 这 种 优越 性 ， 给 一 些 好 学 的 同学 带 来 了 困扰 ， 毕 
竟 咱 们 是 在 写 底层 的 软件 ， 必 须要 随心 所 欲 地 控制 CPU， 要 时 时 刻 刻 知道 CPU 在 干什么 。 而 感觉 上 ，C 语言 
不 能 直接 控制 CPU， 比 如 无 法 直接 控制 寄存 器 ， 这 里 面 有 太 多 的 黑 盒子 ， 无 法 掌控 的 东西 似乎 有 很 多 ， 不 知 
道 编译 器 在 后 面 是 怎么 将 我 的 逻辑 思维 转换 成 机 器 指令 的 。 这 种 黑 盒 式 的 操作 确实 让 人 觉得 神秘 又 不 放心 。 

不 同 语言 应 用 在 不 同 的 层级 ， 各 层级 有 不 同 的 思维 方式 ，C 语言 运用 在 更 高 的 层级 上 ， 它 的 一 行 代码 
相当 于 多 行 汇编 语言 代码 ， 因 此 C 语言 的 语法 对 于 汇编 语言 来 说 类 似 于 一 种 需求 。 汇 编 语言 相对 来 说 运 
用 在 较 低 层级 上 ， 它 是 为 完成 宏观 需求 的 具体 步 又， 在 程序 语言 层面 ,汇编 语言 可 以 认为 是 不 能 再 细 分 的 
最 基本 的 原子 。 应 用 不 同 层级 的 语言 ， 我 们 只 要 运用 那个 层级 的 思维 即 可 。C 语言 和 汇编 语言 的 关系 就 像 
产品 经 理 和 开发 人 员 那 样 ， 产 品 经 理 在 设计 一 款 产 品 时 ， 只 需要 提出 需求 ， 这 是 站 在 “高 层 ” 上 的 开发 ， 
而 开发 人 员 要 将 需求 转换 为 具体 的 代码 ， 需 要 在 微观 上 细 化 那些 “高 层 ” 的 需求 ， 对 于 这 款 产品 来 说 ， 无 
论 是 产品 经 理 ， 还 是 开发 人 员 ， 他 们 都 在 自己 的 层级 上 开发 。 一 个 是 以 需求 为 粒度 做 开发 ， 另 一 个 是 以 代 
码 为 粒度 做 开发 ， 一 个 是 在 “高 层 上 ”思考 提 哪 些 需 求 ， 另 一 个 是 在 “底层 上 ”思考 如 何 满足 需求 。 
汇编 指令 与 机 器 指令 几乎 是 一 对 一 的 ， 即 一 名 汇编 代码 只 对 应 一 句 有 具体 的 机 器 码 , 不 会 有 更 多 对 应 的 
选择 ， 所 以 可 以 认为 汇编 指令 就 是 机 器 指令 。C 语言 的 编译 过 程 是 先 将 C 语言 代码 转换 成 汇编 代码 ， 然 后 
再 将 汇编 代码 转换 成 机 器 指令 。 所 以 用 C 语言 写 出 来 的 程序 ， 最 终 可 以 转换 成 对 应 的 一 句 或 多 句 汇 编 指 
令 。 它 们 的 关系 就 好 比 出 租车 上 的 乘客 和 司机 ， 乘 客 只 要 告诉 司机 想 去 哪里 就 行 了 ， 其 他 的 工作 由 司机 和 
车 共同 配合 完成 。 比 如 乘客 说 要 去 北京 大 学 南 门 ， 司 机 根据 当前 的 位 置 计 算 相 对 路 径 ， 比 如 先 开车 直行 1 
公里 ,在 路 口 处 左 转 ， 再 直行 2 公里 后 右 转弯 就 到 达 了 北京 大 学 南 门 。 乘 客 要 去 北京 大 学 南 门 的 这 个 需求 
就 相当 于 C 语言 代码 ， 这 是 上 层 需求 。 司 机 相当 于 编译 器 ， 由 它 将 客户 需求 转换 成 具体 的 实现 步骤 ， 比 
如 转换 成 踩 油 门 直行 、 左 转 方 向 盘 拐 弯 、 再 踩 油门 直行 、 再 右 转 方向 盘 拐 弯 这 四 个 驾驶 操作 ， 当 然 ， 司 机 
只 是 发 号 施 令 ， 并 不 是 司机 在 跑 ， 真 正 把 乘客 带 到 目的 地 的 工作 者 是 出 租车 。 出 租车 相当 于 CPU， 由 它 
最 终 落 实 司机 的 驾驶 操作 ， 将 乘客 带 到 目的 地 ， 司 机 的 这 些 驾驶 操作 相当 于 机 器 指令 。 站 在 乘客 的 角度 ， 
它 只 是 说 了 一 句 话 ， 就 让 汽车 做 了 加 油门 、 转 弯 等 多 个 微 操作 ， 这 就 是 C 和 机 器 指令 之 间 的 关系 。 

不 知道 我 这 样 举例 子 ， 是否 打消 了 您 的 疑虑 ， 总 之 我 们 用 C 语言 写 程序 , 一 定 要 充分 相信 C 编译 器 的 工作 。 

也 许 有 人 曾经 想 过 ， 写 操作 系统 已 经 是 底层 的 事 了 ， 做 底层 的 事 就 应 该 用 更 底层 的 东西 来 实现 ， 必 须 用 
汇编 语言 或 比 汇编 语言 还 要 低层 的 东西 。 这 种 想法 我 非常 理解 ， 我 学 习 之 初 也 曾 有 过 类 似 的 猜想 。 当 然 ， 确 
实 可 以 用 更 原始 的 东西 来 实现 操作 系统 ， 但 那样 也 更 麻烦 ， 需 要 极 大 的 耐心 和 良好 的 体格 ， 哈 哈 。 语 言 只 是 
个 工具 ， 对 机 器 而 言 ， 它 能 接受 的 是 机 器 指令 ， 只 要 最 终 交 给 机 器 的 是 机 器 指令 就 成 了 。 而 C 语言 这 种 高 
级 语言 是 可 以 被 编译 成 机 器 指令 的 ， 就 是 我 们 平时 编译 出 来 的 二 进 制 文件 ， 它 里 面 都 是 二 进 制 的 机 器 指令 ， 
CPU 处 理 起 来 完全 没有 问题 。 选 择 哪 种 语言 ， 只 是 实现 的 途径 不 同 ， 最 终 还 是 汇总 到 机 器 指令 那里 。 就 像 吃 
饭 用 筷子 还 是 用 勺子 一 样 ， 饭 最 终 还 是 被 送 到 了 中 里 。 如 果 您 对 此 还 是 觉得 很 模糊 ， 可 以 想 想 咱 们 平时 炒菜 的 
过 程 ， 一 般 炒 菜 时 都 要 放 桨 油 吧 ， 效 油 本 身 就 是 个 高 级 的 东西 ， 它 也 是 被 其 他 的 一 些 农作物 制作 出 来 的 〈 比 如 
一 般 的 酱油 是 用 大 豆 制 作 的 )， 咱 们 不 也 是 直接 拿 来 就 用 吗 ， 有 哪 位 同学 因 不 清楚 痪 油 的 制作 过 程 而 不 敢 用 酱 
油 啦 ? 炒菜 时 加 酱油 和 用 C 语言 写 操作 系统 是 同一 个 道理 ， 都 是 以 高 级 的 东西 为 基础 来 创建 新 的 东西 。 

如 果 以 上 三 段 内 容 并 没有 解 开 您 的 疑惑 也 不 要 着 急 ， 这 一 切 都 会 在 今后 的 C 语言 编程 中 理解 ， 由 量 
变 到 质变 ， 您 的 问题 自然 就 解决 了 。 

好 啦 ， 前 面 说 的 太 多 啦 ， 怕 大 家 着 急 了 ， 现 在 赶紧 给 大 家 上 硬 菜 ， 欢 迎 我 们 神秘 嘉宾 一 一 main.c。 这 是 
我 们 第 一 个 C 语言 代码 。 
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代码 5-5 (project/c5/c/kernel/main.c ) 


1 int main(void) { 
2 while(1); 


208 


3 return 0; 
4 1 























如 代码 5-5 所 示 ， 它 没 法 再 简单 啦 ， 简 单 的 程序 似乎 能 帮助 咱们 更 容易 地 理解 所 学 的 知识 ， 哈 哈 ， 我 
的 是 似乎 ， 其 实 ， 再 长 的 代码 ， 编 译 后 生成 的 文件 结构 也 是 由 那 几 个 部 分 组 成 ， 万 变 不 离 其 宗 。 这 里 所 
的 文件 结构 是 指 将 来 要 说 的 ef 文件 格式 ， 在 此 不 多 说 ， 留 作 伏笔 。 
正如 之 前 所 说 ， 咱 们 只 有 用 C 语言 的 语法 结构 ， 这 里 没有 包含 标准 库 ， 也 没有 直接 的 系统 调用 ， 以 
后 咱们 都 得 按照 这 种 简洁 的 方式 编程 啦 。 另 外 ， 有 的 同学 已 经 注意 到 main.c 所 在 的 目录 啦 ， 本 来 我 还 想 
卖 个 关子 的 ， 但 它 所 在 的 目录 出 卖 了 我 : 在 kernel 目录 下 。 对 ， 如 您 所 想 ， 它 就 是 我 们 第 一 个 内 核 文件 ， 
我 们 在 project 目录 下 建立 了 个 子 目录 kernel， 今 后 我 们 所 有 与 内 核 相关 的 模块 都 要 放 在 此 目录 下 。 

您 也 看 到 了 ， 这 个 内 核 文件 什么 都 没 做 ， 通 过 while (1) 这 个 死 循环 一 直 使 用 CPU， 目 的 是 停 在 这 
里 。 想 当初 我 就 因为 忘记 加 这 样 的 语句 而 导致 不 知道 CPU 执行 到 哪 去 了 ， 当 时 排查 错误 时 就 曙 了 ， 看 到 
执行 的 指令 都 不 是 自己 写 的， 甚至 都 怀疑 是 虚拟 机 的 问题 ， 想 想 好 敢 愧 啊 。 当 然 查 出 来 原因 之 后 ， 自 然 就 
是 喜 极 而 江 啦 。 这 个 简单 粗暴 可 依赖 的 死 循 环 仅仅 是 为 了 演示 elf 文件 解析 以 及 加 载 内 核 的 作用 。 
生成 C 语言 程序 的 过 程 是 这 样 的 。 先 将 源 程序 编译 成 目标 文件 〈 巾 c 代码 变 成 汇编 代码 后 ， 再 由 汇编 
代码 生成 二 进 制 的 目标 文件 )， 再 将 目标 文件 链接 成 二 进 制 可 执行 文件 。 平 时 我 们 写 只 有 一 个 文件 的 小 程 
序 时 ， 编 译 器 也 是 悄悄 在 背后 这 样 做 的 ， 除 非 加 了 参数 让 编译 器 分 成 两 个 动作 。 由 于 咱们 用 的 是 C 语言 
写 的 程序 ， 想 到 的 编译 器 自然 是 大 名 易 易 的 gcc， 所 以 我 们 用 gcc 编译 该 程序 的 参数 是 : 
gcc -c -o kernel/main.o kernelmain.c， 也 许 对 其 中 的 参数 有 的 同学 不 太 熟 ， 没 关系 ， 在 执行 gcc -help 
回 车 后 ， 大 家 可 以 看 到 一 些 帮 助 信 息 ， 其 中 : 
-c 的 作用 是 编译 、 汇 编 到 目标 代码 ， 不 进行 链接 ， 也 就 是 直接 生成 目标 文件 。 
-0 的 作用 是 将 输出 的 文件 以 指定 文件 名 来 存储 ， 有 同名 文件 存在 时 直接 覆盖 。 
经 过 上 面 gcc 的 编译 后 ， 我 们 得 到 了 main.o 文件 ， 目 前 为 止 ， 它 还 是 个 “半成品 ”。 为 什么 这 么 说 呢 ? 医 
它 只 是 个 目标 文件 ， 也 称 为 待 重 定位 文件 ， 重 定位 指 的 是 文件 里 面 所 用 的 符号 还 没有 安排 地 址 ， 这 些 符号 的 地 
需要 将 来 与 其 他 目标 文件 “组 成 ”一 个 可 执行 文件 时 再 重新 定位 (编排 地 址 )， 这 里 的 符号 就 是 指 该 目标 文件 中 
只 
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所 调用 的 函数 或 使 用 的 变量 ， 而 这 里 的 “组 成 ”就 是 指 链接 。 这 些 符 号 一 般 是 位 于 其 他 文件 中 ， 所 以 在 编译 时 不 
能 确定 其 地 址 ， 需 要 在 所 有 目标 文件 都 到 齐 了 ， 将 它们 链接 到 一 起 时 再 重新 定位 〈 编 排 地 址 )。 由 于 不 知道 可 执 
行文 件 由 几 个 目标 文件 组 成 ， 所 以 一 律 在 链接 阶段 对 符号 重新 定位 编排 地 址 )。 所 以 说 ， 哪 怕 是 可 执行 文件 
是 由 一 个 文件 组 成 的 ， 其 目标 文件 中 的 符号 也 是 未 编 址 的 ， 编 址 工作 ， 即 重 定位 ， 一 律 统一 在 链接 阶段 完成 。 

编译 成 目标 文件 时 , 我 们 可 以 用 fle 命令 检查 一 下 main.o 的 状态 ， 如 file kemel/main.o, 输出 如 图 5-26 所 示 。 
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[work@localhost c]$ file kernel/main.o 





| 
4 图 5-26 目标 文件 的 属性 



































为 了 让 大 家 更 明显 地 看 出 目标 文件 的 可 重 定位 属性 ， 我 将 relocatable 用 方 框 给 大 家 圈 出 来 了 。 

目标 文件 是 可 重 定位 文件 ， 其 中 的 符号 都 尚未 “定位 ”也 就 是 符号 (变量 名 ， 函 数 名 〉 的 地 址 尚未 
确定 ， 这 一 点 我 们 可 以 用 Linux 的 nm 命令 来 查看 ， 如 图 5-27 所 示 。 [ c]$ nm kernel/main.o 

如 图 5-27 所 示 , 由 于 咱们 的 main.c 过 于 简单 , 里 面 只 有 一 个 符号 ，。 he 
即 main， 所 以 nm 只 列 出 了 它 的 符号 信息 。main 函数 的 地 址 由 于 未 被 
指定 ， 所 以 其 值 为 00000000。 一 会 儿 虽 们 链接 后 再 对 比 下 大 家 就 更 清楚 了 。 
在 Linux 下 用 于 链接 的 程序 是 ld, 链接 有 一 个 好 处 , 可 以 指定 最 终生 成 的 可 执行 文件 的 起 始 虚 拟 地 址 。 
它 是 用 -Ttext 参数 来 指定 的 ， 所 以 咱们 可 以 执行 以 下 命令 完成 链接 。 

ld kernel/main.o -Ttext Oxc0001500 -e main -o kernel/kernel.bin 

从 左 到 右 说 一 下 参数 ，-Ttext 指定 起 始 虚拟 地 址 为 0xc0001500， 这 个 地 址 是 设计 好 的 , 为 什么 用 这 个 
地 址 ， 咀 们 将 来 在 加 载 内 核 时 会 告诉 大 家 ， 在 此 大 伙 儿 先 淡定 一 下 。 其 中 -o 的 意义 也 是 指定 输出 的 文件 
名 ， 至 于 -e， 还 是 要 看 一 下 官方 帮助 。 








































































































4 图 5-27 目标 文件 中 符号 地 址 未 确定 
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1d -help 回 车 后 ， 输 出 的 信息 太 多 ， 咱 们 只 看 下 面 的 -e 参数 。 
| -e ADDRESS, -~-entry ADDRESS Set start address 

-e 和 --entry 一 样 ， 字 面 上 的 意思 是 用 来 指定 程序 的 起 始 地 址 。 注意, 不 要 被 迷惑 了 ， 虽 然 说 是 指定 起 
始 地 址 ， 但 参数 不 仅 可 以 是 数字 形式 的 地 址 ， 而 且 可 以 是 符号 名 ， 这 和 汇编 中 的 标号 也 是 地 址 是 一 样 的 道 
理 。 总 之 它 用 来 指定 程序 从 哪里 开始 执行 。 

为 了 让 大 家 更 清楚 -e 的 意思 ， 咱 们 不 加 -e 参数 试 试 ， 如 图 5-28 所 示 。 

















[work@localhost c]$ ld kernel/main.o -Ttext 0xc0001500 -0o kernel/kerne 


1.bin 


1d: warning: cannot find entry symbol _start; defaulting to 00000000c0001500 




















A 图 5-28 1d 链接 演示 
经 过 这 样 的 链接 操作 ，1d 报错 发 出 了 和 警告， 提示 找 不 到 入 








00000000c0001500。 这 个 _start 是 什么 呢 ? 
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口 符号 (entry Symbol) _start， 默 认 地 址 为 
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2 
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牛 loader.S， 它 最 














个 程序 总 该 有 个 入 口 地 址 ， 这 个 地 址 表示 的 是 程序 将 从 哪里 开始 执行 。 要 知道 ， 并 不 是 程序 体 中 的 
字 节 就 是 程序 的 起 始 地 址 ， 因 为 在 程序 的 开头 可 能 有 函数 声明 或 数据 定义 ， 想 想 咀 们 的 汇编 文 
前 面 的 部 分 可 不 是 指令 ， 而 是 一 堆 数 据 ， 而 我 们 在 设计 它 的 时 候 ， 知 道 它 的 入 口 地 址 不 在 程序 开始 处 ， 所 以 在 


















































mbr 中 直接 跳 入 了 loader.S 的 loader_start 标号 处 ， 跨 过 了 程序 开头 的 数据 部 分 。 














loaderbin， 并 且 是 我 们 提前 知道 入 口 地 址 上 





























序 的 入 口 在 哪里 呢 ? 也 就 编译 后 的 程序 应 
内 的 地 址 是 在 链接 阶段 编排 〈 也 
默认 只 把 名 为 start 的 函数 作为 程序 的 入 
大 家 看 到 了 ， 代 码 5-5 中 并 没有 _start 这 个 符号 


才 过 修 付 三 ， 
既然 缺少 _start 符号 ， 那 现在 把 主 函数 main 改 成 _start 试 试 ， 代 码 如 下 。 
1 //int main (void) 


A 
2 int start (void) { 
过 while(1); 





该 从 哪 句 代码 开始 执行 呢 ? 这 入 


















































地 址 ， 即 默认 





的 entry symbol 是 _start， 


















































4 return 0; 
5 3} 
好 啦 ， 编 译 链接 一 气 呵 成 ， 整 个 过 程 没 出 任何 问题 ， 如 图 5-29 所 示 。 





[work@localhost c]$ gcc -c -0 kernel/main.o kernel/main.c 
[work@localhost c]$ ld kernel/main.o -Ttext 0xc0001500 -o kernel/kernel .bin 


[work@localhost c]$ file kernel/kernel .bin 


kernel/kernel .bin: ELF 32-bit LSB executable, Intel 80386, version 1 (SYSV), statically lin 


就 是 重 定位 ) 的 ， 所 以 在 链接 阶段 必须 要 明确 入 口 地 址 才 行 ， 于 是 链接 器 规定 ， 


F 时 ， 计 算 机 如 何 知 道 程 


这 还 仅仅 是 由 一 个 loaderS 生成 
9 情况， 如 果 当 多 个 文件 拼合 成 一 个 可 执行 文件 
代码 可 说 不 准 是 哪 一 个 了 。 由 于 程序 


口 














除非 另行 指定 。 


链接 器 ld 找 不 到 该 起 始 地 址 ， 所 以 发 


ked, not stripped 





[work@localhost c]$ 目 
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5-29 把 main 函数 名 改 为 start 
图 5-29 中 ， 我 们 还 用 fle 命令 查看 了 最 终生 成 的 kernel.bin 文件 
肖 悄 提示 一 下 ， 该 文件 放 到 虚拟 机 上 运行 也 是 没 问题 的 。 
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jj 学 想 过 ， 这 里 写 一 个 start 函数 ， 让 其 调用 main 函数 妇 
数 ， 它 实 
虽然 把 函数 名 改 成 _start 可 以 解决 问题 ， 但 我 们 习 1 main 
骨 了 -e 来 指定 起 始 的 函数 名 为 main， 所 以 代码 5-5 才 链 接 正 常 。 
也 许 有 同学 想 过 ， 哎 ? 我 平时 写 的 程序 也 没有 _start 啊 ， 直 接 用 gcc 编译 
阿 ， 确 实 如 您 所 说 ， 由 于 我 也 没 深入 研究 过 ， 但 咱们 通过 比较 上 
还 是 以 代码 5-5 为 例 , 用 
再 是 目标 文件 ， 而 是 可 执行 文 伯 
F 的 区 别 ， 如 图 5-30 所 示 。 
您 看 ，test.bin 是 gcc 直接 生成 的 可 执行 文件 ， 
链接 这 两 个 步 又 完成 的 ， 其 文 从 
个 文件 中 的 息 ， 还 是 用 nm 命令 ， 
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5-31 所 示 。 





际 上 也 是 被 别人 调用 的 ， 不 过 这 是 编译 器 背后 的 策略 啦 ， 好 奇 心 大 的 同学 
函数 作为 主 函 数 ， 不 习惯 








#i 
后 汉 


看 ， 它 已 经 是 executable 啦 ， 


上 何 ? 其 实 这 是 可 以 的 ，main 函数 并 不 是 











已 尝试 下 吧 。 
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后 就 能 运行 ， 

















函数 用 _start， 


没 出 过 问题 啊 。 

















的 方式 ， 让 您 自己 悟 出 这 中 


有 面 的 秘密 。 





gcc -0 /tmp/test.bin kernel/main.c 编译 链接 ， 由 于 未 加 -c 参数 ， 


它 的 大 小 是 4586 字 节 。 而 kernel.bin 是 经 过 手动 编 
F 大 小 是 1777 字 节 。 这 两 个 文件 的 体积 可 是 差 了 几乎 2 倍 呢 。 再 看 看 这 








E 成 的 test.bin 


有 译 成 目标 文件 再 链接 成 可 执行 文件 的 方式 ， 对 比 这 两 个 
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上 六、 














[work@localhost c]$ nm /tmp/test.bin |wc -1l 
34 


[workelocalhost c]$ 目 
[work@localhost c]$ nm /tmp/test.bin 


080482e0 T[_start] 


080495fc b completed.5972 
080495f8 W data_start 
08049600 b dtor_idx.5974 


[work@lLocalhost c]$ gcc -0 /tmp/test.bin kernel/main.c 
[work@localhost sl 11 /tmp/test.bin [| 
i EE 12 18:59 [work@localhost c]$ nm kernel/kernel .bin 
[work@localhost c]$ gcc -c -0 kernel/main.o kernel/main.c c0882505 A 一 bss-start 
[work@localhost c]$ ld kernel/main.o -Ttext 0xc0001500 -e main -0o kernel/kernel .bin 
[work@localhost c]$ 11 kernel/kernel .bin 
-rwxrwxr-x。1 work work[1777]10 月 12 19:00 

$ 





[workelocathost c]$ 
A 图 5-30 动 生成 与 手动 链接 的 程序 对 比 A 图 5-31 动 编译 链接 与 手动 链接 对 比 
test.bin 中 共有 34 个 符号 (wc -| 命令 用 来 统计 输出 的 行 数 ， 一 个 符号 占用 一 行 ， 故 34 个 符号 )， 由 于 
输出 太 长 了 ， 我 们 只 截取 了 关键 的 部 分 ， 不 过 您 看 那些 frame_dummy、data_start 等 ， 这 并 不 是 咱们 代码 
中 存在 的 符号 ， 这 说 明 编译 器 在 编译 过 程 中 为 咱们 引用 了 别 的 代码 ， 这 就 是 c 运行 库 的 功劳 ， 目 的 是 在 调 
用 main 函数 前 做 初始 化 环境 等 工作 。 您 看 ， 用 白色 方 框 圈 出 来 的 _start， 这 就 是 默认 的 入 口 符 号 ， 链 接 器 
还 是 用 到 了 它 ， 它 不 是 咱们 提供 的 代码 ， 依 然 是 运行 库 提供 的 ， 这 也 说 明 main 函数 不 是 第 一 个 执行 的 代 
码 ， 它 一 定 是 被 其 他 代码 调用 的 ，main 函数 在 运行 库 代 码 初始 化 完 环境 后 才 被 调用 。 
咱们 继续 看 kernel.bin 中 的 符号 ， 一 共 就 4 行 ， 尽 管 其 中 也 包含 了 咱们 不 认识 的 符号 ， 但 毕竟 少 得 多 ， 
我 们 的 程序 更 短小 精干 ， 而 且 确实 没有 _start 函数 。 这 里 添加 了 3 个 类 型 为 A 的 符号 ， 这 表示 它们 的 值 是 
不 变 的 。T 表示 该 符号 位 于 代码 段 中 ， 更 多 符号 的 意义 请 参考 man nm。 
其 实 代 码 5-5 要 是 换 成 汇编 代码 的 话 ， 就 是 个 jmp $， 其 大 小 不 过 是 2 字 节 的 机 器 人 码 ebfe。 除 了 编译 器 自动 
添加 的 代码 外 ， 一 般 情况 下 C 语言 编译 出 来 的 程序 也 比 汇编 语言 生成 的 程序 体积 大 。 可 见 ， 人 们 常 说 的 汇编 语 
言 比 C 语言 快 ， 并 不 是 汇编 语言 本 身 有 多 快 〈 它 也 要 变 成 机 器 指令 后 才能 上 CPU 运行 )， 而 是 汇编 语言 对 应 的 
机 器 指令 是 一 对 一 的 ， 简 单 ， 直 接 ， 可 依赖 ， 而 C 语言 生成 的 机 器 指令 是 一 对 多 的 ， 复 杂 ， 间 接 ， 略 元 余 。 
好 啦 ， 关 于 内 核 的 部 分 咱们 就 此 先 打 住 ， 其 实说 这 话 我 有 点 不 好 意思 ， 您 也 看 到 啦 ， 内 核 代 码 中 就 一 
个 死 循环 而 已 ， 我们 的 内 核 还 没有 开始 ， 请 无 视 我 吧 。 咱 们 的 内 核 虽 然 离 真正 的 内 核 差 得 十 万 八 干 里 , 但 
它 目 的 是 两 个 : 一 是 为 了 演示 加 载 内核 ， 二 是 为 了 演示 elf 格式 的 文件 解析 。 后 面 我 们 将 结合 此 简单 至 极 
的 c 程序 来 学 习 有 关 elf 方面 的 知识 。 






























































































































































































































































































































































































































































































































































































































































5.3.2 二进制 程序 的 运行 方法 

操作 系统 并 不 是 在 功能 上 给 予 用 户 的 支持 ， 这 种 支持 体现 在 机 制 上 。 也 就 是 说 ,单纯 的 操作 系统 ， 用 
户 拿 它 什么 都 做 不 了 ， 用 户 需 要 的 是 某 种 功能 。 而 操作 系统 仅仅 是 个 提供 支持 的 平台 。 

虽然 我 们 是 模仿 Linux 来 写 一 个 黑屏 白字 的 系统 ， 但 如 果 没 有 Windows 的 话 ， 估 计 当 今 这 个 世界 将 
会 失去 70% 以 上 的 光芒 。 由 于 有 了 操作 系统 的 支持 ,我 们 可 以 安装 一 些 软件 ， 也 就 是 应 用 程序 ， 比 如 安装 
了 QQ 或 其 他 一 些 的 即时 通信 工具 ， 这 样 我 们 就 能 够 同 其 他 人 聊天 。 
所 以 , 操作 系统 并 不 能 直接 帮 大 家 做 什么 , 但 大 家 想 做 什么 的 时 候 , 操作 系统 能 提供 最 大 限度 的 支持 。 
任何 程序 都 需要 被 载 入 到 内 存 后 才能 运行 ， 这 是 CPU 等 其 他 硬件 的 运行 机 制 决定 的 ， 我 们 若 在 该 硬件 系统 
行程 序 , 不 得 不 遵守 这 样 那样 的 约束 。 应 用 程序 是 独立 于 操作 系统 的 , 它 不 会 像 操 作 系 统 那 样 , 含 着 金 钥匙， 
生 就 直接 在 内 存 中 。 它 们 通常 位 于 磁盘 等 外 存 设 备 中 ， 在 使 用 时 ， 需 要 从 外 存 中 将 其 调 入 到 内 存 后 才 行 。 
如 何 去 加 载 用 户 程 序 呢 ? 

操作 系统 是 程序 ， 是 软件 ， 用 户 程 序 也 是 软件 ， 用 一 个 程序 去 调用 另 一 个 程序 一 点 难度 都 没有 ， 最 最 简 
单 的 办 法 ， 就 是 用 jmp 或 call 指令 。 我 们 的 BIOS 就 是 这 样 调 用 mbr 的 ， 我 们 的 mbr 就 是 这 样 调用 loader 
的 。 但 大 家 还 记得 不 ，BIOS 调用 mbr，mbr 的 地 址 是 0x7c00，mbr 调用 loader，loader 的 地 址 是 0x900。 这 
两 个 地 址 是 固定 的 ， 也 就 是 说 ， 我 们 目前 的 方法 是 很 不 灵活 的 ， 调 用 方 需要 提前 和 被 调用 方 约定 调用 地 址 。 
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有 没有 一 种 灵活 的 方法 让 程序 的 加 载 地 址 不 那么 固定 呢 ? 
显然 是 有 的 ， 由 于 每 个 程序 是 单独 存在 的 ， 所 以 程序 的 入 口 地 址 信息 需要 与 程序 绑 定 ， 最 简单 的 办 法 
就 是 在 程序 文件 中 专门 腾 出 个 空间 来 写 入 这 些 程序 的 入 口 地 址 , 主 调 程序 在 该 程序 文件 的 相应 空间 中 将 该 
程序 的 入 口 信息 读 出 来 , 将 其 加 载 到 相应 的 入 口 地 址 , 跳 转 过 去 就 行 了 。 当 然 不 仅仅 只 写 入 程序 入 口 地 址 ， 
能 写 的 东西 很 多 ， 比 如 为 了 给 程序 分 配 内 存 ， 至 少 还 得 需要 知道 程序 的 尺寸 大 小 。 但 在 哪里 写 入 程序 的 入 
地 址 呢 ? 这 便 是 文件 头 的 由 来 ,在 程序 文件 的 开头 部 分 记载 这 类 信息 , 而 程序 文件 中 除 文件 头 外 其 余 的 
部 分 则 是 之 前 的 程序 体 。 这样 一 来 , 原先 的 纯 二 进 制 可 执行 文件 加 上 新 的 文件 头 , 就 形成 了 一 种 文件 格式 。 
又 文件 是 这 样 ， 很 多 其 他 传输 协议 也 是 采用 文件 头 header+ 文 件 体 body 的 形式 ， 如 邮件 传输 协议 和 http 
传输 协议 。 在 现实 生活 中 也 有 这 样 的 例子 ， 比 如 咱们 坐 火 车 的 时 候 ， 按 理 说 ， 只 要 火车 停 在 能 让 咱们 看 到 
的 地 方 ， 咱 们 就 能 直接 上 火车 了 。 但 现实 中 不 可 能 让 所 有 火车 摆 在 咱们 面前 ， 所 以 我 们 在 乘坐 火车 时 ， 都 
是 进 站 后 先 要 查看 大 屏幕 上 的 列车 时 刻 表 ， 从 中 找到 在 哪个 候车 室 等 候 上 车 。 其中， 列车 时 刻 表 就 相当 于 
文件 头 ， 我 们 从 中 找到 上 火车 的 入 口 ， 而 火车 则 相当 于 文件 体 。 各 遇 半 六 家 
在 程序 中 ， 程 序 头 〈 也 就 是 文件 头 ) 用 来 描述 程序 的 布局 等 信息 ， 它 属 | 
于 信息 的 信息 ， 也 就 是 元 数据 。 包 含 程序 头 的 程序 文件 示意 如 图 5-32 所 示 。 | Sa 
由 于 程序 文件 中 包含 了 程序 头 ， 好 处 是 程序 的 入 口 地 址 等 信息 不 需要 = 
写 死 ， 调 用 方 中 的 调用 代码 可 以 变 得 通用 ， 根 据 实际 情况 加 载 便 可 。 但 不 
好 的 地 方 是 这 些 元 信息 不 是 代码 ， 故 不 应 该 将 其 放 在 CPU 上 “执行 ”所 本 
以 程序 就 不 再 是 纯粹 的 二 进 制 可 执行 文件 了 ， 不 像 之 前 咱们 用 nasm 默认 
编译 的 可 执行 文件 (里 面 全 是 程序 本 身 的 指令 和 数据 ) 那样 纯粹 。 所 以 ，。 图 5-32 包含 程序 头 的 程序 文件 
将 这 种 具有 程序 头 格式 的 程序 文件 从 外 存 读 入 到 内 存 后 ， 从 该 程序 文件 的 程序 头 中 读 出 入 口 地 址 ,需要 直 
接 跳 进入 口 地 址 执行 ， 跨 过 程序 头 才 行 。 
程序 头 可 以 自 定义 ， 只 要 我 们 按照 自己 定义 的 格式 去 解析 就 行 。 也 许 我 光 这 么 一 说 ,很 多 同学 还 是 不 
能 彻底 明白 如 何 自 定义 文件 头 ， 因 为 大 多 数 同 学 都 是 用 高 级 语言 来 写 程序 的 ， 即 使 用 了 偏 底层 的 C 语言 ， 
不 同 平台 的 e 编译 器 也 会 根据 系统 平台 自动 添加 文件 头 ， 不 给 咱们 亲手 体验 自 定 义 程序 头 的 机 会 。 汇 编 语 
言 非常 灵活 ， 所 以 用 它 来 构建 任意 文件 格式 是 非常 方便 的 。 书 看 到 这 里 ， 我 估计 您 已 经 发 现 我 是 个 非常 体 
贴 的 人 ， 哈 哈 ， 所 以 给 大 家 呈 上 以 下 代码 来 演示 自 定义 文件 头 ， 请 见 汇编 程序 代码 5-6。 
代码 5-6 ”header.S ( 测试 代码 ， 无 实例 ) 


[work@localhost book]$ cat -n header.s 
1 header: 
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程序 代码 




























































































































































































































































































































































































2 program length dq program end-program start 
3 start addr dq program start 

和 以 上 是 文件 头 ， 以 下 是 文件 体 i 

5 body: 

6 program start: 

7 mov ax, 0x1234 

8 jmp $ 


9 program end: 
10 
[work@localhost book]$ 


以 上 测试 代码 header.S， 经 编译 后 生成 的 文件 是 header.bin， 编 译 命令 是 nams -o headerbin header.S， 所 以 
headerbin 依然 是 纯 二 进 制 文件 。 但 此 纯 二 进 制 文件 的 程序 入 口 并 不 是 文件 开头 ， 这 和 虽 们 的 loaderbin 很 像 ， 
mbr 是 跳 到 loaderbin 的 中 间 某 部 分 去 执行 。 假 设 header.S 是 被 调用 的 程序 ， 调 用 方 知道 headerS 的 前 8 字 节 
是 程序 头 ,在 这 8 字 节 中 ,前 4 字 节 用 来 标明 程序 尺寸 大 小 ,后 4 字 节 用 来 指明 程序 的 入 口 地 址 ， 也 就 是 该 程 
序 的 第 一 条 指令 地 址 。 从 8 字 节 后 到 文件 结束 为 文件 体 。 在 调用 方程 序 已 经 了 解 此 文件 格式 后 , 它 可 以 这 样 做 。 

(1) 将 headerbin 前 8 字 节 的 内 容 读 到 内 存 ， 前 4 字 节 是 程序 体 长 度 ， 后 4 字 节 是 程序 的 入 口 地 址 。 

(2) 将 header.bin 开头 偏 移 8 字 节 的 地 方 作为 起 始 ， 将 headerbin 文件 尾 ， 即 开头 偏 移 〈8+ 程 序 体 长 
度 ) 个 字 节 的 地 方 作为 终止 。 

(3) 将 起 始 至 终止 之 间 的 程序 体 复制 到 入 口 地 址 。 
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大 家 看 下 headerbin 生成 的 二 
即 program_length 是 0x00000005，start_addr 是 0x00000008。 
ax，0x1234 指令 ，EBFE 对 应 


下 


~ 




















(4) 转 到 入 口 地 址 处 执行 。 
您 看 , 被 调用 方 header.bin 被 设计 成 这 样 的 文件 格式 ， 调 用 方 就 可 以 自由 处 理 啦 。 为 了 验证 文件 格式 ， 
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也 





























文件 




















实 内 容 ， 前 8 字 节 





贰 序 





名 











的 是 jmp $， 如 图 5-33 所 示 。 





了 两 个 下 划 线 分 别 区 分 了 两 个 程序 头 属性 








Ly 











2 


是 反 着 的 ， 小 端 字 节 序 。B83412 是 mov 





[work@localhost book]$ sh ~/tool/xxd.sh header ,bin 0 300 
0000000: 05 00 00 00 08 00 00 00 B8 34 12 EB FE 


ooeeoesss 4... 





[work@localhost book]$ 


当然 这 仅仅 是 用 来 演示 的 ， 
3 已 设计 的 文人 









































日 C 语言 编程 ， 其 编译 器 gcc 生成 的 是 elf 文 伯 





































































































5.3.3 ”elf 格式 的 二 进 制 文件 


是 扩 
Linux 下 可 

















展 名 ， 属 F 名 的 


开始 我 就 在 想 ， 如 何 将 此 elf 文件 格式 记 
一 般 都 是 这 样 介绍 ELF 的 : Window 下 的 可 执行 文件 格式 是 PE (如 果 








老林 


谓 符 ， 吕 




















2 





于 文件 


HH 


分 ， 只 是 名 字 的 后 





Hs 























执 





行文 但 





i 














EE 二 








与 我 


(relocatable file )， 


民 本 谈 不 








上 讨 











二 
1 


Hp 











序 二 进 制 接口 














先 跟 大 








在 大 家 平时 的 习惯 中 ， 





| 
































F 格 式 是 ELF。 
实 。 我 想 ， 那 时 的 我 1 
日 们 不 求 深入 剖析 ， 也 要 采取 “ 浅 析 ”的 方式 来 曾 
ELF 指 的 是 Executable and Linkable Format,， 
作为 应 用 程 CABI) 而 开发 和 发 行 的 。 工 具 接 
结构 上 不 同 操作 系统 之 间 的 可 移植 二 进 
家 交待 下 ， 在 ELF 规范 中 ， 把 
平时 所 说 的 目标 文件 是 不 同 


比如 在 Linux 下 用 gcc -c 参数 生成 的 .o 文 从 








般 只 是 通过 这 样 简 生 
很 少 有 人 能 从 课 举 上 明 
述 


























o 





它 并 不 是 真正 
单 的 对 比 来 认识 elf 格式 的 ， 这 充其量 
白 ELF 文件 格式 的 本 质 。 本 文 不 再 重 蹈 覆 笛 ， 


4 图 5-33 E 义 程序 头 的 可 执行 文件 
目的 是 起 到 抛砖引玉 的 作用 ， 说 了 这 些 是 为 了 引出 后 面 咱们 要 介绍 的 文件 格式 。 
F 头 自己 当然 认识 , 但 这 毕竟 不 通用 , 我 们 需要 选择 一 种 流行 的 文件 格式 , 咱们 是 在 Linux 
F 格 式 ， 咱 们 在 下 一 节 展 开 ef 可 执行 文件 格式 的 内 容 。 








想起 我 们 在 上 大 学 的 时 候 ， 操 作 系统 课程 的 老师 





您 想 说 的 是 EXE, 不 要 搞 混 了 ，EXE 
的 格式 )，PE 即 Portable Executable， 


算是 个 简介 ， 









































制 文人 


符合 





ELF 格式 协议 的 文 
的 。 
咱们 















































编译 后 ， 但 未 经 链接 的 文件 称 为 目标 文件 ， 也 称 为 等 重 定位 文件 
F。 而 平时 我 们 所 说 的 ELF 文件 也 是 指 经 过 


J 执行 链接 格式 。 最 初 是 由 UNIX 系统 实验 室 (USL) 
口 标准 委员 会 (TIS ) 选择 了 它 作为 IA32 体系 
格式， 于 是 它 就 发 展 成 为 了 事实 


























上 的 二 进 制 文件 格式 标准 。 
件 统称 为 “目标 文件 ”或 ELF 文件 ， 这 













































































































































































































































































































































































编译 链接 后 的 二 进 制 可 执行 文件 ， 该 文件 能 够 直接 运行 。 

为 了 避免 混淆 , 咱们 采用 与 ELF 规范 相同 的 命名 方式 , 本 节 中 所 说 的 目标 文件 即 指 各 种 类 型 符合 ELF 
规范 的 文件 ， 如 二 进 制 可 执行 文件 和 Linux 下 .o 结尾 的 目标 文件 和 .so 结尾 的 动态 库 文 件 。 而 待 重 定位 文 
件 ， 可 以 理解 成 咱们 惯常 所 说 的 目标 文件 (如 Linux 下 的 .o 文件 )。ELE 目标 文件 归纳 见 表 5-7。 

表 5-7 elf 眼中 的 目标 文件 

ELF 目标 文件 类 型 描 述 
待 重 定位 文件 就 是 常 说 的 目标 文件 ， 属 于 源 文件 编译 后 但 未 完成 链接 的 半成品 ， 它 被 用 于 与 
其 他 目标 文件 合并 链接 ， 以 构建 出 二 进 制 可 执行 文件 或 动态 链接 库 。 为 什么 称 其 为 “ 待 重 定 
待 重 定位 文件 relocatable file) 位 ”文件 呢 ? 原因 是 在 该 目标 文件 中 ， 如 果 引 用 了 其 他 外 部 文件 〈 其 他 目标 文件 或 库 文件 ) 
中 定义 的 符号 (变量 或 者 函数 统称 为 符号 )， 在 编译 阶段 只 能 先 标 识 出 一 个 符号 名 , 该 符号 具 
本 的 地 址 还 不 能 确定 ， 因 为 不 知道 该 符号 是 在 哪个 外 部 文件 中 ， 而 该 外 部 文件 需要 被 重 定 位 
后 才能 确定 文件 内 的 符号 地 址 ， 这 些 重 定位 的 工作 是 需要 在 连接 的 过 程 中 完成 的 
tk 享 目标 文件 shared object file》 门 常 说 的 动态 链接 库 。 在 可 执行 文件 被 加 载 的 过 程 中 被 动态 链接 ， 成 为 程序 代码 的 
可 执行 文件 (executable file ) 经 过 编译 链接 后 的 、 可 以 直接 运行 的 程序 文件 

为 什么 先 给 大 家 介绍 这 些 ， 在 后 面 大 家 就 知道 了 ，elf 各 种 数据 结构 中 牵扯 到 各 种 “类 型 ” 已 经 了 解 

的 同学 就 忽略 我 吧 ， 这 是 给 那些 没 接触 过 此 方面 的 同学 准备 的 ， 先 让 大 家 有 个 感性 认识 。 








本 来 我 想 和 大 家 提前 约定 一 下 本 文 所 用 到 的 术语 风格 ,其 实 我 想 一 律 / 















































] 英 文 单词 ,但 担心 大 家 如 果 
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某 天 翻 看 到 中 
好 ， 为 了 











i 述 清楚 文 





























所 以 下 面 的 说 明 咱们 以 它们 为 例 。 程 序 中 有 很 多 段 ， 如 




















间 某 页 ， 无 法 将 英文 解释 对 号 入 座 ， 所 以 我 尽量 适时 地 穿 扣 











件 格 式 的 本 质 ， 咱 们 先 从 最 基本 的 “ 段 ” 说 起 。 
程序 中 最 重要 的 部 分 就 是 段 (segment) 和 节 (section)， 它 们 是 真正 的 程序 体 ， 是 真 真切 切 的 程序 资源 ， 





代码 段 和 数 和 














的 ， 多 个 节 经 过 链接 之 后 就 被 合并 成 


段 和 节 的 信息 也 是 用 
程序 中 段 的 大 小 和 数 




















头 表 和 节 头 表 都 称 为 表 , 这 说 明 里 和 

















个 段 了 ， 之 前 咱 介 





] 有 























昌 段 等 ， 同 样 也 有 很 多 节 ， 段 是 
通过 实例 解释 过 segment 和 section 之 间 的 关系 。 





中 英文 同时 标注 。 





header 来 描述 的 ， 程 序 头 是 program header， 节 头 是 section header。 


量 是 不 固定 的 ， 节 的 大 小 和 数量 也 不 固定 ,因此 需要 为 它们 专门 找 个 数 寺 
述 它们 ， 这 个 描述 结构 就 是 程序 头 表 (program header table) 和 节 头 表 〈section header table)。 既 然 程 序 
j 存 储 的 是 多 个 程序 头 program header 和 多 个 节 头 section header 的 信息 ， 





























日 节 来 组 成 


时 结构 来 








故 这 两 个 表 相 当 于 数组 ， 数 组 元 素 分 别 是 程序 头 program header 和 节 头 section header。 再 次 强调 ， 这 两 个 




















表 是 














来 将 汇总 程序 头 和 














上 语 人 
虽然 

















是 将 两 个 表 一 块 说 明 


节 头 的 表 ， 表 中 元 素 是 头 信 ， 
元 素 全 是 程序 头 (program header)， 而 节 头 表 (section header table) 中 的 元 素 全 








电 。 也 就 是 说 程 




















在 表 中 ， 每 个 成 员 〈 数 组 元 素 ) 都 统称 为 条 目 

















对 于 程序 头 表 ， 它 本 质 上 就 是 月 
段 等 同 于 程序 ， 所 以 将 描述 段 信 





























由 于 程序 中 段 和 节 的 
中 的 存储 顺 



































的 ， 但 表 中 的 元 素 全 是 六 








， 即 ] 








数量 不 固定 , 程序 头 表 向 头 表 的 大 小 自然 也 就 不 固定 了 , 而 



























































































































































entry， 一 个 条 目 代 








序 头 表 (program header table) 中 的 
上 是 节 头 〈section header ) 。 


一 的 ， 不 会 在 程序 头 表 中 存在 节 头 信息 。 




















段 或 一 个 节 的 头 描述 信息 。 
来 描述 段 〈segment) 的 ， 所 以 您 也 可 以 称 它 为 段 头 表 。 从 名 字 上 就 能 够 看 出 ， 
息 的 表 说 成 program header table， 可 见 “ 段 ” 才 是 程序 本 身 的 组 成 部 分 。 













































































日 各 表 在 程序 文件 











序 自然 也 要 有 个 先后 ， 故 这 两 个 表 在 文件 中 的 位 置 也 不 会 固定 。 因 此 ， 必 须要 在 一 个 固定 的 位 
置 ， 用 一 个 固定 大 小 的 数据 结构 来 描述 程序 头 表 和 节 头 表 的 大 小 及 位 置信 息 ， 这 个 数据 结构 便 是 ELF 
header， 它 位 于 文件 最 开始 的 部 分 ， 并 具有 固定 大 小 ， 一 会 儿 咀 们 看 elf header 的 数据 结构 就 知道 了 。 
ELF header 是 个 用 来 描述 各 种 “ 头 ” 的 “ 头 ” 程序 头 表 和 节 头 表 中 的 元 素 也 是 程序 头 和 节 头 ， 可 见 ， 
ef 文件 格式 的 核心 思想 就 是 关中 芯 头 ， 是 种 层次 化 结构 的 格式 。 
有 了 上 面 的 宏观 介绍 ， 下 面 就 好 理解 多 了 。 
ELF 文件 格式 依然 分 为 文件 头 和 文件 体 两 部 分 ， 只 是 该 文件 头 相对 稍 显 复杂 ， 类 似 层次 化 结构 ， 先 用 





个 ELF header 从 “全 局 上 ”给 出 程序 文件 的 组 织 结 














序 头 表 的 大 小 及 位 置 、 


































































































程序 头 表 和 节 头 表 中 予以 说 明 。 

ELF 格式 的 作用 体现 在 两 方面 , 一 是 链接 阶段 ， 
另 一 方面 是 运行 阶段 ， 故 它们 在 文件 中 组 织 布局 咱 
们 也 从 这 两 方面 展示 ， 如 图 5-34 所 示 。 

如 图 5-34 所 示 ， 无 论 是 在 待 重 定位 文件 ， 还 是 
可 执行 文件 中 , 文件 最 开头 的 部 分 必须 是 elf header， 
这 就 是 前 面 咱们 所 说 的 固定 的 位 置 。 在 ELF header 


























之 后 紧 挨 着 的 是 程序 头 表 ， 这 对 于 可 执行 文件 是 必 
































须 存在 的 ， 而 对 于 待 重 定位 文件 是 可 选 的 。 其 他 成 





员 的 位 置 要 取决 于 各 头 表 中 的 说 明 。 坦 
触 ef 之 初 并 不 容易 理解 它 ， 所 以 ,之 后 咱 
个 实际 例子 来 细 说 ， 这 里 咱们 先 有 个 笼统 的 认识 。 
咱们 马上 要 步 入 正题 啦 ， 在 此 之 前 必须 要 提前 









































白 说 ， 刚 接 





























们 会 以 





























括 变量 、 常 量 及 取 值 范围 



































SS 切 就 绪 ， 咱 
一 些 重 要 的 数据 结构 
见 表 5-8 所 列 。 
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elf 结构 。 








中 用 到 了 











类 玫 


自 定 义 的 数据 类 


跟 大 


， 都 可 以 在 Linux 系统 的 /usr/include/elf.h 中 找到 ， 这 里 
为 了 方便 大 家 学 习 ， 本 书 从 elfh 中 
们 开始 正式 介绍 








构 ， 概 要 出 程序 中 3 
节 头 表 的 大 小 及 位 置 。 然 后 ， 各 个 段 和 节 的 位 置 、 大 小 等 信息 再 分 别 从 “ 






































其 他 头 表 的 位 置 大 小 等 信息 ， 如 程 
人 体 的 ” 





链接 视图 


运行 视图 





ELF header (elf 头 ) 


ELFheader (elf 头 ) 





Program header table (程序 头 表 ) 
可 选 


Program headertable 〈 程 序 头 表 ) 








Section 1 〈 节 1) 


Segment1( 段 1) 








Sectionn〈《 节 nn) 


Segment2 ( 段 2) 








Section header table〈 节 头 表 ) 


Section header table( 节 头 表 ) 























可 选 
待 重 定位 文件 体 可 执行 文件 体 
4 图 5-34 elf 文件 格式 布局 




















火 儿 交待 一 下 ， 以 下 咱们 书 中 有 关 elf 的 人 有 




















用 的 定义 才 

















搬 了 必要 的 部 分 ， 有 的 并 不 全 面 ， 只 是 起 到 帮助 大 家 阅 














型 ,所 以 先 给 大 家 介绍 一 下 它们 , 免得 造成 学 习 的 


E 何 定义 ， 包 
是 最 全 最 权威 的 。 
读本 书 的 作用 。 


困扰 ， 



















































































































































































































































































表 5-8 elf header 中 的 数据 类 型 
数据 类 型 名 称 字 节 大 小 对 齐 意 义 
Elf32_Half 2 2 无 符号 中 等 大 小 的 整数 
Elf32 Word 4 4 无 符号 大 整数 
Elf32_Addr 4 4 无 符号 程序 运行 地 址 
Elf32_Off 4 4 无 符号 的 文件 偏 移 量 
好 啦 ， 现 在 中 们 从 上 至 下 ， 依 次 揭 开 各 层 header 的 庐山 真面目 。 咱 们 这 里 eh 
先 介 绍 ELF header 的 结构 。 Efe2 Hl ne 
C 语言 中 的 结构 体能 够 很 直观 地 表示 物理 内 存 结构 , 用 结构 体 的 形式 展现 一 这" 
个 数据 结构 是 最 合适 不 过 的 啦 ， 所 以 咱们 结合 图 5-35， 依 次 介绍 下 各 结构 体 成 ES2-Wond di 
e_ident[16] 是 16 字 节 大 小 的 数组 ， 用 来 表示 elf 字符 等 信息 ， 开 头 的 4 个 字 ER2H hn 
节 是 固定 不 变 的 ， 是 elf 文件 的 魔 数 ， 它 们 分 别 是 0x7f， 以 及 字符 串 ELF 的 age 
码 : 0x45, 0x4c, 0x46。 对 于 此 数组 说 明 见 表 5-9。 4 图 5735 elf header 结构 
表 5-9 e_ident 数组 功能 简介 
e_ident 数组 成 员 意 义 
e_ident[0] = Ox7f 
eident[1]=B 这 4 位 是 固定 的 ELF 文件 的 魔 数 , 如 果 它 们 的 值 如 左 列 4 行 所 示 , 表明 这 就 是 一 个 ELF 
e_ident[2] = L' 文件 
e_ident[3] = 'F' 
e_ident[4] 来 标识 elf 文件 的 类 型 
值 为 0 表示 该 文件 是 不 可 识别 类 型 
值 为 1 表示 该 文件 是 32 位 elf 格式 的 文件 
值 为 2 表示 该 文件 是 64 位 ef 格式 的 文件 
e_ident[5] 来 指定 编码 格式 ， 其 实 就 是 指定 大 端 字 节 序 还 是 小 端 字 节 序 























值 为 0 表示 非法 编码 格式 
值 为 1 表示 小 端 字 节 序 ， 即 LSB (最 低 有 效 字 节 ) 
值 为 2 表示 大 端 字 节 序 ， 即 MSB 〈 最 高 有 效 字 节 ) 






































e_ident[6] ELF 头 的 版 本 信息 ， 默 认为 1 
值 为 0 表示 非法 版 本 
值 为 1 表示 当前 版 本 
e_ident[7~15] 暂且 不 用 ， 保留 ， 均 初始 化 为 0 

















在 这 里 插播 个 小 插曲 ， 有 关 e_ident[5] 大 小 端 字 节 序 ， 和 大 家 分 享 一 个 技巧 ， 用 fe 命令 就 能 够 查看 
到 elf 格式 的 可 执行 程序 是 LSB， 还 是 MSB。 

例如 file /bin/ls 回 车 后 ， 输 出 信息 为 : 

/bin/ls: ELF 32-bit LSB executable, Intel 80386, version 1 (SYSV), dynamically linked (uses shared libs), for 
GNU/Linux 2.6.18, stripped。 

我 想 ， 您 已 经 注意 到 了 在 32-bit 后 面 的 LSB。 好 啦 ， 咱 们 继续 说 其 他 属性 。 

e_type 占用 2 字 节 ， 是 用 来 指定 elf 目标 文件 的 类 型 ， 可 能 的 取 值 见 表 5-10。 
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表 5-10 elf 目标 文件 类 型 

elf 目标 文件 类 型 取 值 意 义 
ET_NONE 0 未 知 目标 文件 格式 ， 忽 略 
ET_ REL 1 可 重 定位 文件 
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第 5 章 保护 模式 进 阶 ， 向 内 核 迈 进 
















































































续 表 
elf 目标 文件 类 型 取 值 意 义 
ET_EXEC 2 可 执行 文件 
ET_DYN 3 动态 共享 目标 文件 
ET_CORE 4 core 文件 ， 即 程序 崩 尝 时 其 内 存 映 像 的 转 储 格式 ， 俗 称 出 core 了 
ET_LOPROC Oxff00 特定 处 理 器 文件 的 扩展 下 边界 
ET_HIPROC 0Oxffff 特定 处 理 器 文件 的 扩展 上 边界 




















表 5-10 列 出 了 许多 类 型 文件 , 前 5 种 类 型 文件 看 上 去 稍 显 “ 亲 民 ” 还 能 接受 。 最 后 两 种 , ET_ LOPROC 
和 ET_HIPROC 这 两 个 类 型 的 取 值 跨度 好 大 ， 显 得 似乎 有 些 怪异 ， 其 实 把 它们 搞 得 如 此 怪异 ， 是 为 了 突显 
它们 的 “与 众 不 同 ” 它们 是 与 硬件 相关 的 参数 ， 在 它们 之 间 的 取 值 用 来 标识 与 处 理 器 相关 的 文件 格式 。 
不 过 呢 ， 虽 然 有 这 么 多 类 型 ， 但 咱们 只 需要 关注 取 值 为 2 的 ET_EXEC 类 型 ， 它 的 意义 为 程序 可 执行 ， 就 











































































































































































































是 咱们 平时 编译 链接 好 的 可 执行 程序 的 类 型 。 
e_machine 占用 2 字 节 ,用 来 描述 elf 目标 文件 的 体系 结构 类 型 ,也 就 是 说 该 文件 要 在 哪 种 硬件 平台 ( 哪 
种 机 器 ) 上 才能 运行 。 可 能 的 取 值 见 表 5-11。 
表 5-11 elf 目标 文件 所 属 的 体系 结构 类 型 
体系 结构 类 型 取 值 意 义 
EM_NONE 0 未 指定 
EM_M32 1 AT&T WE 32100 
EM_SPARC 2 SPARC 
EM_386 3 Intel 80386 
EM_68K 4 Motorola 68000 
EM_88K 5 Motorola 88000 
EM_860 7 Intel 80860 
EM_MIPS 8 MIPS RS3000 




















从 表 5-11 中 列 出 的 7 种 体系 结构 可 以 看 出 ，elf 实现 了 机 器 平台 无 关 的 良好 可 移植 性 。 

e_version 占用 4 字 节 ， 用 来 表示 版 本 信息 。 

e_entry 占用 4 字 节 ， 用 来 指明 操作 系统 运行 该 程序 时 ， 将 控制 权 转 交 到 的 虚拟 地 址 。 

e_phoff 占用 4 字 节 ， 用 来 指明 程序 头 表 (program header table) 在 文件 内 的 字 节 偏 移 量 。 如 果 没 有 程 
序 头 表 ， 该 值 为 0。 

e_shoff 占用 4 字 节 ， 用 来 指明 节 头 表 (section header table) 在 文件 内 的 字 节 偏 移 量 。 若 没有 节 头 表 ， 
该 值 为 0。 
e_flags 占用 4 字 节 ， 用 来 指明 与 处 理 器 相关 的 标志 ， 本 书 用 不 到 那么 多 的 内 容 ， 有 具体 取 值 范围 ， 有 兴 
趣 的 同学 还 是 要 参考 /usr/include/elf.h。 

e_ehsize 占用 2 字 节 ， 用 来 指明 elf header 的 字 节 大 小 。 

e_phentsize 占用 2 字 节 ， 用 来 指明 程序 头 表 (program header table) 中 每 个 条 目 (entry) 的 字 节 大 小 ， 
即 每 个 用 来 描述 段 信 息 的 数据 结构 的 字 节 大 小 ， 该 结构 是 后 面 要 介绍 的 struct Elf32_Phdr。 

e_phnum 占用 2 字 节 ， 用 来 指明 程序 头 表 中 条 目的 数量 。 实 际 上 就 是 段 的 个 数 。 

e_shentsize 占用 2 字 节 ， 用 来 指明 节 头 表 (section header table) 中 每 个 条 目 〈entry) 的 字 节 大 小 ， 即 
每 个 用 来 描述 节 信 息 的 数据 结构 的 字 节 大 小 。 

e_shnum 占用 2 字 节 ， 用 来 指明 节 头 表 中 条 目的 数量 。 实 际 上 就 是 节 的 个 数 。 

e_shstrndx 占用 2 字 节 ， 用 来 指明 string name table 在 节 头 表 中 的 索引 index。 

接 下 来 再 给 大 家 介绍 下 程序 头 表 中 的 条 目的 数据 结构 ， 这 是 用 来 描述 各 个 段 的 信息 用 的 ， 其 结构 名 
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为 struct Elf32_Phdr。 怕 有 同学 搞 混 了 ， 在 此 容 我 喝 哑 一 下 ， 此 段 是 指 程序 中 的 某 个 数据 或 代码 的 区 域 
段落 ， 例 如 数据 段 或 代码 段 ， 并 不 是 内 存 中 的 段 ， 到 现在 为 止 我 们 都 在 讨论 。 struct Elf32_Phdr{ 
位 于 磁盘 上 的 程序 文件 呢 。stmuct Elf32_Phdr 结构 的 功能 类 似 GDT 中 段 描述 有 Rd poRe 
符 的 作用 , 段 描述 符 用 来 描述 物理 内 存 中 的 一 个 内 存 段 , 而 struct Elf32 Phdr Eif32 Addr  p_vaddr; 
是 用 来 描述 位 于 磁盘 上 的 程序 中 的 一 个 段 ， 它 被 加 载 到 内 存 后 才 属于 GDT Ey32-Wery Pes 
中 段 描述 符 所 指向 的 内 存 段 的 子 集 。 好 啦 , 话说 得 有 点 多 啦 , 其 结构 如 图 5-36 站 0 
所 示 。 Elf32 Word  p_align; 
还 是 按照 惯例 ， 咱 们 先 把 属性 都 介绍 一 下 。 } 
p_type 占用 4 字 节 ， 用 来 指明 程序 中 该 段 的 类 型 。p_type 类 型 说 明 见 表 5-12。 “图 5-36 program header 结构 
表 5-12 程序 中 的 段 类 型 
类 型 取 值 说 明 
PT_ NULL 0 忽略 
PT_LOAD 1 可 加 载 程序 段 
PT_DYNAMIC 2 动态 链接 信息 
PT_INTERP 3 动态 加 载 器 名 称 
PT_NOTE 4 一 些 辅助 的 附加 信息 
PT_SHLIB 3 保留 
PT_PHDR 6 程序 头 表 
PT LOPROC 0x70000000 
一 一 此 范围 内 的 类 型 预 留 给 处 理 器 专用 
PT_HIPROC 0Ox7fffffff 
p_offset 占用 4 字 节 ， 用 来 指明 本 段 在 文件 内 的 起 始 偏 移 字 节 。 





p_vaddr 占用 4 字 节 ， 用 来 指明 本 段 在 内 存 中 的 起 始 虚拟 地 址 。 



































































































































































































































p_paddr 占用 4 字 节 ， 仅 用 于 与 物理 地 址 相关 的 系统 中 ， 因 为 System V 忽略 用 户 程 序 中 所 有 的 物理 地 
址 ， 所 以 此 项 暂且 保留 ， 未 设 定 。 
p_filesz 占用 4 字 节 ， 用 来 指明 本 段 在 文件 中 的 大 小 。 
p_memsz 占用 4 字 节 ， 用 来 指明 本 段 在 内 存 中 的 大 小 。 
p_flags 占用 4 字 节 ， 用 来 指明 与 本 段 相 关 的 标志 ， 此 标志 取 值 范围 见 表 5-13 。 
表 5-13 p_flags 取 值 范围 
类 型 取 值 说 明 
PF X 1 本 段 具 有 可 执行 权限 
PF W 2 本 段 具 有 可 写 权限 
PF R 4 本 段 具有 可 读 权限 
PF_ MASKOS OxOff00000 本 段 与 操作 系统 相关 
PF_MASKPROC Oxf0000000 本 段 与 处 理 器 相关 
p_align 占用 4 字 节 ， 用 来 指明 本 段 在 文件 和 内 存 中 的 对 齐 方 式 。 如 果 值 为 0 或 1， 则 表示 不 对 齐 。 否 























则 p_align 应 该 是 2 的 窜 次 数 。 





链接 后 ， 程 








部 运 行 的 代码 、 数 和 





























等 资源 都 是 在 段 中 ， 所 以 ， 在 elf header 和 program header 





介绍 完 后 ， 






































或 其 他 方面 的 内 容 咀 们 这 
以 上 的 说 明 似乎 显得 过 于 






































象 ， 我 能 想像 ， 也 许 有 的 同学 必 





以 自行 深入 研究 。 


基本 上 就 已 经 把 与 “ 段 ”相关 的 内 容 说 完 啦 。 咀 们 还 是 本 着 “ 够 用 就 行 ” 的 原则 学 习 ， 有 关 “section 节 ” 
就 不 需要 关注 太 多 了 ， 有 兴趣 的 同学 可 




















F 始 有 点 不 耐烦 了 ， 不 过 不 要 














二 前 日 

















/CA 














们 就 说 过 啦 ， 要 拿 个 实际 的 例子 来 解释 这 些 看 似 复杂 的 结构 ， 我 相信 通过 实例 来 解释 以 上 内 容 ， 大 家 一 定 
会 茸 塞 顿 开 。 更 多 精彩 请 看 下 一 节 。 
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5.3.4 elf 文件 实例 分 析 





只 把 我 们 需要 了 解 的 部 分 说 完 





本 质 ， 听 们 在 本 节 开 始 分 析 前 本 
为 了 让 大 家 看 清楚 elf 文件 
封装 成 了 xxd.sh 脚本 ， 参 数 1 是 待 查 

































































在 上 一 节 中 ， 我 们 讲述 了 elf 格式 的 部 分 理论 知识 ， 为 什么 是 部 分 呢 ? 因为 我 们 本 着 “ 够 用 ”的 原则 ， 
过 ， 我 相信 大 部 分 同学 仅仅 任 上 一 节 中 的 理论 知识 还 是 领悟 不 到 elf 
门 写 过 的 “内 核 ”( 代 码 5-5)， 让 大 家 看 清 elf 文件 的 每 一 个 字 节 。 

咱们 要 用 之 前 的 xxd 命令 ， 为 了 方便 使 用 ， 如 很 久 以 前 所 述 ， 已 经 将 其 
的 文件 名 ， 参 数 2 是 文件 内 的 起 始 字 节 ， 参 数 3 是 查看 的 连续 字 节 数 。 


























































































































脚本 是 逐 字 节 输出 文件 的 内 容 。 脚 本 内 容 很 简单 ， 就 是 xxd 命令 而 已 : xxd -u -a -g 1 -s $2 -1 $3 $1, 您 也 看 到 了 ， 





























参数 比较 多 ， 弄 成 脚本 完全 是 为 了 避免 每 次 复杂 的 参数 键入 。 为 了 让 大 家 方便 使 用 ， 我 已 经 将 其 放 到 了 tool 














目录 下 ， 脚 本 中 有 参数 说 明 ， 这 里 不 
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了 列 出 。 下 面 是 用 此 脚本 处 理 kernel.bin 的 输出 ， 如 图 5-37 所 示 。 
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4 图 5-37 elf 格式 剖析 











之 前 我 们 就 用 过 多 次 xxd 命令 啦 ， 对 于 输出 想必 大 家 一 定 很 熟悉 啦 。 脚 本 的 输出 大 概 分 了 三 部 分 ， 最 


左边 的 一 列 是 十 六 进 制 的 地 址 ， 或 者 称 为 侦 移 量 最 为 恰当 。 中 间 这 一 大 块 矩 阵 似 的 十 六 进 






































数字 是 文件 中 


一 | 


























的 内 容 ， 每 两 位 十 六 进 制 数字 为 一 字 节 ， 每 行 共 16 个 字 节 。 最 右边 那 一 列 ， 含 有 点 点 的 、 偶 尔 伴 有 可 读 





























字符 的 部 分 是 字符 显示 区 ， 这 部 分 将 内 容 按照 字符 编码 显示 ， 当 然 ， 前 提 肯 定 得 是 可 打印 字符 ， 控 制 字 符 























痛 定 不 行 ， 所 以 只 要 不 是 可 显示 的 字符 便 显示 为 '。 














为 了 方便 大 家 查看 elf 文件 

















各 部 分 属性 ， 我 在 各 属性 下 面 用 下 划 线 予以 区 分 。 其 中 ， 细 下 划 线 属于 











elf header 的 范围 ， 粗 下 划 线 属于 
显 的 下 划 线 分 隔 ， 相 信 大 家 一 定 和 
咱们 按照 从 上 到 下 的 顺序 ， 先 从 纪 











A 





program header table 程序 头 表 的 范围 
目 了 然 。 



















































































。 在 各 范围 之 中 的 各 属性 ， 又 以 明 
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下划线 的 elf header 部 分 说 起 。 








第 一 行 是 e_ ident 数组 ,前 4 字 节 是 固定 的 elf 魔 数 , 正如 您 看 到 的 , 它们 是 0x7f 和 字符 ELF 的 ASCII: 





0x45、0x4c、0x46。 所 以 您 在 显示 区 看 到 了 ELF 的 三 个 字符 。 紧 跟 其 后 的 三 个 1 分 别 是 e ident[4]、e_ident[5]、 








e_ident[6] 三 个 成 员 ， 代 表 的 意义 是 














32 位 elf 文件 、 小 端 字 节 序 、 当 前 版 本 。 后 面 的 9 个 00 是 e ident[7] 一 




















e_ident[15]， 这 些 确实 都 已 经 初始 化 为 0。 





现在 看 第 二 行 。 








字 节 序 所 表示 的 数值 。 这 个 是 e_type 所 
兴趣 的 同学 可 以 自行 查看 Linux 下 的 .o 












































第 1 个 下 画 线 处 的 内 容 是 02 00， 由 于 是 小 端 字 节 序 ， 所 以 其 
































i 





直 为 0x0002。 以 下 为 方便 陈述 ， 只 说 该 


























性 ， 它 占 2 字 节 , 值 为 2 表示 类 型 为 ET_EXEC, 即 可 执行 文件 (有 





























标 文件 ， 其 6_type 类 型 是 值 为 1 的 ET_REL， 即 待 重 定 位 类 型 )。 


















































本 行 的 第 2 个 下 画 线 处 的 内 容 是 0x0003， 占 2 字 节 。 该 位 置 是 e machine 属性 ， 即 EM_386， 表 示 该 

















elf 文件 是 运行 在 Intel 80386 3 
第 3 个 下 画 
各 
第 












































现在 看 第 三 行 。 














218 























下 画 线 处 的 内 容 是 0x00000001， 占 4 字 节 。 该 位 置 是 e_version 属性 ， 即 版 本 信息 。 

第 4 个 下 画 线 处 的 内 容 是 0xc0001500， 占 4 字 节 ， 该 位 置 是 e_entry 属性 ， 即 程序 的 虚拟 入 口 地 址 。 
5 个 下 画 线 处 的 内 容 是 0x00000034， 占 4 字 节 ， 该 位 置 是 e_phoff 属性 ， 表 示 program header table 
程序 头 表 在 文件 中 的 偏 移 量 ， 这 里 的 1 















































局 移 量 是 0x34。 





第 1 个 下 画 线 处 的 内 容 是 0x00000$$c， 占 4 字 节 ， 该 位 置 是 e_shoff， 表 示 section header table 节 头 表 











2 个 下 画 线 处 的 内 容 是 0x00000000， 占 4 字 节 ， 该 位 置 是 e flags 属性 。 





















































F 内 的 偏 移 量 ， 这 里 的 值 为 0x55c， 表 示 在 本 文件 偏 移 0x55c 字 节 处 为 节 头 表 。 








之 前 说 过 啦 ， 若 没有 














3 个 下 画 线 处 的 内 容 是 0x0034， 占 2 字 节 ， 该 位 置 是 e_ehsize 属性 ， 表 示 elf header 大 小 是 0x34 

















在 文 从 

节 头 表 ， 此 处 便 为 0。 
第 
第 

字 节 


AAA 


条 


第 


和 
里 为 2 


A 
条 
现 
全 人 


条 


表示 有 


大 


和 
表 中 的 
现 
从 
































4 个 下 画 线 处 的 内 容 是 0x0020， 占 2 字 节 ， 该 位 置 是 e_phentsize 属性 ， 即 program header 的 结 
struct Elf32_ Phdr 的 字 节 大 小 ， 值 为 0x20 字 节 。 































































































































































































。 这 和 前 面 e_phoff 属性 值 大 小 一 致 ， 可 见 ， 程 序 头 表 紧 跟 着 elf header 之 后 。 





























构 : 




















5 个 下 画 线 处 的 内 容 是 0x0002， 占 2 字 节 ， 该 位 置 是 e_phnum 属性 ， 即 程序 头 表 中 有 段 的 个 数 ， 这 
个 段 。 

6 个 下 画 线 处 的 内 容 是 0x0028， 占 2 字 节 ， 该 位 置 是 e_shentsize 属性 ， 即 节 头 表 中 各 个 节 的 大 小 。 
在 看 第 四 行 。 

1 个 下 画 线 处 的 内 容 是 0x0006， 占 2 字 节 ， 该 位 置 是 e_shnum 属性 ， 即 节 头 表 中 节 的 个 数 ， 这 里 
6 个 节 。 

2 个 下 面 线 处 的 内 容 是 0x0003， 占 2 字 节 ， 该 位 置 是 e_shstrndx 属性 ， 即 string name table 在 节 头 
索引 为 3。 

在 开始 分 析 粗 下 画 线 范围 的 程序 头 表 部 分 。 












































分 两 个 





第 4 行 到 第 8 行 是 程序 头 表 的 范围 ， 前 面 说 过 啦 ， 程 序 头 表 中 
































段 的 。 竖 线 左 右 两 边 各 是 一 个 段 。 





下 
续 说 图 
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条 





























有 两 个 粗 下 画 线 ， 每 个 占 0x20 字 节 。 大 家 注意 图 中 ， 在 两 个 粗 下 画 线 间 有 个 小 竖 线 ， 这 是 ) 








共有 2 个 段 ， 每 个 段 大 小 是 0x20 字 

















j 来 区 


面 咱们 按照 struct Elf32 Phdr 结构 来 分 析 ， 该 结构 中 每 个 属性 都 占 4 字 节 ， 不 再 袭 述 。 现 在 还 是 继 











5-37 的 第 4 行 。 




































































程序 段 


A 


和 朱 





为 0， 似乎 很 奇怪 ， 这 表示 该 段 的 起 始 是 从 文 伯 


， 由 于 kernel.bin 已 经 是 链接 后 的 可 执行 






























































2 个 粗 下 画 线 值 为 0x00000000， 该 位 置 是 









































是 代码 啊 ， 这 是 要 闸 哪 样 ? 好 吧 ， 到 底 是 什么 情况 ， 一 会 儿 咱 们 细 说 。 
3 个 粗 下 画 线 值 为 0xc0001000, 该 位 置 是 p_vaddr 属性 , 表示 本 段 被 加 载 到 内 存 后 的 起 始 虚 拟 地 址 。 
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条 



























































看 到 这 
不 知 您 
































里 ,似乎 觉得 上 面 的 p_offset 为 0 有 那么 
想到 了 点 什么 ? 咱们 先 把 剩 下 的 说 完 。 















































































































































内 的 偏 移 量 。 这 个 1 
分 不 是 elf header 吗 ? 不 














局 移 量 


1 个 粗 下 画 线 值 为 0x00000001， 该 位 置 是 p_type 属性 ， 值 为 1， 即 表示 PT LOAD 类型， 可 加 载 
程序 啦 ， 所 以 ， 这 PT_LOAD 类 型 符合 我 们 的 认 知 。 
p_offset 属性 ， 表 示 本 段 在 文 从 


F 头 开始 也 算 起 啦 ， 文 件 开头 的 间 





点 合理 啦 , 结合 elfheader 中 的 e_entry 的 值 为 0xc0101500， 























































































































第 4 个 粗 下 画 线 值 为 0xc0001000， 该 位 置 是 p_paddr 属性 ， 它 通常 和 p_vaddr 值 一 致 ， 但 该 属性 是 保 
留 项 ， 咱 们 不 用 关注 。 

第 $ 个 粗 下 画 线 值 为 0x00000505， 该 位 置 是 p filesz 属性 ， 表 示 本 段 在 文件 中 的 字 节 大 小 。 

第 6 个 粗 下 画 线 值 也 应 该 是 0x00000505， 该 位 置 是 p_ memsz 属性 ， 表 示 本 段 在 内 存 中 的 大 小 ， 因 为 
段 无 论 在 哪里 ， 逻 辑 大 小 是 不 变 的 ， 故 该 值 等 于 p_filesz。 

第 7 个 粗 下 画 线 值 为 0x00000005, 该 位 置 是 p flags 属性 ,表示 与 本 段 相关 的 标志 。5=4+1=PF_R+PF_X， 
在 此 表示 可 读 ， 可 执行 ， 根 据 此 属性 ， 我 们 推测 此 段 为 代码 段 。 

第 8 个 粗 下 画 线 值 为 0x00001000， 该 位 置 是 p_align 属性 ， 表 示 本 段 对 齐 的 方式 。 

第 一 个 段 咱 们 说 完了 ， 第 二 个 段 这 里 就 不 解释 啦 ， 留 着 大 家 自己 练 手 吧 。 咱 们 现在 解决 第 一 个 段 的 





p_offset 为 0 的 疑惑 。 


按 
还 是 在 
哈哈 )， 

@ 
















































































理 说 ， 或 者 按 咱 们 想像 来 说 ，p_offset 的 值 不 应 该 为 0，] 
没有 节 (section) 的 情况 下 。 虽 然 此 程序 kernel.bin 在 实际 加 载运 行 时 
但 既然 是 来 学 习 的 ， 有 疑惑 咱们 必须 得 摘 清 楚 。 现 在 咱们 根 
程序 的 入 口 地 址 e_entry 的 值 为 0xc0101500。 

程序 的 第 一 段 在 内 存 中 的 虚拟 地 址 p_vaddr 的 值 为 0xc0001000。 









































其 值 至 少 要 跨 过 elf header 和 程 














人 AN 




















序 头 表 ， 


问题 都 没有 《我 试 过 啦 ， 








居 实 际 





EE 














推测 一 下 ， 














这 











己 知 条 件 : 
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第 5 章 保护 模式 进 阶 ， 向 内 核 迈进 


。 程序 的 第 一 段 的 大 小 p_filesz 是 0x00000505。 











由 这 三 个 已 经 知 























条 件 ， 至 少 能 看 出 两 件 事 : 














e 由 前 两 个 已 知 条 件 ， 能 看 出 程序 的 入 口 虚拟 地 址 (p_entry〉0xc0101500 跨 过 了 第 一 个 段 的 开头 部 分 

















(p_vaddr) 0xc0001000， 还 超过 了 0x500 字 节 ， 这 总 让 咱们 放 点 心 了 ， 至 少 不 是 把 elf_header 也 当 作 代码 执行 啦 。 


。 第 三 个 已 生 


0xc0001505。 程 序 的 
读 可 执行 ) 这 说 明 该 段 的 实际 代码 长 度 是 0xc0001505-0xc0101500=5 字 节 。 




















[条件 说 该 段 长 度 是 0x505， 这 表示 该 段 的 最 后 一 字 节 是 0xc0001000+0x505= 
起 始 地 址 是 0xc0001500， 该 段 又 是 代码 段 ( 从 该 段 的 段 标志 p_flags 值 为 5 看 出 : 可 


















































口 ] ， 


很 多 ， 这 里 咱 人 








排除 疑惑 最 简单 的 方法 ,就 是 验证 下 地 址 0xc0101500 处 的 代码 是 不 是 正确 的 ,代码 5-5 中 的 while(1); 
这 句 话 是 个 死 循 环 ， 


想像 一 下 ， 如 果 这 个 死 循环 对 应 到 汇编 代码 ， 八 成 是 变 成 “jmp 标号 ”类 似 这 样 的 语 




















而 这 个 标号 在 











门 用 gcc 提供 的 方法 。 





用 译 过 程 中 会 被 编译 器 蔡 换 为 具体 的 地 址 。 我 们 先 看 一 下 是 不 是 这 样 ， 怎 么 看 呢 ? 方法 















































瑟 


们 之 前 说 过 啦 ，e 代码 会 先 被 转换 成 汇编 代码 ， 这 个 中 间 过 程 如 果 




















不 干涉 编译 器 的 话 咱 


会 } 



























































们 是 看 不 到 的 ， 转 瞬 即 逝 ， 至 少 gcc 编译 会 在 临时 目录 中 建立 临时 文件 ， 使 用 完成 后 
如 果 大 家 感 兴 趣 ， 在 gcc 编译 时 可 以 加 个 参数 -v (verbose)， 这 样 就 会 输出 元 余 的 内 















































理 得 干 干净 净 。 















































容 ， 从 而 展示 出 编译 


参数 告诉 gcc: 转 ] 


main.S 有 

















过 程 的 更 多 细节 。 话 说 多 啦 ， 咀 们 要 想 查 看 转换 后 的 汇编 代码 ， 要 加 个 -S 参数 ， 这 个 



































如 图 5-38 所 示 ， 














换 成 汇编 后 就 停止 ， 不 再 进行 编译 链接 。 大 家 可 以 通过 gcc --helplgrep \-S' 来 查看 。 
咱们 如 此 保 作 一 下 ， 过 程 如 图 5-38 所 示 。 [work@localhost kernel]$ cat -n main.c 





















































main.c 最 终生 成 的 汇编 代码 ep 














12 行 ， 其 中 实际 的 指令 部 分 只 有 三 行 ， a 

















我 已 经 用 方 框框 出 来 了 ， 里 面 的 汇编 代码 风格 是 。 impsapeonpoashamnaE 
AT&T。 
































.text 表示 下 面 姑 








[work@localhost kernel]$ gcc -S -o /tmp/main.S main.c 
[work@localhost kernel]$ cat -n /tmp/main.S 
.file "main.c" 


F 台 定 义 代码 ， 所 以 从 第 2 行 2 .text 

















.globl _start 














的 .text 看 出 , main.c 确实 被 汇编 成 了 代码 段 , 由 gcc at 
编译 在 第 3 行将 _start 导出 为 全 局 符号 ， 并 在 第 4 Pe me wD 

行 声明 _start 是 个 函数 。 方 框 中 的 第 $~7 行 是 一 些 .2 

准备 工作 ,属于 堆栈 框架 的 例行公事 ,之 前 咱们 也 et 




















.ident “GCC: (GNU) 4.4.6 20120305 (Red Hat 4.4.6-4)" 


提 到 过 它 y 之 前 也 说 过 以 后 会 讲 ， 不 过 不 是 现在 》 .Section .note.GNU-stack,"",@progbits 


还 没 到 时 候 。 相 信 我 ， 以 后 咱们 会 结合 实例 讲述 它 
目前 咱们 不 管 它 啦 。 重 点 是 第 7 一 8 行 的 标号 
和 代码 ，jmp .L2。 它 们 就 是 对 应 于 C 语言 中 的 while(1)。 


的 ， 











[work@localhost kernel]$ 









































A 图 5-38 ”main.s 生成 的 汇编 代码 main.S 





















































答案 也 差不多 能 揭晓 了 , 现在 只 要 看 看 实际 可 执行 文件 中 的 机 器 码 就 行 了 , 我 们 查看 一 下 在 kernel.bin 
中 起 始 虚拟 地 址 处 的 内 容 。 
起 始 虚拟 地 址 只 是 个 对 应 于 内 存 中 的 地 址 , 程序 在 内 存 中 才 用 得 着 它 ,现在 我 们 通过 虚拟 地 址 来 计算 










































































它 在 文件 内 的 位 置 ， 也 就 是 需要 将 其 转换 成 在 文件 中 的 偏 移 量 。 程 序 的 入 口 虚拟 地 址 p entry 是 
0xc0101500, 第 一 个 段 的 起 始 虚 拟 地 址 p_vaddr 为 0xc0001000, 并 且 第 一 个 段 在 文件 内 的 偏 移 量 为 0， 故 ， 


起 始 虚 拟 地 址 e entry 对 应 在 文件 

































































到 





偏 移 量 为 0xc0101500-0xc0001000+ 0=0x500。 将 其 换算 成 十 进 制 为 



































1280。 还 是 小 心 起 见 ， 这 个 偏 移 量 肯 定 不 能 超过 文件 大 小 ， 该 文件 大 小 为 1777 字 节 ， 验 证 通过 。 这 下 可 





以 用 
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xxd.sh 脚本 检查 kernel.bin 偏 移 为 1280 处 的 5 个 字 节 啦 。 过 程 如 图 5-39 所 示 。 





[work@localhost kernel]$ 11 kernel .bin 

-rwxrwxr-x。1 work work 1777 10 有 13 21:36 

[work@localhost kernel]$ sh ~/my_workspace/tool/calculator.sh 0x500 d 
1280 


[work@localhost kernel]$ sh ~/my_workspace/tool/xxd.sh kernel .bin 1280 10 
0000500: 55 89 ES5 EB FE 47 43 43 3A 20 Ursa2000: 
[work@localhost kernel]$ 目 











4 图 5-39 可 执行 文件 中 的 机 器 码 




















如 图 5-39 所 示 ， 





























中 


为 了 让 大 家 放心 ， 在 这 上 j xxd.sh 脚本 在 文件 kernel.bin 偏 移 1280 字 节 处 查看 了 


10 字 节 的 内 容 , 其 实 前 5 字 节 就 够 啦 , 咱们 前 面 已 经 判断 出 该 代码 段 只 有 5 字 节 大 小 .前 5 字 节 是 pushl%oebp 
的 机 器 码 55、movl %esp，%ebp 的 机 器 码 89e5.jmp .L2 的 机 器 码 ebfe。 

由 于 前 面 第 2 一 $ 个 字 节 的 值 并 不 在 字符 编码 的 范围 ， 所 以 只 显示 成 .'， 虽 然 第 一 个 字 节 0x55 显示 成 
了 大 写字 符 U， 但 它 可 不 是 字符 ， 人 家 0x55 是 pushl %ebp 的 机 器 码 ， 显 示 区 只 是 尽力 按照 可 打印 编码 来 
显示 ， 所 以 难免 有 些 误导 观众 。 另 外 ， 左 边 有 10 个 字 节 ， 而 右边 的 显示 区 只 看 到 9 个 ， 原 因 是 后 面 的 字 
“GCC: ”末尾 还 有 个 空格 符 。 

问题 似乎 解决 啦 ， 估计 您 心里 似 对 有 个 个 疑问 ，pushl %ebp 的 机 器 码 55 是 我 说 的 ， 不 是 我 从 哪里 查 出 来 的 ， 
怎么 能 证 明 以 上 的 机 器 码 就 是 对 应 这 些 汇编 指令 呢 ? 为 有 这 种 想法 的 同学 点 赞 ,， 就 冲 您 这 严 说、 一 丝 不 有 的 劲 
儿 ， 绝 对 是 做 技术 的 料 。 最 好 的 验证 方法 就 是 上 虚拟 机 上 实际 跑 一 下 ， 在 虚拟 机 里 面 能 够 直接 看 出 机 器 码 。 
做 事 就 做 彻底 点 吧 ， 为 了 让 大 家 相信 ， 本 来 图 5-40 应 该 是 下 一 节 要 讲 的 ， 现 在 提前 给 大 家 过 目 啦 。 
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性 

















(9) [9x900600061500] 90008:c696015600 (unk. ctxt): push ebp 
bochs:3> n 

ext at t=18053088 

(0) [QOx0060000001501] 69068:c960015601 (unk. ctxt): mov ebp, esp 


bochs:4> n 
ext at t=18053089 
(9) [Ox000000001503] 6008:c0091503 (unk. ctxt): jmp .-2 (9xc9001503) 


4 图 5-40 汇编 指令 的 机 器 码 


图 5-40 所 示 最 右边 的 那 一 列 十 六 进 制 数字 就 是 各 行 指令 的 机 器 码 , 指令 “push ebp” 对 应 的 机 器 码 是 0x55。 
这 下 问题 真 地 解决 啦 ， 在 放心 之 余 ， 我 们 还 可 以 用 Linux 的 命令 readelf 来 确认 一 下 ，readelf 命令 从 
名 字 上 就 能 看 出 它 的 使 命 : 读 出 elf 文件 的 信息 。 为 了 让 大 家 把 重点 信息 一 次 看 全 ， 需 要 给 readelf 命令 加 
个 -e 参数 ， 该 参数 的 意义 如 图 5-41 所 示 。 
-e 参数 相当 于 '-h' + '-1 +'-S'， 能 让 大 家 看 到 elf header(file header)、program header 和 section header。 
执行 结果 如 图 5-42 所 示 。 
































































































































[work@localhost kernel]$ readelf -e kernel.bin 


7f 45 4c 46 01 01 01 00 00 00 00 00 00 00 00 00 

ELF32 
2's complement, little endian 
1 (current) 
[| 

ABI Version: 9 

Type: EXEC (Executoable file) 

Machine: Intel 80386 

Version: exl 

Entry point address: 0xc0001500 

Start of program heoders: S52 (bytes into file) 

Start of section headers: 1372 (bytes into file) 

FLags: 0 

Size of this header: 52 (bytes) 

Size of program heoders: 32 (bytes) 

Number of program headers: 2 

Size of section heoders: 40 (bytes) 

Number of section headers: 6 

Section header string table index: 3 


Section Headers: 


[Nr] Nome Type Addr Off Size ES Flg Lk Inf Al 
NULL 00000000 000000 000000 00 9 0 9 


,text PROGBITS C0001500 000500 000005 00 AX 4 
.Comment PROGBITS 00000000 000505 00002c 01 MS 1 
.Shstrtab STRTAB 00000000 000531 00002a 00 1 
SYMTAB 00000000 00064c 000080 10 4 
STRTAB 00000000 0006cc 000025 00 1 
[work@localhost kernel]$ readelf --help 
Usage: readelf <option(s)> elf-file(s) 
Display information about the contents of ELF format files 
Options are: 
-a --all Equivalent to: -h-L-S-s-r-d-V-A-I 
-h |--file-header Display the ELF file header 


W (write)，A (alloc), X (execute), M (merge), S (strings) 
I Cinfo), L (link order), G (group), x (Cunknown) 
0 (extra 05 processing required) o (0S specific), p (processor specific) 


0ffset VirthAddr ”PhysAddr “FileSiz MemSsiz FLg ALign 
0x000000 0xc0001000 0xc0001000 0x00505 0x00505 RE 0x1000 
GNU_STACK 0x000000 0x00000000 0x00000000 0x00000 0x00000 RW 0x4 


-L |--program-headers Display the program headers 
--Ssegments An alias for --program-headers 

-S |--section-headers Display the sections' header 
--Sections An alias for --section-headers 

-9 --Section-groups Display the section groups 

-t --section-details Display the section details 


Equivalent to: -h -1 -9 


Section to Segment mapping: 
Segment Sections... 
9 text 
[2 

[work@localhost kernel]$ 目 


























全 图 5-41 readelf 部 分 帮助 和 图 5-42 readelf 输出 
大 家 对 照 着 前 面 的 分 析 结 果 ， 在 图 5-42 上 对 比 一 下 吧 ， 结 果 非 常 吻合 (毕竟 xxd 命令 和 readelf 命令 
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的 输出 都 是 从 同一 文 

















本 节 到 此 就 结束 啦 








牛 中 读 出 来 的 ， 如 果 不 吻 
section 和 segment 时 有 用 过 readelf， 当 时 有 说 过 程序 的 输出 ， 这 里 不 再 歼 述 啦 ， 大 家 上 


| 记 








合 ， 肯 定 是 











xxd 或 readelf 自己 的 问题 )。 



























































， 有 





学 习 过 程 已 经 到 








E 解 了 中 

















5.3.5 ”将 内 核 载 入 内 存 











下 二 

















还 有 一 些 要 用 到 


我 们 让 





9 们 肯定 也 要 用 C 语言 。 


[多 



































传 到 了 最 后 一 个 选手 的 手 











们 所 讲 的 部 分 ,在 下 一 节 中 , 


的 地 方 。 大 家 也 不 要 因 
我 在 此 过 程 中 一 定 会 尽 我 所 能 让 内 容 简单 易 接 
的 内 核 文件 是 kernel.bin， 这 个 文件 是 
有 EE。 也 就 是 说 ， 咱 


关 elf 格式 的 内 容 已 经 够 用 啦 ， 到 此 也 ; 









































出 


受 。 


ls} 





I 

















下 说 是 大 家 ， 我 都 有 点 卫生 了 呢 ， 不 过 好 在 操作 很 简单 ， 写 之 前 让 我 们 9 
MBR 写 在 了 硬盘 的 第 0 
拥挤 呢 。 因 此 1loader 写 在 人 硬盘 的 第 2 扇 


何必 搞 得 


B 么 














入 感情 的 话 ， 今 后 的 
必 灰 气 馒 (其 实 突然 不 用 


loader 将 


























[多 














> 

















于 咱们 前 面 在 讲述 
己 琢磨 下 吧 。 

竹 千 一段落。 相信 大 伙 儿 经 过 理论 + 实践 的 
们 要 利用 所 学 的 elf 知识 将 kernel.bin 加 载 到 内 存 中 运行 。 





其 实 ， 我 们 等 了 这 一 刻 好 久 好 久 ， 即 使 我 不 说 ， 大 家 也 有 这 样 的 认识 ，Linux 内 核 是 用 c 语言 写 的 ， 
[ 作 只 是 大 部 分 (99%) 都 要 用 C 语言 来 写 ， 
还 会 想 它 呢 ， 这 不 是 玩笑 )， 














航 











从 硬 





盘 上 读 出 并 加 载 到 内 存 中 的 ， 到 


此 ， 接 力 棒 





















































让 











区 ， 所 以 





第 2 一 4 





2 











没有 接着 第 5 





扩展 , 得 预 留 出 硬盘 空间 , 二 是 您 可 能 已 经 预计 到 了 ， 隔 天 
好 ， 既 然 已 经 确定 了 写 入 扇 区 的 位 置 ， 我 们 还 是 要 通过 dd 
dd if= kernel.bin of=/your_path/hd60M.img bs=512 count=200 seek=9 conv=notrunc 
区 (第 0 一 8 个 扇 区 )， 我 们 在 第 9 个 扇 区 写 入 。 





seek 为 


到 














区 不 能 
区 写 ， 而 











日 
候 








区 ， 


用 啦 ， 从 第 5 
选 的 第 9 扇 区 ( 





罩 . 


第 1 扇 区 是 空 





























区 起 我 





书 


阳 





着 的 ， 后 
区 ， 由 于 loader.bin 
门 可 以 
是 起 始 为 1 的 话 


:| 
~ 





大 











门 需要 事先 把 kernel.bin 定 入 硬盘 。 好 久 不 往 虚拟 硬盘 上 写 东 
看 看 这 块 虚拟 硬盘 上 的 文件 布局 吧 。 
是 个 人 喜好 ， 其 实 不 空 着 也 行 ， 不 过 硬盘 那么 大 ， 








西 了 ， 


四 














目前 的 大 小 是 1342 字 ? 








A 

















1 使 用 。f 



























































9, 目 














count 为 200， 


至 于 为 什么 把 count 设 成 这 么 大 ， 原 因 是 这 检 
们 现在 的 内 核 文件 不 足 4 


能 验证 内 核 











9 正确 性 


。 按 至 


的 是 跨 过 前 9 个 扇 
的 是 一 次 往 参 数 of 指定 的 文件 











F 点 显得 更 放心 , 这 纯 























命 


命令 往 磁盘 上 写 ， 命 令 妇 











可 车 

















F 中 写 入 200 个 扇 区 。 





9， 占 
日 此 时 我 的 强迫 症 又 发 作 啦 ， 我 这 里 
是 第 10 个 扇 区 )。 一 是 为 了 loader 万 一 哪 天 要 
属 是 出 于 个 人 喜好 做 出 的 选择 。 
下 。 

















3 3 个 局 





















































说 ，n 




















让 











每 次 都 要 根 和 


十 


实际 内 核 文 件 大 小 去 改写 count 参数 ， 这 样 就 难免 会 有 忘记 修改 的 情况 。 








文件 变 大 了 ， 
调试 的 
到 位 ， 因 


个 分 全 














为 我 





























HH Y 


不 过 ， 估 计 您 也 觉 





count 忘记 调整 ， 造 成 写 入 硬盘 中 日 
时 候 都 调 晕 啦 ， 看 着 CPU 中 跑 的 指令 我 完全 蒙 
门将 来 的 内 核 大 小 不 会 超过 100KB ， 所 以 直接 把 count 改 为 200 





的 


和 的: 每 次 写 完 内 核 后 ， 咀 们 要 往 磁 盘 




















最 合适 。 





怖 区 ，count=4 





同步 内 核 文件 ， 这 样 才 
不 过 ， 内 核发 展 越 来 越 大 





时 ， 





















































涪 



































pA 











己 判 断 写 入 的 数据 量 ， 如 果 参 数 站 指定 的 文件 


租 参 数 太 多 了 ， 为 了 方便 ， 我 通常 是 把 下 面 


起 完成 ， 您 可 以 将 它们 写成 一 个 
gcc -C -0 main.o main.c && ldmain.o -Ttext Oxc0001500 -e main -0 kemelbin && dd if=kernel.bin of=/ 














基本 ， 脚 本 内 容 如 下 。 


了 ， 根 本 不 是 自己 写 


之 前 我 就 深 受 其 百 ， 内 核 
内 核 文件 不 完整 ， 所 以 到 后 来 ， 程 序 运行 不 受 控 制 ， 以 至 于 








块 肩 























二 从 放 yA 





的 。 悦 然 大 悟 之 后 ， 我 就 干脆 一 步 
区 。 另 外 请 大 家 不 用 担心 ，dd 
体积 小 于 countsbs， 只 按 实际 文件 大 小 写 入 。 























[ie 





your_path/hd60M.img bs=512 count=200 seek=9 conv=notrunc 





































































































































































































编译 、 链 接 、 再 写 入 硬盘 
















































































好 啦 ， 上 面 命令 在 回 车 之 后 ， 我 们 的 内 核 文 件 就 成 功 写 进 磁盘 了 。 

荣 配 好 啦 ， 就 等 下 锅 啦 ， 我 们 的 内 核 是 由 loader 加 载 的 ， 所 以 我 们 还 要 去 修改 下 loader.S。 

loader.S 需要 修改 两 个 地 方 。 

。 加 载 内 核 :需要 把 内 核 文 件 加 载 到 内 存 缓冲 区 。 

e 初始 化 内 核 : 需要 在 分 页 后 ,将 加 载 进来 的 elf 内 核 文 件 安 置 到 相应 的 虚拟 内 存 地 址 ,然后 跳 过 去 
执行 ， 从 此 loader 的 工作 结束 。 

先 说 第 一 个 加 载 内 核 , 这 里 所 说 的 加 载 内 核 只 是 把 内 核 从 硬盘 上 拷贝 到 内 存 中 ,并 不 是 运行 内 核 代码 。 
这 项 工作 在 开启 分 页 前 后 都 可 以 ， 不 过 为 了 简单 ， 咱 们 把 它 安排 在 分 页 开启 之 前 加 载 。 

话说 内 核 加 载 到 内 存 中 ， 得 有 个 加 载 地 址 ， 也 就 是 缓冲 区 。 其 实 开 发 经 验 少 的 同学 对 缓冲 区 这 个 概念 
总 是 觉得 有 点 “只 可 意 会 不 可 言传 ”的 意思 。 借 此 机 会 多 说 两 句 。 缓 冲 区 ，buffer， 意 味 存放 物品 的 地 点 ， 
也 就 是 用 于 加 工 处 理 中 和 暂 存 数据 的 地 方 。 生 活 中 的 缓冲 区 例子 有 很 多 ， 比 如 水 杯 是 水 的 缓冲 区 ， 水 不 是 直 
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接 入 口 的 ， 总 有 个 中 间 载 体 作为 中 转 ， 然 后 才 入 口 。 而 且 ， 水 杯 的 作用 相当 于 暖 瓶 或 水 房 的 缓存 ， 咱 们 不 
是 喝 一 口水 就 跑 到 水 房 接 一 口水 ， 而 是 一 次 接 一 大 杯 ， 回 来 慢 慢 喝 ， 这 样 就 减少 了 去 水 房 的 次 数 。 由 此 可 
见 ， 缓 冲 区 ， 既 有 存放 数据 的 空间 之 意 ， 又 有 提高 效率 的 缓存 之 意 。 换 在 计算 机 世界 里 ， 缓 冲 区 必然 也 是 
个 能 存储 数据 的 介质 ， 比 如 咱们 这 里 所 说 的 内 存 。 
好 啦 ， 不 能 扯 太 远 啦 ， 咱 们 的 缓冲 区 设 在 哪里 呢 ? 这 不 是 乱 放 的 ， 得 参考 下 目前 内 存 中 哪个 地 方 还 有 
可 用 的 空间 ， 千 万 不 能 覆盖 了 重要 数据 。 也 许 大 家 首先 想到 的 是 很 久之 前 说 到 的 那个 内 存 布局 图 ， 赞 ， 答 
对 啦 ， 不 过 ， 大 家 不 用 往 前 翻 看 啦 ， 一 向 体贴 的 我 已 经 将 其 重点 部 分 摘 到 这 里 啦 ， 大 家 请 看 图 5-43。 
同样 是 在 很 久 很 久之 前 ， 我 曾经 告诉 过 大 家 ， EBDA (Extended BIOS 
咱们 的 内 核 很 小 ， 所 以 只 需要 在 低 端 IMB 中 安身 aa 
就 够 啦 。 可 是 这 1MB 并 不 完全 都 是 咱们 的 ， 还 有 SE 
好 多 重要 数据 在 这 里 呢 ， 所 以 咱们 要 在 这 1MB 中 | 
再 找 个 一 亩 三 分 地 给 内 核 。 2 Data Area (B10S 数 
在 图 5-43 中 可 用 的 部 分 ,我 用 三 个 勾 给 标 出 来 i 
了 。 中 间 的 那个 勾 似 乎 有 点 不 近 人 情 ， 人 家 MBR 断 向 量 表 
刚刚 结束 使 命 ， 这 就 要 被 覆盖 啦 ……' 确 实 ， 如 果 不 4^ 图 5 43 供应 1MB 中 可 用 内 丰 
履 着 ， 这 512 字 节 就 要 把 这 连续 可 用 的 区 域 隔 开 啦 ， 这 会 儿 不 用 它 ， 将 来 也 要 用 到 。 








内 核 被 加 载 到 内 存 后 ，loader 还 要 通过 分 析 3 
两 份 拷贝 ,一 份 是 elf 格式 









































内 核 映 像 〈 也 就 是 将 程 ) 

将 来 内 核 肯定 是 越 来 越 大 , 为 了 多 预 留 出 生长 空间 , 只 
而 内 核 映 像 要 放置 到 较 低 的 地 址 。 内 核 文件 经 过 loader 解析 后 就 没 用 啦 , 这 样 内 核 映像 将 来 往 高 地 址 处 扩 
也 可 以 覆盖 原来 的 内 核 文件 kernel.bin。 所 以 
kernel.bin， 这 上 
是 觉得 0x70000~0x9fbf 有 0x2fbff=190KB 字 节 的 空间 ， 而 我 们 的 内 核 不 超过 100KB， 够 




















其 elf 结构 将 其 展开 到 
的 原文 件 kernelLbin， 另 一 份 是 loader 解析 elf 格式 的 kernel.bin 后 在 内 存 : 











新 的 位 置 ， 所 以 说 ， 


内 核 在 内 存 中 有 
生成 的 





























| 






































的 各 种 段 segment 复制 到 内 存 后 的 程序 体 )， 这 个 映像 才 是 真 





























































































































了 





咱们 的 结论 是 在 0x7e00~-0x9fbff 这 片区 域 的 高 地 址 中 找 一 亩 
有 我 擅自 做 主 啦 ， 帮 大 家 选 的 是 0x70000。 为 什么 ? 没有 为 什么 ， 随 意 选 的 ， 取 了 个 整 而 已 ， 就 





FE 运 行 的 内 核 。 


们 要 将 内 核 文 件 kernel.bin 加 载 到 地 址 较 高 的 空间 ， 





展 时 ， 
地 给 


























就 行 。 





























好 ， 万 事 俱 备 啦 ， 代 码 走 起 ， 请 大 家 过 目 代 码 5-7。 
代码 5-7 (project/c5/c/boot/loader.S ) 

147 ; 一- 一- 一- 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 加 载 kernel ---------- 
148 mov eax, KERNEL START_SECTOR ; kernel.bin 所 在 的 扇 区 号 
149 mov ebx KERNEL BIN BASE ADDR 

从 磁盘 读 出 后 ， 写 入 到 ebx 指定 的 地 址 
150 mov ecx, 200 ; 读 入 的 扇 区 数 
151 
152 call rd disk m 32 
153 
154 ; 创建 页 目录 及 页 表 并 初始 化 页 内 存 位 医 
1 call setup page 


代码 5-7 属于 loader 的 一 部 分 ， 它 的 作 / 


AAA 


妆 























中 定义 ， 其 值 分 别 为 0x9 和 0x70000。 


AAA 


怀 


全] 
1> 





150 行 的 ecx 为 200, 这 


























] 是 把 内 核 文件 从 硬盘 上 加 载 到 内 存 中 ， 下 硬 
有 148 一 149 行 的 KERNEL START_SECTOR 和 KERNEL BIN_BASE ADDR 在 boot/include/ boot.inc 















































数 count 保持 一 致 ， 原 因 你 懂 的 ， 不 解释 。 


以 上 的 eax、ebx、ecx 是 函数 rd_disk m_ 32 的 三 个 参数 ， 为 


AAA 


怀 


全 
1> 





152 行 的 函数 是 rd_disk_m 32， 用 于 从 硬盘 上 读 取 文 








前 已 经 在 32 位 保护 模式 下 ， 所 以 相 比 之 前 位 
位 变 成 了 32 位 的 ， 函 数 实现 原理 
啦 ， 大 家 一 看 就 明白 哮 

接 下 来 的 第 155 行 就 开始 创建 页 表 啦 ， 才 














啦 。 

















是 读 入 的 扇 区 数 , 这 里 应 该 同 前 








件 。 





相差 无 几 ， 主 要 体现 在 里 面 


F mbr 中 的 函数 























周 用 下面 的 函数 做 准 














简要 说 一 下 。 


掉 用 dd 命令 往 硬盘 上 写 入 内 核 文件 时 的 参 


备 。 








它 的 三 个 参数 已 经 在 上 生 


i 赋值 了 。 由 于 目 














rd disk m 16, rd disk m 32 只 是 版 本 

















16 


























所 























| 的 寄存 器 变 成 了 32 位 。 





所 以 ， 就 不 细 说 














巴 它 放 在 这 是 为 了 让 大 家 知道 代码 5-7 是 加 到 了 哪里 ， 承 上 启 
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下 。setup_page 函数 实现 没 变 ， 无 需 多 说 。 

内 核 加 载 到 缓冲 区 中 后 ， 现 在 该 说 要 修改 的 第 二 处 啦 ， 也 就 是 初始 化 内 核 。 

内 核 文件 kernel.bin 是 elf 格式 的 二 进 制 可 执行 文件 ， 初 始 化 内 核 就 是 根据 elf 规范 将 内 核 文 件 中 
的 段 (segment) 展开 到 (复制 到 ) 内 存 中 的 相应 位 置 。 在 分 页 模式 下 ， 程 序 是 靠 虚拟 地 址 来 运行 的 ， 
无 论 是 内 核 ， 还 是 用 户 程序 ， 它 们 对 CPU 来 说 都 是 指令 或 数据 ， 没 什么 区 别 ， 交 给 CPU 的 指令 或 数 
据 的 地 址 一 律 被 认为 是 虚拟 地 址 。 坦 白 说 ， 内 核 文件 中 的 地 址 是 在 编译 阶段 确定 的 ， 里 面 都 是 虚拟 地 
址 ， 程 序 也 是 靠 这 些 虚 拟 地 址 来 运行 的 。 但 这 些 虚 拟 地 址 实际 上 是 我 们 在 初始 化 内 核 阶 段 规划 好 的 ， 
即 想 安 排 内 核 在 哪 片 虚拟 内 存 中 , 就 将 内 核 地 址 编译 成 对 应 的 虚拟 地 址 。 而 目前 我 们 初始 化 的 是 内 核 ， 
它 在 物理 低 端 1MB 内 存 中 ， 初 始 化 工作 取决 于 这 1MB 物理 内 存 中 哪 块 空间 可 用 ， 所 以 ， 现 在 还 要 看 
图 5-43， 从 中 找 块 合适 的 内 存 空间 来 容纳 内 核 映 像 。 
其 实 大 家 早已 经 知道 内 核 的 入 口 虚 拟 地 址 是 0xc0001500 啦 。 但 现在 大 家 要 假装 不 知道 ,配合 一 下 啊 ， 
3 们 说 一 下 0xc0001500 是 怎么 来 的 。 

物理 内 存 中 0x900 处 是 loaderbin 加 载 的 地 址 ， 在 loaderbin 的 开始 部 分 是 GDT， 它 可 是 必须 要 保留 
下 来 的 ， 可 不 能 覆盖 ， 我 们 不 打算 在 内 核 中 重新 定义 它 ， 以 后 都 要 指望 它 了 。 虽 然 loader 的 工作 结束 啦 ， 
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但 loader 所 完成 的 工作 成 果 咱 们 还 得 继续 发 扬 ， 继 续 用 。 预 计 loaderbin 的 大 小 不 会 超过 2000 字 节 。 所 以 
咱们 可 选 的 起 始 物理 地 址 是 0x900+2000=0x10d0 (不 要 把 注意 力 放 在 这 个 奇怪 的 数 上 ， 偶 然 得 出 的 )。 内 















































存 很 大 ， 但 也 尽量 往 低 了 选 ， 于 是 凑 了 个 整数 ， 选 了 0x1500 作为 内 核 映像 的 入 口 地 址 。 

根据 咱们 的 页 表 ， 低 端 1MB 的 虚拟 内 存 与 物理 内 存 是 一 一 对 应 的 ， 所 以 物理 地 址 是 0x1500， 对 应 的 
虚拟 地 址 是 0xc0001500。 这 就 解释 了 在 5.3.1 节 中 , 链接 命令 ld 中 用 -Ttext 指定 了 代码 段 的 起 始 虚 拟 地 址 ， 
再 把 命令 搬 过 来 给 大 家 看 下 。 


| ld kernel/main.o -Ttext Oxc0001500 -~e main -o kernel/kernel .bin 
好 ， 现 在 咱们 得 说 一 下 初始 化 内 核 的 代码 ， 见 代码 5-8。 
代码 5-8 (project/c5/c/boot/loader.S ) 

















































































































193 ;-—----- 一 -一 一 将 kernel.bin 中 的 segment 拷贝 到 编译 的 地 址 “”------------ 
194 kernel init: 
195 Xor eax, eax 
196 XOLF ebx, ebx ;ebx 记录 程序 头 表 地 址 
197 XOr ecx, ecx ;cx 记录 程序 头 表 中 的 program header 数量 
198 xor edx, edx ;dx 记录 program header 尺寸 , 即 e_phentsize 
99. 
200 ov [KERNEL BIN BASE ADDR + 42] 
。 偏 移 文件 ， 42 字 囊 处 的 届 性 是 e。 phentsize， 表 示 program header 大 小 
201 mov ebx, [KERNEL BIN BASE ADDR + 28] 
; 偏 移 文件 开始 部 分 28 字 节 的 地 方 是 @e phoff 














表示 第 1 个 program header 在 文件 中 的 偏 移 量 
































202 ; 其 实 该 值 是 0x34， 不 过 还 是 谨慎 一 点 ， 这 里 来 读 取 实际 值 
203 add ebx, KERNEL BIN BASE ADDR 
204 mov cx, [KERNEL BIN BASE ADDR + 44] 














; 偏 移 文件 开始 部 分 44 字 节 的 地 方 是 e_ phnum， 表 示 有 几 个 program header 





205 .each segment: 





















































206 cmp byte [ebx + 0], PT NULL 

; 若 p_type 等 于 PT_ NULL， 说 明 此 program header 未 使 

207 je .PTNULL 

208 

209 ;为 函数 memcpy 压 入 参数 ， 参 数 是 从 右 往 左 依然 压 入 
; 函数 原型 类 似 于 memcpy ( qst，src，size ) 

210 push dword [ebx + 16] 








; program header 中 偏 移 16 字 节 的 地 方 是 p_filesz 
; 压 入 函数 memcpy 的 第 三 个 参数 : size 



































2 二 mov eax [ebx + 4] ; 距 程序 头 偏 移 量 为 4 字 节 的 位 置 是 p_offset 
212 add eax, KERNEL BIN BASE ADDR 
; 加 上 kernel .bin 被 加 载 到 的 物理 地 址 ，eax 为 该 段 的 物理 地 址 
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5.3 加载 内 核 
2 push eax ; 压 入 函数 memcpy 的 第 二 个 参数 : 源 地 址 
214 push dword [ebx + 8] ” 压 入 函数 memcpy 的 第 一 个 参数 . 目的 地 址 
; 偏 移 程 序 节 的 位 置 是 p_vaddr， 这 就 是 目的 地 址 
215 call me - 调 mem_cpy 完成 段 复制 
216 add esp，12 ; 清理 栈 中 压 入 的 三 个 参数 
217 PINULLES 
218 add ebx， edx ; edx 为 program header 大 小 ， 即 e_phentsize 
;在 此 ebx 指向 下 一 个 program header 
2:1:9 loop .each segment 
220 ret 
221 
222 ;----- 一 一 一 逐 字 节 撕 贝 mem cpy ( dst，src，size ) ------------ 
223 ;输入 : 栈 中 三 个 参数 ( dst，src，size ) 
224 ;输出 :无 
0 
226 mem cpy 
227 他 二 总 
228 push ebp 
229 mov ebp, esp 
230 push ecx ; rep 指令 用 到 了 ecx 
; 但 ecx 对 于 外 层 段 的 循环 还 有 用 ， 故 先入 栈 备份 
231 mov edi, [ebp + 8] Pa 区 直上 
2:3.2 mov esi, [ebp + 12] LE 
233 mov ecx, [ebp + 16] ; Size 
234 rep movsb ; ” 逐 字 节 拨 贝 
235 
236 ;恢复 环境 
2337 pop ecx 
238 pop ebp 
239 ret 
对 于 可 执行 程序 ， 我 们 只 对 其 中 的 段 (segment) 感 兴趣 ， 它 们 才 是 程序 运行 的 实质 指令 和 数据 的 所 



































在 地 ， 所 以 我 们 要 找 出 程序 中 所 有 的 段 。 
函数 kernel init 的 作用 是 将 kernel.bin 中 的 段 








些 段 单独 提取 到 内 存 ， 





(Csegment)， 如 果 段 类 型 不 是 PT_ NULL ( 
现在 内 核 已 经 被 加 载 到 KERNEL BIN BASE ADDR 地 址 处 ， 该 处 是 文件 











， 这 就 是 平时 所 说 的 内 存 ! 
空 程序 类 





























序 中 ,遍历 段 的 方式 是 指向 第 




















程序 开头 42 字 
存储 段 头 大 小 ， 这 样 ， 每 遍历 一 
为 了 找到 程序 中 所 有 








个 和 


人 程序 头 后 ， 每 次 增加 一 个 段 头 的 大 小 ， 
的 访问 内 存 ， 在 第 200 行 ， 我 们 用 寄存 器 dx 来 





节 处 。 为 了 以 后 遍历 段 时 方便 ， 避 免 了 频繁 
个 段 头 时 ， 就 直接 从 dx 中 获取 段 头 大 小 ， 
的 段 ， 必 须要 获取 程序 头 表 。 在 文件 开 








(segment) 拷贝 到 各 段 
的 程序 映像 。kernel_init 的 原理 是 分 析 程 序 中 的 每 个 段 
型 )， 就 将 该 段 拷贝 到 编译 的 地 址 中 。 














自己 被 编译 的 虚拟 地 址 处 ， 将 这 



































头 elf header。 在 我 们 的 程 
该 属性 位 于 偏 移 











即 e_phentsize。 





AAA 























这 将 在 第 218 行 体现 。 











头 偏 移 28 字 节 处 是 属性 








表示 








e_phoff， 该 属性 


程序 头 表 在 文件 中 的 偏 移 量 ， 程 序 头 表 是 程序 头 program header 的 数组 ， 所 以 e_phoff 也 就 是 第 1 个 program 




















header 在 文件 中 的 偏 移 量 。 第 

















我 们 需要 的 是 程序 头 表 的 物理 





201 行 ， 在 内 存 e_phoff 处 取 值 ， 将 得 











地 址 ， 























往生 








内 核 的 加 载 地 址 ， 这 样 才 是 程序 头 表 的 物理 地 址 。 所 以 在 第 
最 终 ebx 寄存 器 作为 程序 头 表 的 基 
1 个 program header。 


序 头 〈program header) 来 描述 





KERNEL BIN_BASE ADDR。 
向 程序 中 的 第 
我 们 已 经 知道 ， 段 是 由 程 

































































于 此 时 的 ebx 还 是 程序 头 表 文件 
203 行为 ebx 加 上 了 内 核 文 件 的 加 载 地 址 








到 的 程序 头 表 偏 移 量 存 入 寄存 器 ebx。 


内 的 偏 移 量 ,所 以 要 将 其 加 上 



























































址 ， 用 它 来 遍历 每 一 个 段 ， 此 时 ebx 指 




















的 ， 


个 程序 头 代 表 一 个 段 。 在 知道 了 第 一 























个 程序 头 的 地 址 后 ， 为 了 遍历 所 有 的 程 ) 
e_phnum 决定 的 , 它 在 elf_ header 中 人 1 
“mov cx, [KERNEL BIN _BASE ADDR + 44]” 将 段 的 数量 赋值 给 寄存 器 cx。 
， 而 且 又 知道 了 程序 头 表 中 段 的 数量 ， 所 以 现在 可 以 遍历 每 一 个 段 





elf_header 中 的 属性 
所 以 在 第 204 行 ， 汇 编 语 扣 
现 7 






































的 信 





全程 序 头 表 地 址 在 寄存 器 ebx : 
息 啦 ， 其 工作 在 代码 第 205 一 220 行 中 完成 。 




















在 第 206 行 ， 程 序 先 
的 宏 ， 
#define PT NULL 0。) 














判断 下 段 的 类 型 
其 值 为 0, 该 意义 表示 空 段 类 型 。 








闻 头 ， 





还 需要 知道 程序 中 程 
高 移 为 44 ,我 们 通常 





字 头 的 数量 ， 也 就 是 段 的 数量 ， 这 是 由 
j cx 寄存 器 来 做 循环 计数 器 ， 





























是 不 是 PT NULL，PT NULL 是 在 boot/include/boot.inc 中 定义 


(PT_NULL 也 可 以 在 Linux 系统 的 /usr/include/elf.h 中 找到 其 定义 : 
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在 第 207 行 ， 如 果 发 现 该 段 是 空 段 类 型 的 话 ， 就 跨 过 该 段 不 处 理 ， 跳 到 .PTNULL 处 ， 也 就 是 第 217 行 。 
首 定 下 一 个 段 是 通过 在 程序 头 表 地 址 处 加 上 一 个 段 的 大 小 e_phentsize 来 实现 的 ，e_phentsize 的 值 咱 
们 已 经 将 其 存储 在 dx 寄存 器 啦 , 所 以 在 第 218 行 , 直接 将 ebx, 也 就 是 当前 program header 地 址 , 加 上 edx， 
ebx 便 指向 了 下 一 个 段 的 program header。edx 的 高 16 位 为 0， 所 以 这 里 用 add ebx， edx 没有 问题 。 
第 209 一 216 行 ， 程 序 中 的 段 通过 mem cpy 函数 复制 到 段 自 身 的 虚拟 地 址 处 。 在 这 里 ， 我 们 涉及 到 了 
函数 调用 约定 的 知识 ， 不 过 为 了 叙述 得 更 清楚 ,在 这 里 我 不 想 简单 地 说 ， 在 下 一 章 中 我 们 专门 拿 出 一 节 来 
说 这 事 儿 。 在 此 我 还 是 本 着 够 用 的 原则 ， 把 用 到 的 部 分 给 您 说 明白 。 
我 们 在 此 实现 的 函数 是 mem_cpy， 不 是 c 标准 库 中 的 memcpy 函数 ， 将 来 我 们 会 在 内 核 中 实现 memcpy。 
memcpy 原型 是 void *memcpy(void *dest, const void *src, size_ tm， 功能 是 将 src 指向 的 地 址 空间 处 的 连续 n 个 
字 节 拷贝 到 dest 指向 的 地 址 空间 。 我 们 得 学 习 它 的 用 法 ， 在 汇编 语言 中 用 mem_cpy 函数 实现 了 它 ， 此 函数 的 
原型 相当 于 mem_cpy(void* dst, void* src, int size)。 所 以 我 们 也 要 提供 三 个 参数 才能 使 用 它 。 这 三 个 参数 都 在 程 
序 头 program header 中 ,所 以 它们 都 可 以 基于 ebx 再 增加 适当 的 偏 移 量 来 得 到 。 大 家 结合 图 5-36 所 示 的 program 
header 结构 ， 很 容易 理解 第 210~~214 行 的 代码 。 

第 215 行 是 调用 mem_cpy， 这 涉及 到 为 该 函数 传 入 参数 的 问题 。 在 汇编 语言 中 传递 参数 的 方法 太 多 了 ， 
原因 是 汇编 语言 太 灵 活 了 ,不 怎么 受 约束 ， 咱 们 可 以 访问 到 的 资源 太 多 了 。 所 以 ， 主 调 函 数 可 以 把 参数 放 在 寄 
存 器 中 ， 也 可 以 放 在 栈 中 ， 而 栈 就 是 内 存 ， 所 以 只 要 大 家 高 兴 ， 也 可 以 把 参数 直接 放 到 某 块 内 存 中 ， 类 似 共享 
内 存 的 方式 来 传递 参数 。 主 调 函 数 以 上 面 任 意 一 种 方式 传递 参数 ， 被 调 函数 都 可 以 轻松 地 拿 到 参数 。 

在 这 里 ， 我 们 把 参数 放 到 了 栈 中 保存 ， 大 家 注意 到 了 ， 参 数 入 栈 的 顺序 是 先 从 最 右边 的 开始 ， 最 后 压 
入 参数 最 左边 的 ， 其 实 这 是 某 种 约定 ， 要 不 ， 为 什么 不 先 把 中 间 的 参数 src 入 栈 呢 ? 既然 主 调 函 数 按照 从 
右 到 左 的 顺序 在 栈 中 压 入 参数 , 被 调 函数 中 必须 分 清楚 这 三 个 参数 分 别 在 栈 中 哪个 位 置 。 栈 是 向 下 扩展 的 ， 
这 一 点 通过 push 指令 压 栈 时 ， 栈 指针 esp 的 值 越 来 越 小 能 体现 出 来 ， 所 以 最 后 压 入 的 第 1 个 参数 离 栈 顶 
(esp 指向 的 地 址 ) 最 近 ， 最 先入 栈 的 第 3 个 参数 离 栈 顶 最 远 。 我 们 来 看 下 在 参数 入 栈 后 并 调用 函数 时 ， 栈 
中 布局 是 什么 ， 还 是 拿 call mem_cpy 为 例 ， 如 图 5-44 所 示 。 

先 说 点 题 外 的 ， 如 图 5-44 所 示 ， 我 们 都 知道 ， 栈 是 从 上 往 下 发 展 的 ， 但 很 少 有 同学 意识 到 栈 底 是 用 

不 上 的 。 从 图 中 可 见 ， 地 址 0xc0000900 处 的 值 为 0， 
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这 并 不 是 咱们 压 入 的 值 。push 操作 的 原理 是 先进 行 栈 底 内 存 地 址 
sub esp，4， 再 mov dword [esp]， 操 作 数 ， 所 以 栈 底 栈 0x00000000 oxc0000900 
处 是 空 的 ， 您 懂 的 。 向 kernel_init 的 返回 地 址 
、 和 、 二 0x00000d41 Oxc00008f 

于 栈 指 针 esp Cb 经 在 loader.S : 被 加 玲 J 下 段 尺 寸 0x00000505 DOO 
Oxc0000000 ， 所 以 其 栈 中 地 址 都 是 内 核 所 在 的 有 6 0070000 | 0xc000081 
Oxc0000000 以 上 的 高 地 址 。 用 call 指令 进行 函数 调用 mem _cpy 的 返 加 地 直 
时 ，CPU 会 自动 在 栈 中 压 入 返回 地 址 ， 由 图 可 见 ， 当 x00000486 0xc00008ec 
ee 2 局 es 、 ebp 3 0x00000000 (push ebp) Oxc00008e8 
调用 kernel_init 函数 时 ， 当 时 的 栈 指针 是 0xc00008fc， esp ,| Ox00000002 (push ecx) Oxc00008e4 
所 以 kernel init 的 返回 地 址 被 存储 在 0xc00008fc 处 。 栈 顶 
栈 中 地 址 0xc00008f8 处 的 内 容 是 提供 给 函数 mem_cpy 人 
的 第 三 个 参数 ， 即 size。 地 址 较 低 的 0xc00008f4 处 是 人 


它 的 第 二 个 参数 ， 即 src 地 址 ，0xc00008f0 处 是 它 的 第 一 个 参数 ， 即 dst。 

在 mem_cpy 的 实现 中 ， 我 们 访问 栈 中 的 参数 是 基于 ebp 来 访问 的 ， 这 通常 意味 着 要 将 esp 的 值 赋 给 ebp。 

| 于 不 知道 ebp 中 的 值 是 不 是 重要 ， 好 的 习惯 是 提前 将 ebp 备份 起 来 ， 这 就 是 在 第 228 行 的 目的 ， 将 ebp 入 栈 

备份 ， 这 样 在 函数 结束 时 能 够 将 其 恢复 。 我 们 在 第 229 行将 esp 赋值 给 了 ebp。 所 以 在 图 5-35 中 标 出 了 ebp 的 

指向 ， 由 于 后 来 在 第 230 行 又 将 ecx 入 栈 ， 故 esp 已 经 小 于 ebp。 
栈 中 每 个 单元 占用 4 字 节 ， 既 然 是 基于 ebp 来 获得 栈 中 的 参数 ， 那 么 如 图 所 示 ， 第 1 个 参数 dst 的 地 

址 是 ebp+8， 第 2 个 参数 src 的 地 址 是 ebp+12， 第 3 个 参数 size 的 地 址 是 ebp+16。 分 别 对 这 些 地 址 用 中 括 

号 取 值 后 ， 便 可 以 得 到 实际 的 参数 。 
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在 继续 往 下 说 之 前 ， 要 给 大 家 介绍 个 数据 复制 小 团队 。 
首先 要 说 一 下 字符 串 “ 搬 运 ” 指 令 族 : movsb 、movsw、movsd。 其 中 的 movs 代表 move string， 后 面 的 b 
尺 表 byte，w 代表 word，d 代表 dword。 所 以 movsb 的 功能 是 搬运 (复制 ) 1 字 节 ，movsw 的 功能 是 搬运 〈 复 
制 ) 2 字 节 ，movsd 的 功能 是 搬运 〈 复 制 ) 4 字 节 。 数 据 从 哪里 来 ， 搬 到 哪里 去 呢 ? 这 三 条 指令 是 将 DS: [E]SI 
指向 的 地 址 处 的 1、2 或 4 个 字 节 搬 到 ES: [EJDI 指向 的 地 址 处 ，16 位 环境 下 源 地 址 指针 用 SI 寄存 器 ， 目 的 
地 址 指针 用 DI 寄存 器 ，32 位 环境 下 源 地 址 则 用 ESI， 目 的 地 址 则 用 EDI。 话说 虽然 这 三 个 指令 叫 字 符 串 指令 ， 
但 它们 可 不 是 只 用 在 字符 串 上 ,因为 字符 串 中 的 字符 不 也 是 按 字 节 来 存储 的 吗 , 任何 数据 在 内 存 中 都 以 字 节 存 
储 单元 来 访问 ， 字 符 串 只 是 表象 ， 本 质 上 是 复制 字 节 ， 所 以 它 更 多 地 被 通用 于 复制 数据 。 

以 上 三 个 命令 只 是 复制 固定 的 字 节 数 ， 每 执行 一 次 就 复制 1 字 节 、2 字 节 或 4 字 节 ， 如 果 大 量 的 数据 
需要 复制 ， 则 需要 连续 的 运行 ， 所 以 要 介绍 另外 一 个 指令 rep。 

rep 指令 是 repeat 重复 的 意思 ， 该 指令 是 按照 ecx 寄存 器 中 指定 的 次 数 重复 执行 后 面 的 指定 的 指令 ， 每 执行 
一 次 , ecx 自 减 1, 直到 ecx 等 于 0 时 为 止 , 所 以 在 用 rep 重复 执行 某 个 指令 之 前 ,， 一定 要 将 ecx 寄存 器 提前 赋值 。 
以 乎 说 完了 ， 但 其 实 还 差点 什么 ， 您 想 ， 如 果 想 要 复制 一 大 块 数据 的 话 ， 总 该 有 人 更 新 数据 的 来 源 和 
目的 地 吧 。 movs[bwd] 只 是 从 [elsi 指向 的 地 址 处 搬运 1、2、4 字 节 到 [eldi 指向 的 地 址 处 , 它 不 会 自动 更 新 [e]si 
和 [eldi。 咱 们 总 不 能 翻来覆去 从 同一 个 源 地 址 搬运 数据 到 另 一 个 相同 的 目的 地 址 吧 。 所 以 ，cld 和 sld 指令 就 
派 上 用 场 了 ， 这 两 个 指令 本 质 上 是 控制 重复 执行 字符 串 指令 时 的 [elsi 和 [eldi 的 递增 方式 ， 递 增 方式 是 指 它 
们 的 值 逐渐 变 大 ， 还 是 逐渐 变 小 ， 也 就 是 说 ， 地 址 是 往 高 地 址 方向 变化 ， 还 是 往 低地 址 方向 变化 ， 这 就 是 所 
说 的 方向 。cld 是 指 clean direction， 该 指令 是 将 eflags 寄存 器 中 的 方向 标志 位 DF 置 为 0， 这 样 rep 在 循环 执 
行 后 面 的 字符 串 指令 时 ，[elsi 和 [eldi 根据 使 用 的 字符 串 搬 运 指令 ， 自 动 加 上 所 搬运 数据 的 字 节 大 小 ， 这 是 
1 CPU 自动 完成 的 , 不 用 人 工 干预 。 比 如 , 执行 一 次 movsd, [elsi 和 [eldi 就 自动 加 4,， 执行 一 次 movsb，[elsi 
和 [eldi 就 自动 加 1。 有 清除 方向 标志 位 就 会 有 设置 方向 标志 位 ，std 是 set direction， 该 指令 是 将 方向 标志 位 
DF 置 为 1， 每 次 rep 循环 执行 后 面 字符 串 指令 时 ，[elsi 和 [eldi 自动 减 去 所 搬运 数据 的 字 节 大 小 。 
也许 CPU 认为 地 址 由 低 向 高 处 发 展 是 理 所 应 当 的 ， 这 无 需 设 置 ， 所 以 此 时 DF 标志 为 0。 当 由 高 地 址 
向 低地 址 发 展 时 ， 这 不 是 正常 自然 的 现象 ， 所 以 需要 强调 一 下 ， 故 要 将 DF 标志 置 为 1 。 
注意 ， 并 不 是 在 任何 字符 串 控 制 指令 中 [elsi 和 [e]di 都 同时 增 减 ， 这 要 看 字符 串 操 作 指 令 是 否 都 用 到 
了 它们 ， 处 理 器 只 会 增加 用 到 的 那个 。 字 符 串 操作 指令 有 很 多 ， 比 如 有 movs[bwd]、ins[bwd] 和 outs[bwd]、 
lods[bwd] 和 stos[bwd],esi 和 edi 并 不 是 被 以 上 三 组 指令 同时 使 用 的 ,只 有 movs[bwd] 才 同时 使 用 esi 和 edi， 
通过 rep 指令 组 合 执行 时 ，esi 和 edi 根据 DF 位 的 值 自 增 或 自 减 。ins[bwd] 从 端口 读 入 数据 到 内 存 的 目的 
地 址 ， 故 只 涉及 到 edi 的 自 增 自 减 。outs[bwd] 把 内 存 中 的 源 数据 写 入 端口 ， 故 只 涉及 到 esi 的 自 增 自 减 。 
lods[bwd] 把 内 存 中 的 源 数 据 加 载 到 寄存 器 al、ax 或 eax， 自 增 自 减 操作 也 只 涉及 esi。 而 stos[bwd] 将 al、 
ax、eax 中 的 值 写 入 到 内 存 中 的 目的 地 址 ， 故 也 只 涉及 edi 的 自 增 自 减 。 
了 啦 ， 在 稍微 扩展 了 一 小 下 之 后 ， 咱 们 回 到 正题 。 
有 了 movs[bdw] 指 令 族 、 重 复 执行 指令 rep、 方 向 指令 cld 和 std， 这 三 剑客 在 一 起 配合 工作 就 能 够 自 
| 复制 任何 大 块 数据 啦 。 万 事 俱 备 ， 回 到 正题 。 
第 227 行 的 cld 指令 其 实 放 在 movsb 之 前 就 行 ， 它 用 于 清除 方向 标志 ， 让 数据 的 源 地 址 和 目的 地 址 ; 
渐 增 大 。 

由 于 外 层 函 数 也 要 用 ecx 作为 遍历 段 的 循环 计数 ， 所 以 您 明白 了 ， 这 里 的 第 230 行为 什么 要 将 ecx 入 
栈 备 份 啦 ， 这 样 在 ecx 用 完 之 后 ， 在 mem_cpy 执行 结束 前 通过 pop 指令 将 ecx 和 ebp 恢复 ， 以 便 外 层 遍 
历 段 的 循环 中 保持 ecx 正确 。 
在 第 231 一 233 行 , 为 复制 工作 所 需要 的 条 件 初始 化 , esi 和 edi 指向 了 要 复制 的 段 的 来 源 地 址 和 目的 地 址 ， 
ecx 是 为 rep 指令 做 准备 的 ,指定 了 调用 movsb 指令 的 次 数 。 在 此 提醒 一 下 ， 段 寄存 器 DS 和 ES 在 进入 保护 模 
式 之 初 就 被 赋 成 相同 的 选择 子 了 ， 它 们 都 指向 同一 个 段 描述 符 ， 故 它们 在 此 工作 正确 ， 请 大 伙 儿 放心 。 

一 切 就 绪 之 后 ， 在 第 234 行 ，rep movsb， 这 三 剑客 团队 就 开始 合作 啦 。 

mem_cpy 返回 后 ， 程 序 流程 回 到 第 216 行 ， 这 是 清理 在 调用 mem_cpy 之 前 在 栈 中 压 入 的 size、src、 
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dst， 这 三 个 参数 共 占 3*4=12 字 节 ， 所 以 将 esp 加 上 12， 于 是 栈 顶 跨 过 了 它们 ， 这 三 个 参数 所 占 的 空间 可 
被 其 他 压 栈 操作 区 盖 。 

每 个 函数 中 都 要 有 个 返回 指令 ， 这 里 用 的 是 ret 指令 ， 以 后 我 们 还 会 接触 到 其 他 返回 指令 。 之 前 在 用 
call 指令 调用 函数 时 , 无 论 是 调用 kernel init, 还 是 mem_cpy，CPU 都 会 将 函数 的 返回 地 址 压 入 栈 中 保存 ， 
这 是 为 函数 体 中 的 ret 指令 准备 的 ， 换 句 话 说 函数 不 会 自己 返回 ， 是 通过 ret 来 返回 的 。ret 指令 将 栈 顶 ! 
的 值 作为 返回 地 址 ， 所 以 , 一 定 要 确保 在 调用 ret 时 ,位 于 栈 顶 处 的 数据 是 正确 的 返回 地 址 。 一 般 情况 下 ， 
我 们 在 函数 体 中 保证 push 操作 和 pop 操作 配套 成 对 ， 正 如 在 mem_cpy 的 实现 中 ， 有 两 个 push 入 栈 操作 ， 
在 函数 返回 前 就 要 有 两 个 pop 出 栈 操作 。 

咱们 的 函数 中 用 的 都 是 ret 近 返 回 指令 ， 所 以 只 会 在 栈 顶 弹出 4 字 节 的 数据 作为 代码 段 的 偏 移 地址 为 
EIP 寄存 器 赋值 ， 从 而 恢复 了 程序 执行 流 。 

介绍 完 内 核 初 始 化 的 函数 kernel_init 后 ， 本 节 代 码 部 分 还 差 一 点 点 没 说 啦 ， 下 面 看 代码 5-9。 


代码 5-9 (project/c5/c/boot/loader.Ss ) 





























































































































































































































































































































… 略 
179 ; 在 开启 分 页 后 , 用 gqt 新 的 地 址 重新 加 载 
180 lgdt [gdt ptr ; 重新 加 载 
181 
了 8 区 入 贡生 2 此 时 和 从 刷新 流水 线 也 浴 间 题 ， 基 让 让 芝 入 六 基站 六 六 让 站 让 全 站 区 让 全 站 关公 全 站 
183 ; 处 在 32 位 下 ， 原 则 上 不 需要 强制 刷新 
; 经 过 实际 测试 没有 以 下 这 两 句 也 没 问 题 
184 ;但 以 防 万 一 ， 还 是 加 上 啦 ， 免 得 将 来 出 来 莫名 其 妙 的 问题 



































185 jmp SELECTOR_CODE :enter kernel ;强制 刷新 流水 线 ， 更 新 gqt 

186 enter kernel: 

POD ET Dn 
188 call kernel init 

189 mov esp, 0xc009f000 

190 jmp KERNEL ENTRY POINT ; 用 地 址 0x1500 访问 测试 ， 结 果 ok 











LO 


在 代码 的 开头 是 咱们 之 前 已 经 完成 的 重新 加 载 GDT， 就 是 将 原来 GDT 的 基地 址 0x900 变 成 
0xc0000900 后 重新 加 载 。 按 理 说 ， 当 前 已 经 是 32 位 环境 啦 ， 而 且 内 核 也 是 32 位 程序 ， 不 需要 “ 显 式 ” 
地 清空 流水 线 。 实 话 实说 ， 之 前 loader.S 中 是 没有 第 185 一 186 行 的 ， 而 且 经 我 简单 测试 后 其 运行 结果 也 
是 正确 的 。 不 过 ,在 调试 过 程 中 有 可 能 会 碰 到 稀奇 古怪 的 问题 ， 当 然 这 绝对 是 人 为 的 错误 ， 不 要 轻易 怀疑 
计算 机 。 对 于 内 核 中 这 类 “灵异 ”事件 ， 咱 们 当然 希望 少 碰 到 ， 某 些 bug 真 地 会 让 人 调试 好 多 天 ， 所 以 为 
了 保险 起 见 ， 还 是 用 无 条 件 跳 转 指令 刷新 了 流水 线 ， 请 大 家 知晓 。 
在 进入 内 核 之 后 ， 我 们 用 的 栈 也 要 重新 规划 了 ， 栈 起 始 地 址 不 能 再 用 之 前 的 0xc0000900 啦 。 为 了 方 
E 编 写 程序 , 我 们 在 进入 内 核 前 将 栈 指针 改 成 我 们 期 待 的 值 , 在 第 189 行 , 我 们 将 esp 改 成 了 0xc009f000。 
比 地 址 的 选择 也 是 根据 图 $5-43。 也 许 有 同学 会 说 ， 为 什么 不 把 esp 选 为 0x9fc00， 这 才 是 最 合理 的 。 没 错 ， 
义 说 得 对 ， 我 们 都 是 会 过 日 子 的 人 ，0x9fc00 确实 是 最 省 空间 的 选择 ， 这 样 做 ， 以 后 的 程序 也 不 会 出 错 。 
日 这 牵扯 到 以 后 要 说 的 pcb， 即 程序 控制 块 《 咱 们 在 以 后 线程 相关 章节 会 细 说 pcb， 这 里 仅 要 求 大 家 对 此 
有 个 浅 表 的 了 解 即 可 )， 每 个 pcb 都 是 自然 页 ， 也 就 是 要 求 4KB 对 齐 ， 即 4KB 的 范围 是 0x000 一 0xfff， 而 
不 是 类 似 0x333 一 0x1332 这 样 的 范围 。 我 们 打算 将 在 4KB 内 的 最 高 地 址 作为 栈 底 ， 如 果 以 0x9fc00 作为 
栈 底 ， 虽 然 不 出 会 什么 问题 ， 但 它 显得 太 个 性 了 ， 比 其 他 pcb 少 了 0x400 字 节 。 所 以 , 为 了 统一 pcb 大 小 ， 
我 们 这 里 选择 栈 底 的 要 求 是 : 它 接近 最 大 可 用 地 址 0x9fbff， 并 且 以 4KB 对 齐 ， 所 以 0x9f000 是 最 合适 的 。 
为 了 打消 部 分 同学 的 疑虑 ， 容 我 再 多 说 两 句 。 我 担心 有 同学 可 能 会 这 样 想 ， 咱 们 loader 加 载 的 物理 地 
址 是 0x900，loader 中 使 用 的 栈 的 栈 底 是 0x900， 栈 是 往 下 发 展 的 ， 在 loader 以 后 的 压 栈 操作 中 ， 并 不 会 
破坏 掉 loader 自身 ， 似 乎 这 种 “完美 ”的 方案 可 以 在 咱们 的 kernel 中 延续 ， 也 就 是 为 何不 让 kernel 的 栈 为 
入 口 地 址 之 下 ? 比如 咱们 这 里 的 入 口 地 址 是 0xc0001500， 也 让 栈 底 esp 为 该 值 有 何不 妥 。 不管 怎么 说 ， 如 
果 有 这 种 想法 ， 说 明 您 是 个 爱 动脑 的 同学 ， 我 会 为 您 悄悄 点 赞 。 其 实 loaderbin 是 纯 二 进 制 文件 ， 而 kernel 
是 ef 格式 的 二 进 制 文件 ， 这 两 者 的 区 别 是 elf 比 纯 二 进 制 文件 多 了 文件 头 ， 纯 二 进 制 文件 相当 于 elf 文件 
中 的 所 有 段 〈segment) 的 集合 。 在 前 面 我 们 分 析 过 啦 ， 程 序 的 入 口 地 址 是 很 可 能 会 在 段 中 的 ， 并 不 是 在 
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段 的 起 始 ， 就 拿 昨 





























们 的 kernel.bin 来 说 ， 代 码 段 的 入 
口 并 不 在 段 的 开头 。 其 实 0xc0001000~0xc0001500 之 间 的 部 分 是 文 伯 























赋值 为 0xc0001500， 如 您 所 料 ， 将 来 内 核 中 有 压 栈 操作 时 一 定 会 破坏 


0xc0001000 一 0xc0001500 之 间 的 部 分 ， 
文 样 做 确实 不 美 啊 。 您 看 ， 嗅 











似乎 破坏 了 也 无 关 紧 要 ， 但 i 














左右 ， 起 始 物理 地 址 是 0x1500， 而 栈 底 若 为 0x9f000， 这 








虽然 它 只 是 文件 头 ， 不 是 实际 代码 ， 
们 的 内 核 预计 70KB 
0x9f000 一 0x1500 约 























为 630KB 的 空间 ， 在 正常 情况 下 ， 栈 是 不 会 碰撞 到 内 核 的 ， 这 样 多 省 心 。 所 
以 ， 兄 弟 们 ， 我 看 还 是 算 了 吧 ， 咱 就 选 个 高 地 址 0x9f000， 就 它 了 。 






























































loader 通过 第 190 行 的 跳 转 指令 进入 内 核 . 这 里 所 见 的 KERNEL ENTRY 














_POINT 是 boot/include/boot.inc 中 定义 的 宏 ， 
是 我 们 用 ld 命令 链接 kernel 时 指定 








文件 布局 如 图 





5-45 所 示 。 








和 内 核 相 关 的 内 容 咱们 和 暂 告 一 段落 ， 在 本 章 的 结束 ， 咱 们 说 说 保护 模式 下 最 内 亮 的 内 容 


特权 级 深入 浅 出 

















打交道 。 











5.4.1 特权 级 那 点 事 





过 这 样 一 番 的 规划 后 ， 现 在 0x$00 一 0x9fbff 可 |) 





其 值 为 0xc0001500， 它 正 





的 代码 段 地 址 ， 这 个 宏 必 须要 与 其 一 











己 的 





内 存 中 ， 咱 们 自 

















所 谓 保护 模式 下 的 “保护 ”， 主 要 体现 在 特权 级 上 ， 以 后 随 着 后 









































可 用 空间 











内 核 文件 kernelbin 








MBR 








丙 核 晓 便 








LOADER (GDT 在 此 ) 











可 用 空间 





0x500 ~ 0x9fbff 为 可 


A[ 冬 | 











内 存 



























































先 给 大 家 笼统 地 介绍 下 特权 级 那 点 事 。 


整个 计算 机 世界 其 实 可 以 分 为 两 部 分 ， 访 问 者 和 受 访 者 。 访 问 者 是 动态 的 ， 具 有 能 动 性 ， 它 3 
问 各 种 资源 。 受 访 者 是 静态 的 ， 它 就 是 被 访问 的 资源 ， 只 能 干 4 








变 ， 受 访 者 的 特权 不 能 变 。 

















它们 只 能 老 老 实 实 地 运行 。 

















5-45 程序 布局 


特权 。 


地 址 是 0xc0001500， 起 始 地 址 却 是 0xc0001000， 入 
F 汰 ， 并 不 是 真正 的 代码 。 真 要 把 esp 


Ox9fc00 


Ox70000 


Ox7c00 


Ox1500 


Ox900 
Ox500 








看 工 作 的 展开 ， 会 越 来 越 多 地 和 它们 


保护 模式 的 安全 性 也 体现 了 “特权 ”: 为 了 维护 计算 机 世界 的 “和 平 ”， 避 免 潜 在 的 危险 ， 对 于 那些 不 
受 控 的 程序 ， 剥 夺 它 们 的 部 分 能 力 ， 使 它们 没有 杀伤 力 ， 计 


E 动 去 访 














“着 等 待 访问 者 光顾 。 访 问 者 的 特权 级 可 以 





拿 开 车 举例 ，CPU 相当 于 汽车 ， 驾 驶 车 的 人 可 以 是 普通 人 ， 也 可 以 是 警察 。 同 样 一 辆 车 ， 只 有 警察 























才能 把 车 开 到 和 警 局 ， 普 





通 人 开 着 这 





局 ， 警 卫 判 断 汽车 是 否 为 警车 的 标准 ， 检 查 司 机 是 否 为 警察 ， 只 要 是 警察 天 


请] 





当前 特权 级 就 是 指 CPU 
门口 就 得 换 一 
变 的 ， 车 还 是 


的 状态 ， 





日 
































私家 车 ， 当 警察 作为 司机 时 ， 它 就 成 了 警车 ， 到 了 警 
建立 特权 机 制 是 为 了 通过 特权 来 检查 合法 性 ， 整 个 计算 机 世界 的 特权 检查 ， 都 是 发 4 






















































































嘟 辆 车 ， 只 是 车 的 角色 在 变 。 开 和 车 的 人 不 同 ， 车 的 

































































访问 “ 受 访 者 ”的 一 刹那 ， 实 际 上 就 是 检查 访问 者 的 特权 级 和 受 访 者 的 特权 级 是 否 





不 知道 各位 看 官 昕 我 说 这 个 例子 后 有 没有 对 特权 有 个 概貌 的 认识 ， 下 玫 


















































匹配 。 

















| 只 


们 从 细 ? 















































CPU 既是 大 脑 ， 又 是 警察 ， 
是 保护 模式 下 特权 级 的 由 来 。 


它 负 责 维护 计算 机 内 的 安全 。 





它 将 程序 














5 上 展开 讨论 。 














j 车 去 警 局 会 被 拦 下 的 ， 在 警 局 门口 的 警卫 说 了 ， 只 有 警车 才能 开 进 警 
的 车 ， 一 律 按 警车 放行 处 理 。 
通 人 的 特权 为 3， 警 察 的 特权 为 0。 当 普通 人 想 把 车 开 进 警 局 ， 到 警 局 
立身 份 为 警察 的 司机 ， 这 就 是 特权 级 变换 ， 而 CPU， 也 就 是 这 辆 车 ， 它 在 硬件 上 始终 是 不 
色 就 不 同 ， 普 通 人 开 ， 这 车 就 是 普通 的 
局 门口 ， 警 卫 便 让 其 通行 。 
E 在 “访问 者 ”在 








拥有 的 权利 分 为 4 个 等 级 ， 这 就 





特权 级 按照 权力 从 大 到 小 分 为 0、1、2、3 级 ， 没 错 ， 数 字 越 小 ， 权 力 越 大 ，0 级 特权 能 力 最 大 ，3 级 特权 


能 力 最 小 。 





0 级 特权 是 我 们 操作 系统 内 核 所 在 的 特权 级 ， 必 须 得 让 操作 系统 处 于 至 高 无 上 的 地 位 ， 这 样 它 的 子 民 








(应 ) 























程序 ) 才 不 会 反 了 天 。 计 算 机 在 启动 之 初 就 以 0 级 特权 运行 ，MBR 是 咱们 所 写 的 第 一 个 程序 ， 它 是 
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含 着 金 钥匙 出 生 的 ， 自 从 它 从 BIOS 那里 
统 的 特权 级 分 布 如 图 5-46 所 示 。 
特权 级 是 人 为 设计 的 ， 各 层 有 各 层 的 使 命 。 

如 图 5-46 所 示 , 特权 这 样 分 级 的 思想 是 计算 机 是 由 操作 系 
统 来 掌控 的 ， 操 作 系 统 只 相信 自己 的 代码 ， 自 己 的 特权 最 高 ， 
越 是 别人 的 程序 越 不 放心 ， 所 以 ， 不 放心 的 程序 特权 就 低 。 

操作 系统 位 于 最 内 环 的 0 级 特权 ， 它 要 直接 控制 硬件 
控 各 种 核心 数据 ， 所 以 它 的 权利 必须 最 大 。 系 统 程序 分 别 位 卫 
1 级 特权 和 2 级 特权 ， 运 行 在 这 两 层 的 程序 一 般 是 虚拟 机 、 驱 
动 程序 等 系统 服务 。 在 最 外 层 的 是 3 级 特权 ， 我 们 的 用 户 程序 
就 运行 在 此 层 ， 用 户 程序 被 设计 为 “有 需求 时 找 操作 系统 ” 所 
即 可 ， 因 此 它 的 权利 最 弱 。 




































































1? 









































棒 的 时 候 ， 它 


已 经 是 像 神 一 样 处 于 0 级 特权 了 。 整 个 系 
特权 级 环 状 结构 


用 户 程序 
权力 沿 径 向 逐 级 降低 

















4 图 5-46 ”特权 级 
以 它 不 需要 太 大 的 能 力 ， 能 完成 一 般 工 作 
了 往 细节 上 说 说 。 

















好 啦 ， 特 权 级 从 大 体 上 就 这 点 儿 事 ， 本 节 到 这 结束 ， 下 节 朋 
5.4.2 TSS 简介 








本 想 着 将 来 在 介绍 用 户 进程 时 下 
用 不 只 涉及 特权 级 ， 还 包括 任务 寄存 器 环境 。 任 务 管理 
































和 讨论 TSS， 但 本 节 中 记 讲 的 特权 级 与 它 有 着 密 不 可 分 的 联系 ，TSS 作 




















E 相 关 的 内 容 ， 为 了 不 干扰 大 家 ， 这 








有 只 介绍 和 特权 





























级 相关 的 内 容 , 待 后 面 用 到 更 多 内 容 时 再 和 读者 细 说 。 
TSS， 即 Task State Segment， 意 为 任务 状态 段 ， 

它 是 处 理 器 在 硬件 上 原生 支持 多 任务 的 一 种 实现 方 
式 ， 也 就 是 说 处 理 器 原本 是 想 让 操作 系统 开发 厂商 入 
长 












































人 一 

















用 此 结构 实现 多 任务 的 ， 人 家 处 理 器 厂商 已 经 提供 了 
多 任务 管理 的 解决 方案 , 尽管 后 来 操作 系统 并 不 买 
这 是 后 话 ， 以 后 再 议 。TSS 是 一 种 数据 结构 ， 它 | 
存储 任务 的 环境 。 咱 们 一 睹 为 快 ， 见 图 5-47。 
TSS 是 每 个 任务 都 有 的 结构 ， 它 用 于 一 个 任务 的 
标识 ， 相 当 于 任务 的 身份 证 ， 程 序 拥 有 此 结构 才能 运 
行 ， 这 是 处 理 器 硬件 上 用 于 任务 管理 的 系统 结构 ， 处 
理 器 能 够 识别 其 中 每 一 个 字段 。 该 结构 看 上 去 也 有 点 
复杂 ， 里 面 众多 寄存 器 都 宫 括 到 这 104 字 节 中 啦 ， 其 
实 这 104 字 节 只 是 TSS 的 最 小 尺寸 ， 根 据 需 要 ， 还 可 
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AN 


于 





9 
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WO 位 图 在 TSS 中 的 偏 移 地 址 








(保留 ) 




















































































































































































































以 再 接 上 个 IO 位 图 , 这 些 内 容 将 在 后 面 章节 用 到 时 补 5 

充 。 这 里 目前 只 需要 关注 28 字 节 之 下 的 部 分 ， 这 里 包 esp2 20 

括 了 3 个 栈 指针 ， 这 是 怎么 回 事 呢 。 (保留 ) i ss1 和 
在 没有 操作 系统 的 情况 下 ， 可 以 认为 进程 就 是 任 CR | i ‘ 

务 ， 任 务 就 是 一 段 在 处 理 器 上 运行 的 程序 ， 相 当 于 某 se 

个 计算 机 高 手 在 脱离 操作 系统 的 情况 下 所 写 的 代码 ， “一代 | 上 

它 能 让 计算 机 很 好 地 运行 。 在 有 了 操作 系统 之 后 ， 程 92 位 TSS 结 构 

序 可 分 为 用 户 程序 和 操作 系统 内 核 程 序 ， 故 ， 之 前 完 0 

整 的 一 个 任务 也 因此 被 分 为 用 户 部 分 和 内 核 部 分 。 

于 内 核 程序 位 于 0 特权 级 ， 用 户 程序 位 于 3 特权 级 ， 所 以 ， 一 个 任务 按 特权 级 来 划分 的 话 ， 实 质 上 是 被 分 

成 了 3 特权 级 的 用 户 程序 和 0 特权 级 的 内 核 程序 ， 这 两 部 分 加 在 一 起 才 是 能 让 处 理 器 完整 运行 的 程序 ,也 

就 是 说 完整 的 任务 要 历经 这 两 种 特权 的 变换 。 所 以 ， 我 们 平时 在 Linux 下 所 写 的 程序 只 是 个 半成品 ， 咱 们 











只 负责 完成 月 
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日 户 态 下 的 部 分 ， 


内 核 态 的 部 分 由 操作 系统 提供 。 
































任务 是 由 处 理 器 执行 的 ， 











变 成 了 另外 一 个 特权 级 。 这 就 3 
权 级 的 栈 , 原因 是 如 果 在 同一 个 栈 ! 
用 一 个 栈 容纳 多 个 特权 级 下 的 数据 ， 栈 容量 
0 特权 级 的 栈 ，3 特权 级 下 也 只 能 用 3 














任务 在 特权 级 变换 时 ， 本 质 








里 器 日 








的 当前 特权 级 在 变换 ， 















































开始 涉及 栈 的 问题 了 ， 处 理 器 














固定 ， 处 理 
































届时 ， 这 利 





容纳 所 有 特权 级 的 数 扩 
时 有限， 这 很 容易 溢出 。 
特权 级 的 栈 。 






































每 个 任务 
况 。 也 就 是 说 ， 











的 每 个 特权 级 下 只 能 有 
一 共 4 个 特权 级 ， 

















二 “个 伍 














只 





又 有 4 个 栈 , 那 为 什么 TSS 1 
段 选择 子 和 偏 移 量 、 
个 任务 最 多 提 

要 想 搞 清楚 这 个 问题 

刚才 已 经 说 过 ， 
动 在 TSS 中 找 同 特权 级 的 栈 ， 
中 哪些 字段 是 目标 

特权 级 转移 分 为 两 类 
调用 返回 指令 从 高 特权 级 返回 












































口 








1 级 栈 的 段 选 择 子 和 偏 移 量 、 
有 4 个 栈 ， 并 不 是 所 有 
， 得 先 弄 
特权 级 在 变换 时 ， 需 要 用 到 不 同 特权 级 下 的 校 ， 当 处 到 
器 硬件 原生 的 系统 级 数据 结构 ， 处 
栈 的 选择 子 及 偏 移 量 。 
， 一 类 是 由 中 断 门 、 


有 3 个 栈 : ss0 和 esp0、ssl 和 espl、 





A 


举 个 例子 ， 处 型 


个 栈 ， 不 存在 一 个 任务 的 某 个 特权 级 下 存在 多 个 同 特权 级 栈 的 ; 
务 “ 最 多 ”有 4 个 栈 。 既 然 一 个 TSS 代表 一 


交叉 引用 会 使 栈 变 得 非常 混乱 , 并 且 ， 
器 位 于 0 特权 级 时 要 


六 



































个 任务 ， 每 个 全 
它们 分 别 代 表 0 级 栈 











ss2 和 esp2? 








2 级 栈 的 段 选择 
的 任务 都 是 这 样 的 。 














子 和 偏 移 量 。 























明白 TSS 中 记录 的 3 个 栈 是 








你 懂 的 ，TSS 是 处 至 





三 





唯一 一 种 能 让 处 下 





到 低 特 权 级 ， 这 是 器 




















对 了 特权 级 




















1 低 到 高 的 情况 ， 由 于 不 知道 目 














F 第 1 种 
目标 栈 的 地 址 i 
这 个 保存 上 
透明 的 ， 
也 就 是 说 ， 除 了 调 ) 





















































进一步 说 ， 





能 ， 即 取决 于 它 最 低 的 4 








己 录 在 某 个 地 方 ， 当 
的 地 方 就 是 TSS。 处 理 
咱们 只 需要 在 TSS 中 记录 好 高 特权 级 的 栈 地 址 便 可 。 
返回 外 ， 处 理 
特权 级 目标 栈 , 所 以 它 一 定 比 当前 使 用 
TSS 中 不 需要 记录 3 特权 级 的 栈 ， 
不 是 每 个 任务 都 有 4 个 栈 , 一 个 外 
竺 权 级 别 。 

















拥有 2、1、0 特权 级 栈 ， 
所 以 可 额外 拥有 1 
它 可 以 额外 拥有 0 特权 级 栈 ， 
高 特权 级 的 过 程 称 为 “向 内 

对 于 第 2 种 
的 。 其 中 一 个 原因 我 想 
权 级 ， 上 哪 找 3 特权 级 的 栈 ? 
特权 级 转移 指令 (如 int、call 

































































] 于 将 特权 分 别 转移 到 2、1、0 级 时 使 用 。 
、0 特权 级 栈 ， 


屋 转 移 ”， 想 想 4 个 特权 级 划分 的 同心 
器 是 不 需要 在 TSS 中 去 寻找 低 特 权 级 目标 栈 
到 3 特 
器 的 向 高 
标 栈 ， 


| 高 特权 返回 
目 您 已 经 猜 到 了 : TSS : 

















处 到 
器 会 E 



































动 地 从 TSS 中 找到 对 


DS 





























, 
喇 





器 只 能 由 低 特权 级 























用 来 


调用 门 等 手段 实现 低 特权 级 转向 高 特权 级 ， 另 一 类 则 相反 ,是 


器 向 高 特权 级 转移 时 再 从 中 取 昌 
应 的 高 特权 级 栈 地 址 ， 这 一 点 对 开 


高 特权 级 转移 ，TSS 中 所 记录 的 栈 是 转移 后 的 





F 吗 的 。 
器 进入 不 同 的 特权 级 时 ， 它 
里 器 当然 知道 


< 


















































用 


一 个 特权 级 
器 在 不 同 特权 级 下 ， 应 该 用 不 同 特 


主 
月 


E 务 
的 
大 家 看 ， 我 在 前 面 说 的 一 


TSS 




















降低 特权 级 的 情况 。 








来 加 载 到 SS 和 ESP 中 以 更 新 栈 ， 





























的 栈 特权 级 要 高 , 只 
天 
E 务 可 有 拥有 
比如 3 特权 级 的 程序 ， 























的 栈 的 数量 


pr = = 


已 征 了 到 


























| 于 向 更 高 特权 级 转移 时 提 化 
为 3 特权 级 是 最 低 的 ， 
取决 于 当前 特权 级 是 否 还 有 进一步 提 
氏 的 特权 级 ， 还 能 








没有 更 低 的 特权 级 会 向 它 转移 。 

















提升 三 级 ， 所 以 可 
































于 将 特权 级 分 别 转移 到 1 
至 高 无 上 了 ， 


、0 级 











0 特权 级 已 经 是 


只 有 这 一 个 0 级 栈 。 


标 特权 级 对 应 的 栈 地 址 在 哪里 ， 所 以 要 提前 把 


发 人 员 是 


a 


局 


t 相 应 特权 的 栈 地 址 。 


高 的 可 
额外 


2 特权 级 的 程序 ， 它 还 可 以 提升 两 级 ， 








时 使 用 。 以 此 类 推 ，1 特权 级 的 程序 ， 


























百 
风 














就 知道 了 ， 高 特权 级 位 于 上 





且 面 。 




















到 低 特 权 级 的 情况 ， 处 到 


























另 一 方面 的 原因 是 低 特权 级 栈 的 











只 记录 2、1、0 特权 级 
bh 址 其 人 

















口 


的 栈 ， 假 如 是 从 2 特权 级 返 





以 上 所 说 的 低 特权 级 转向 























,经 存在 了 ,这 是 由 处 型 





关 














等 ) 实现 的 机 人 





等 我 





巴 后 面 内 容 “ 哆 哑 完 ”您 


就 知道 了 。 








由 于 特权 级 向 低 转 移 后 ， 
找到 对 应 的 低 特 权 级 栈 


特权 级 转移 ， 才 能 谈 得 





呢 ? 正常 情 
上 再 从 高 特权 级 回 到 低 特权 级 ， 茎 








处 理 器 特权 级 有 了 变化 ， 同 样 


况 下 ,特权 级 由 低 向 高 转移 在 先 


























| 决定 的 ， 换 名 话说， 处 到 


也 需要 将 当前 栈 更 导 


CL, 





























器 知道 去 哪里 找 低 特权 级 的 




















所 为 
| 高 向 低 返 回 在 后 ， 即 只 用 





















































否则 没有 “ 























我 也 要 说 清楚 )。 当 处 理 器 
了 转移 后 的 高 特权 级 所 在 的 
iret 从 高 特权 级 向 低 特 权 级 返 
及 偏 移 量 。 由 高 特权 级 返回 

当下 次 处 理 器 再 进入 到 高 
固定 的 ， 每 次 进入 ; 
器 也 不 会 自动 把 该 








































































































1 低 向 高 特权 级 转移 时 ， 
栈 中 ( 随 着 以 后 深入 学 习 大 家 会 
的 高 特权 级 的 栈 ， 
低 特权 级 的 过 程 称 为 “向 外 
它 依 然 会 在 TSS 中 寻找 对 应 


它 自动 地 提 




















明白 这 



































习 时 ， 处 理 器 可 以 从 当前 使 / 


民 转 移 ”。 


























竺 


权 级 时 ， 














镶 特 权 级 都 会 重复 使 
高 特权 级 栈 


它们 。 也 就 
| TSS 中 ， 








a. 
日 














针 更 新 至 


当时 


是 说 ， 即 使 曾经 转移 到 高 特权 级 下 
因为 在 从 高 特权 级 返 


上 2 
研 


氏 特权 级 
一 点 )， 所 


就 谈 不 上 “ 回 ”( 宁 可 被 骂 嘿 
的 栈 地 址 (SS 和 ESP) 
以 ， 当 用 返回 指 
获取 低 特 权 级 的 栈 段 选 


系 ， 


























的 高 特权 级 栈 ， 















































口 





时 ， 处 理 器 需要 把 栈 更 3 














j 过 高 特权 级 栈 ， 处 理 
所 为 低 特 权 


氏 特 权 级 的 栈 ， 它 如 何 
向 更 高 
压 入 
邻 如 retf 或 
择 子 


而 TSS 中 栈 指针 值 都 是 
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级 的 栈 选 择 子 及 esp 指针 ， 而 原 多 
自动 丢弃 。 换 句 话说 ， 如 果 想 

















载 到 寄存 器 GDTR 中 才能 被 处 到 








上 面 光 说 处 理 















































采 留 




















器 从 TSS : 





上 一 次 高 特权 级 的 栈 指针 ， 咱 
找 更 高 特权 级 的 栈 地 址 ， 那 处 理 器 是 怎样 
TSS 是 硬件 支持 的 系统 数据 结构 ， 它 和 GDT 等 一 样 ， 由 软件 填写 其 内 容 ， 由 硬件 使 用 。GDT 也 要 和 




















器 找到 ，TSS 也 是 一 样 ， 它 是 


E 在 段 寄存 器 SS 和 寄存 器 esp 中 高 特权 级 下 的 栈 段 选择 子 及 指针 会 被 处 理 





















































们 得 自己 手动 更 新 TSS 中 相应 栈 的 数据 。 
















































































































































































1 TR (Task Register) 寄存 器 加 载 的 ， 每 


找到 TSS 的 ? 

































































次 处 理 器 执行 不 同 任务 时 ， 将 TR 寄存 器 加 载 不 同 任务 的 TSS 就 成 了 。 至 于 怎么 加 载 以 及 相关 工作 原理 ， 
目前 咱们 用 不 到 ， 还 是 放 在 后 面 说 比较 合适 。 

您 看 ， 正 是 由 于 处 理 器 提供 了 硬件 方面 的 框架 ， 所 以 很 多 工作 都 是 “自动 ”完成 的 ， 虽 然 操作 系统 看 
上 去 是 底层 的 技术 ， 但 其 实 也 属于 “应 用 型 ”开发 。 

好 啦 ，TSS 中 有 关 特 权 级 的 内 容 就 说 到 这 ， 为 了 不 干扰 大 家 学 习 特 权 级 ，TSS 的 其 他 方面 将 会 在 后 续 
章节 中 逐步 说 明 。 


5.4.3 ”CPL 和 DPL 入 门 





签 ” 也 就 是 说 CPU 得 知道 谁 

















我 们 在 工作 


餐 等 。 给 公司 创造 价值 的 是 员 了 
几 ， 既 然 是 用 特权 级 来 








现在 说 计算 























， 公 司 都 给 员工 配 有 员工 
[的 生产 力 ， 不 是 员 












































特权 级 资源 的 违法 行为 。 

























































































































































































FE ， 此 员工 卡 就 是 员工 映 份 的 “标签 ”用 它 来 出 入 公司 、 食 堂 就 

FF， 员 工 卡 只 是 公司 人 事 部 门 管理 员工 的 一 种 手段 而 已 。 

E 护 计算 机 世界 的 和 平 ， 那 总 该 给 每 个 被 管理 的 对 象 加 个 特权 “ 标 

的 特权 高 ， 谁 的 特权 低 ， 这 样 才能 辨识 出 是 否 有 低 特 权 级 的 程序 越级 访问 高 














今 





线 





hl 











们 晶 



































































































































































































































员工 的 标签 体现 在 工 卡 ， 计 算 机 特权 级 的 标签 体现 在 DPL、CPL 和 RPL， 下 面 目 绕 这 几 个 概念 
展开 讨论 。 

先 看 看 访问 者 的 特权 标签 在 哪里 

最 初 我 们 刚 接触 保护 模式 的 时 候 ， 最 先 感受 到 的 区 别 是 访问 内 存 不 像 在 实 模式 下 那么 自由 、 直 接 啦 ， 
在 保护 模式 下 有 了 段 描述 符 ， 访 问 内 存 得 先 经 过 它 才 行 ， 它 的 作用 是 通过 各 种 属性 描述 一 段 内 存 区 域 ， 该 
昔 述 符 就 相当 该 内 存 区 域 的 “身份 证 ”。 

前 情 提要 ，x86 访问 内 存 的 机 制 是 “ 段 基 址 ; 偏 移 地 址 ”， 无论 是 实 模式 ， 还 是 保护 模式 ， 都 要 遵循 
此 方式 。 在 实 模式 下 ， 段 基 址 直接 写 在 段 寄 存 器 中 ， 而 在 保护 模式 下 ， 段 寄存 器 中 的 不 再 是 段 基 址 ， 而 是 
段 选择 子 ， 通 过 该 选择 子 从 GDT 或 LDT 中 找到 相应 的 段 描述 符 ， 从 该 描述 符 中 获取 段 的 起 始 地 址 。 大 伙 
儿 还 记得 选择 子 的 结构 吧 ， 第 0 一 1 位 是 RPL 字段 ， 第 2 位 是 TI 位 ， 第 3 一 15 位 是 段 描 述 符 索 引 ， 好 啦 ， 
可 忆 到 此 为 止 。 咱 们 要 关注 的 就 是 RPL 字段 ， 它 就 是 请 求 特权 级 ， 后 面 讲 RPL 的 时 候 咱们 会 细 说 。 请 求 

的 “请 求 ” 是 个 动词 ， 只 有 具备“ 能动性 ”的 访问 者 才能 做 出 动作 。 


特权 级 ， 





















































话说 四 




















来 了 ， 谁 是 访问 者 ? 计算 机 中 ， 具备“ 能 动听 
求 其 他 资源 的 能 力 ， 指 令 便 是 资源 的 请 求 者 。 指令“ 请 求 ^“ 访 问 ” 其 














=” 的 只 有 计算 机 指令 











， 只 























有 指令 才 具 备 访问 、 请 
由 资源 的 能 力 等 级 便 称 之 为 请 求 特 




















权 级 ， 指 令 存 放 在 代码 段 中 ,所 以 ， 就 用 代码 段 寄存 器 CS 中 选择 子 的 RPL 位 表示 代码 请 求 别人 资源 能 


的 等 级 。 代 码 段 寄存 器 CS 和 指令 
位 于 CS 寄存 器 中 选择 子 低 2 
理 器 的 当前 特权 级 是 CS.RPL。 


以 ， 





码 段 描 

















处 理 器 的 当前 
在 CPU 中 运 














Level)， 





和 


级 实际 


居 段 的 DPL 是 将 














界 ! 
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行 
述 符 中 的 DPL, 便 是 当 








特权 级 的 真实 面目 





是 什么 ? 


























的 是 指令 ， 其 运行 




















已 表示 处 理 








| 























来 处 到 





过 程 中 









































上 是 指 处 理 











器 当前 

















的 特权 地 位 。 目 








次 提醒 大 伙 儿 ， 在 人 有 


到 不 同 特权 的 代码 ， 处 到 


F 意 时 刻 ， 

















指针 寄存 器 EIP 中 指向 的 指令 便 是 当前 在 处 理 





器 中 正在 运行 的 代码 ， 所 

















立 的 值 不 仅 称 为 请 求 特权 级 ， 又 称 为 处 理 器 上 





















































色 ， 更 形象 一 








> 








器 的 特权 级 就 换 到 




















的 当前 特权 级 ， 也 就 是 说 处 








的 指令 总 会 属于 某 个 代码 段 ， 该 代码 段 的 特权 级 ， 也 就 是 代 
前 CPU 所 处 的 特权 级 , 这 个 特权 级 称 为 当前 特权 级 , 即 CPLCCurrent Privilege 
E 在 执行 的 代码 的 特权 级 别 。 除 一 致 性 代码 段 外 
器 的 当前 特权 级 CPL。 
指令 最 终 是 用 处 理 器 执行 的 ， 执 行 
所 处 的 特权 级 ， 是 指 处 理 嚣 的 特权 和 角 1 
前 特权 级 CPL 保存 在 CS 选择 子 中 的 RPL 部 分 。 











(后 面 会 说 )， 转 移 后 的 目标 代码 





























不 同 的 等 级 。 所以， 当前 特权 
点 地 说 ， 是 指 CPU 当前 在 计算 机 世 














当前 特权 级 存储 在 CS.RPL 中 ， 谁 为 代码 段 寄存 器 CS 赋值 的 呢 ? 要 回答 上 国 
器 的 当前 特权 级 为 人 


至 








上 么 会 变化 。 





当前 了 





的 代码 段 转移 到 另 一 个 特权 级 的 代码 段 ] 
份 起 了 变化 ， 这 就 是 当前 特权 级 CPL 改变 
序 执行 流 的 指令 ， 如 int、call 等 ， 这 样 就 使 CS 和 EIP 的 值 改变 ， 从 而 使 处 
码 。 不 过 ， 特 权 转 移 可 不 是 随便 进行 的 ， 处 理 器 要 检查 特权 变换 的 条 件 ， 这 


























E 在 运行 的 代码 所 在 的 代码 段 的 特权 级 DPL 就 是 处 至 





上 执行 时 ， 由 了 





























因为 它 需 


| 十 


要 过 会 / 

















L 结 合 RPL 一 块 说 ， 等 小 第 
寺 权 级 检查 的 条 件 通过 后 ， 新 代码 段 的 DPL 前 
存在 代码 段 寄 存 器 CS 中 的 RPL 位 。 
总 之 ， 代 码 是 资源 的 请 求 者 ， 代 码 段 寄存 器 CS 所 指向 的 是 处 理 
存 器 CS 中 选择 子 的 RPL 位 称 为 当前 特权 级 CPL， 这 是 























的 原因 。 好 像 说 得 有 点 


巴 RPL 给 大 





ij 的 问题 ， 得 先 搞 清楚 处 



































器 的 当前 特权 级 ， 当 处 理 
两 个 代码 段 的 特权 级 不 一 样 ， 处 型 


器 从 一 个 特权 级 
器 当前 的 特权 身 
实 就 是 使 用 了 那些 能 够 改变 程 
里 器 执行 到 了 不 同 特 权 级 的 代 
里 咱们 和 暂 不 讨论 条 件 是 什么 ， 

这 个 “条 件 ” 不 迟 。 当 处 理 器 



















































































i 























Ee 















































it 变 成 了 处 理 























伙 儿 说 清楚 了 再 解释 i 
器 的 CPL， 也 就 是 目标 代码 段 描述 符 的 DPL 将 保 


























器 中 当前 运行 的 指令 ， 所 以 代码 段 寄 




















合理 不 过 的 事 了 。 








RPL 变 成 了 CPL， 人 似乎 有 点 又 是 吗 ? 其 实 只 是 代码 段 寄 存 器 CS 中 的 RPL 是 CPL， 其 他 段 寄 存 器 中 


选择 子 的 RPL 与 CPL 无 关 ， 因 为 CPL 是 针对 具有 “能 动 性 ” 
它 表示 访问 的 请 求 者 ， 所 以 CPL 只 存放 在 代码 段 寄 存 器 CS 中 低 2 
器 的 当前 特权 级 CPL 为 什么 放 在 CS.RPL 中 , CPL 和 CS.RPL 有 什么 





以 上 几 段 


内 容 想 表 达 的 就 是 处 型 



































关系 ， 不 信和 您 再 回头 看 一 遍 。 





大 多 数 情况 下 ， 处 理 器 都 是 在 “访问 者 ”访问 “ 受 访 者 ”时 进 
就 是 当前 特权 级 CPL， 在 进行 特权 检查 时 
标 代 码 段 的 DPL， 导 
进入 保护 模式 后 才 有 的 当前 特权 级 ， 让 我 们 
在 这 之 前 ， 我 和 大 家 说 过 ，MBR 从 BIOS 接 过 接力 棒 
访 模 式 下 才 有 特权 级 ， 而 MBR 运行 用 





是 目 











不 太 合 适 ， 毕 葛 在 保 


日 
































处 班 





























交 给 MBR， 是 


4 





蔡 换 为 0， 如 果 此 时 
























































的 访问 者 (执行 者 ) 来 说 的 ,代码 是 执行 者 ， 
立 的 RPL 中 。 

















|， 都 会 以 CPL 


器 总 该 有 个 初始 CPL 吧 ? 答案 是 肯定 的 ，4 








| 


























忆 下 处 理 器 是 怎么 进入 保护 模式 的 ， 也 许 答案 





行 特权 检查 ， 访 问 者 《〈 某 个 代码 段 ) 的 特权 
为 基础 ， 说 到 这 里 ， 不 禁 我 要 自问 一 下 ， 既 然 CPL 就 
竺 权 级 是 保护 模式 下 的 概念 ， 处 理 器 
就 揭晓 啦 。 
的 时 候 ， 它 已 经 处 于 0 特权 级 啦 ， 其 实 这 么 说 
E 实 模式 下 ， 还 谈 不 上 特权 级 。BIOS 将 控制 权 










































































TY 





























一 个 远 跳 转 指令 实现 的 ， 即 jmp 0: 0x7c00， 也 就 是 说 进入 MBR 后 ， 段 寄存 器 CS 会 被 
巴 CS 看 作 是 选择 子 的 话 ，RPL 的 值 为 0， 也 就 是 说 “相当 于 ”处 于 0 特权 级 ， 段 寄 


















































存 器 CS 为 0 的 情况 一 直 持 续 到 在 loader 中 进入 保护 模式 之 后 “国清 CPt 
的 第 一 条 指令 : 流水 线 刷新 跳 转 。 该 跳 转 语句 如 图 5-48 所 示 。 

大 家 看 图 中 第 132 行 的 jmp 指令 ， 段 选择 子 为 SELECTOR 。 ”“ 图 5-48 loader.S 中 流水 线 刷 新 跳 转 语句 
CODE， 其 RPL 的 值 为 RPLO0，RPLO 定义 在 include/boot.inc 中 ， 其 值 为 0。 选 择 子 的 索引 部 分 值 为 1， 表示 对 
应 GDT 中 第 1 个 段 描述 符 ， 该 描述 符 的 DPL 为 0( 它 是 用 include/bootinc 中 的 DESC_DPL 0 定义 的 ， 图 中 
未 展示 )。 











在 跳 转 之 前 ，CS 为 0， 其 低 2 位 RPL 部 分 为 0， 也 就 是 CPL 为 0， 当 执行 跳 转 指 令 jmp dword 


SELECTOR_CODE: p_mode start 时 , 目标 代码 段 , 即 第 1 个 段 描述 符 的 DPL 为 0, 与 当前 特权 级 一 致 ( 处 


理 器 会 根 和 





所 以 新 的 特权 级 依然 是 0， 该 值 保存 在 段 寄 存 器 CS 的 低 2 位 ， 这 就 是 特级 级 转移 的 粗略 过 程 ， 
持 权 为 0 的 来 龙 去 脉 。 
CPL， 了 咱们 再 看 看 ， 受 访 者 的 特权 标签 在 哪里 。 
性 还 为 该 内 存 标 
竺 权 标 签 。 话 说 ， 不 仅 段 
DPL， 即 Descriptor Privilege Level， 





保护 模式 后 4 

说 完了 
在 段 描 ; 
是 受 访 者 











述 符 中 有 


居 CPL、RPL、DPL 做 特权 级 检查 ， 此 检查 过 程 只 

















们 在 介绍 完 RPL 时 再 讨论 )， 处 理 器 允许 转移 ， 



































个 局 























位 的 原因 了 吧 ， 


两 位 能 表示 4 个 组 


-A 
辐 











计算 机 是 人 发 明 的 ， 
E 低 ， 班 长 有 权限 安排 学 生 打 扫 
打扫 卫生 。 这 就 是 扫 


主任 
任 有 权限 安排 学 4 









































日 





有 了 特权 等 级 ， 这 就 是 段 


也 是 进入 




















述 符 中 的 DPL 字段 的 作用 ， 它 就 
































述 符 

















有 DPL 
苗 述 符 特 权 




















00b、 


01b、10b、11b， 所 有 特权 级 都 齐 了 。 











字段 ， 以 后 所 介绍 的 所 有 描述 符 都 有 DPL。 
级 ， 这 下 您 清楚 为 什么 DPL 字段 在 段 描 





























占 2 
























































] 人 的 思想 来 理 


王后 








解 i 
， 班 主任 有 权 P 























目 有 高 特权 级 的 习 


十 算 机 原 到 











是 再 合适 不 过 的 。 拿 校园 生活 举例 ， 班 长 权限 比 班 
民 查 看 学 生成 绩 。 班 长 没 权 限 查看 学 生成 绩 ， 但 班主 
有 物 可 以 访问 同 级 或 更 低 特权 级 资源 ,而 低 特权 级 的 
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事物 无 法 访问 高 特权 级 资源 的 典型 例子 。 
在 计算 机 中 也 一 样 ，DPL 是 段 描 述 符 所 代表 的 内 存 区 域 的 “门槛 ”权限 , 访问 者 能 否 迈 过 此 门槛 访问 
到 本 描述 符 所 代表 的 资源 ,其 特权 级 至 少 要 等 于 这 个 门槛 , 访问 者 特权 能 否 大 于 该 门槛 ? 这 要 看 受 访 资源 
是 代码 ， 还 是 数据 啦 。 不 难 想像 ， 只 有 有 具备 “能 动 ” 行 为 的 访问 者 才 具 备 访 问 的 能 力 ， 在 计算 机 中 真正 的 
访问 者 是 硬件 CPU， 而 指挥 CPU 行为 (访问 谁 及 如 何 访问 〉 的 是 具有 可 执行 能 力 的 指令 代码 ， 数 据 是 不 
能 访问 别人 的 ， 所 以 我 们 再 强调 一 下 访问 者 就 是 代码 段 中 的 指令 ， 这 对 理解 当前 特权 级 非常 重要 。 

访问 者 任何 时 候 都 不 允许 访问 比 自己 特权 更 高 的 资源 ， 无 论 受 访 资源 是 数据 ， 还 是 代码 。 在 不 涉及 
RPL 的 前 提 下 ， 下 面 咱们 要 分 情况 讨论 啦 。 

对 于 受 访 者 为 数据 段 〈 段 描述 符 中 type 字段 中 未 有 XX 可 执行 属性 ) 来 说 : 
只 有 访问 者 的 权限 大 于 等 于 该 DPL 表示 的 最 低 权 限 才能 够 继续 访问 ， 和 否则 连 这 个 门槛 都 迈 不 过 去 。 
比如 ，DPL 为 1 的 段 描 述 符 ， 只 有 特权 级 为 0、1 的 访问 者 才 有 资格 访问 它 所 代表 的 资源 ， 特 权 为 2、3 
的 访问 者 会 被 CPU 拒 之 门 外 。 

对 于 受 访 者 为 代码 段 〈 段 描述 符 中 type 字段 中 含有 X 可 执行 属性 ) 来 说 : 
只 有 访问 者 的 权限 等 于 该 DPL 表示 的 最 低 权 限 才能 够 继续 访问 ， 即 只 能 平 级 访问 。 任 何 权限 大 于 或 
小 于 它 的 访问 者 都 将 被 CPU 拒 之 门 外 。 这 是 为 什么 呢 ? 自问 自 答 之 前 先 明 确 一 个 概念 ， 对 于 受 访 者 为 代 
码 段 一 这 说 法 , 实际 上 是 指 处 理 器 从 当前 运行 的 代码 段 上 转移 到 受 访 者 这 个 目标 代码 段 上 去 执行 ， 并 不 是 
说 把 该 目标 代码 段 当 数 据 一 样 访问 ， 在 真实 物理 机 器 上 ， 代 码 段 通常 情况 下 是 不 被 当成 数据 来 处 理 的 , 但 
确实 可 以 这 么 做 (话说 虚拟 机 中 会 把 代码 当成 数据 来 处 理 )。 

咱们 先 说 为 什么 比 它 特权 级 更 高 的 代码 也 无 法 “访问 ” 它 ， 即 转移 到 它 上 面 运行 。 

代码 指令 代表 CPU 的 行为 ， 低 特权 级 的 代码 能 做 的 事 ， 高 特权 级 代码 也 能 做 ， 换 句 话 说 高 特权 的 代 
码 不 需要 低 特 权 代 码 的 帮助 ， 正 常情 况 下 CPU 没有 理由 先 自 降 等 级 后 再 去 做 某 事 。 代 码 段 是 CPU 执行 的 
指令 ， 不 是 数据 ， 这 里 所 说 的 “ 受 访 者 为 代码 段 ” 其 实 就 是 指 CPU 从 访问 者 所 在 的 段 转移 到 该 代码 段 上 
去 执行 。 举 个 例子 ，CPU 若 相 当 于 汽车 ， 代 码 则 相当 于 司机 ， 它 指挥 CPU 前 进 的 方向 。 段 的 变换 相当 于 
换 了 司机 ， 特 权 级 较 高 的 代码 段 相当 于 技术 水 平 较 高 的 Fl 车 手 ， 特 权 级 较 低 的 代码 段 相当 于 技术 水 平 较 
低 的 普通 司机 ， 这 辆 车 为 了 充分 展示 性 能 ， 活 得 更 加 精彩 ， 它 始终 希望 它 的 搭档 是 驾驶 技术 高 超 的 Fl 车 
手 ， 要 是 把 搭档 降级 为 普通 司机 ， 它 可 万 万 不 能 答应 啊 。 

不 过 ， 凡 事 都 有 例外 的 时 候 ， 这 是 唯一 一 种 处 理 器 会 从 高 特权 降 到 低 特权 运行 的 情况 : 处 理 器 从 中 断 
处 理 程序 中 返回 到 用 户 态 的 时 候 。 
中 断 处 理 都 是 在 0 特权 级 下 进行 的 , 因为 中 断 的 发 生 多 半 是 外 部 硬件 发 生 了 某 种 状况 或 发 生 了 某 种 不 可 抗 
力 事件 而 必须 要 通知 CPU 导致 的 ， 所 以 ， 在 中 断 的 处 理 过 程 中 需要 具备 访问 硬件 的 能 力 ， 在 大 多 数 情况 下 8 
有 CPU 处 于 0 特权 级 才能 访问 硬件 ， 这 是 因为 eflags 寄存 器 中 的 IOPL 位 的 值 通常 被 设置 为 0 (该 位 的 作用 吝 
是 限制 访问 IO 端口 的 最 低 特权 级 )， 并 且 TSS 中 不 存在 IO 位 图 ， 有 关 这 部 分 后 面 马上 会 讲 到 。 再 者 ， 有 些 
中 断 处 理 中 需要 的 指令 只 能 在 0 特权 级 下 使 用 , 这 部 分 指令 称 为 特权 指令 , 所 以 中 断 发 生 后 其 处 理 的 过 程 必 须 
在 0 特权 级 下 进行 。 用 户 进程 是 在 3 特权 级 ， 在 运行 用 户 程序 时 知 发 生 了 中 断 ，CPU 会 暂停 用 户 程 序 的 执行 ， 
随后 CPU 就 会 自动 由 3 特权 级 进入 到 0 特权 级 ， 在 0 特权 级 下 将 执行 用 户 程序 时 的 现场 环境 〈 也 就 是 著名 的 
概念 : 上 下 文 ) 保存 起 来 (这 个 保存 上 下 文 的 动作 可 以 由 CPU 通过 TSS 完成 ， 这 是 CPU 在 硬件 上 提供 的 功 
能 ， 但 其 效率 并 不 高 ， 所 以 大 多 数 操作 系统 都 是 自己 写 代码 手动 保存 上 下 文 环境 )， 待 中 断 处 理 完成 后 ，CPU 
会 恢复 用 户 程序 的 执行 ， 也 就 是 说 会 回 到 3 特权 级 。 以 后 在 讲 了 中 断 和 用 户 进程 时 大 伙 儿 会 更 清楚 这 一 点 。 

现在 大 家 知道 了 ， 除 了 从 中 断 处 理 过 程 返回 外 , 任何 时 候 CPU 都 不 允许 从 高 特权 级 转移 到 低 特权 级 。 
再 结合 之 前 咱们 所 说 的 大 前 提 ， 访 问 者 任何 时 候 都 不 允许 访问 比 自己 特权 更 高 的 资源 ， 代 码 段 也 是 资源 
只 不 过 可 以 让 CPU 转移 过 去 执行 而 已 ， 所 以 ， 比 目标 代码 段 特权 级 低 的 访问 者 也 会 被 拒绝 访问 目标 代码 
段 。 综 上 所 述 ， 对 于 受 访 问 者 为 代码 段 的 情况 ， 只 能 是 平 级 访问 。 也 就 是 说 ， 假 如 当前 特权 级 为 2， 只 能 
转移 到 DPL 为 2 特权 级 的 代码 段 上 运行 ， 转 移 到 0、1、3 特权 级 都 会 被 处 理 器 拒绝 。 

不 过 本 质 上 来 说 , 代码 能 否 运行 与 代码 本 身 的 特权 等 级 并 无 关系 , 不 同等 级 下 的 代码 段 中 的 机 器 码 都 
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是 一 样 的 ， 特 权 级 只 是 写 在 描述 符 的 DPL 中 ， 并 没有 写 在 机 器 码 中 ， 所 以 高 特权 级 的 代码 并 不 比 低 特权 


级 的 代码 显得 “高 大 上 ”， 
后 再 无 用 途 ， 所 以 特权 级 并 不 影响 处 
E 在 处 理 的 资源 的 “份量 














己 了 
























































标 段 〈 代 码 段 或 数据 段 ) 的 特权 级 仅仅 是 在 被 访问 时 









































处 理 





器 检查 一 次 ， 之 
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， 有 多 重 ， 

















如 果 处 理 器 仅 能 5 























处 理 器 又 提供 了 多 种 方式 用 了 











处 理 器 的 特权 级 升 高 之 后 ， 程 序 想 干什么 就 干什么 ， 多 少 都 觉得 








“ 移 代码 段 的 话 ， 另 外 三 个 特权 级 的 代码 将 没有 
从 低 特 权 的 代码 转移 到 高 特权 代码 。 








行 高 特权 级 代码 段 上 的 指令 ， 


什么 是 一 致 特 








又 不 提升 特权 级 ? 一 种 方式 是 利用 一 致 性 
代码 段 ? 早 在 当初 介绍 段 描述 








器 执行 指令 。 
必 

















把 计算 机 资源 划 








分 成 不 同等 级 ， 只 是 让 处 理 
\ 须 用 同样 的 身份 来 执行 ， 不 能 儿戏 。 





器 知道 自 














机 会 运行 啦 。 如 何 穿 过 特权 屏障 呢 ? 








有 点 矶 怖 ， 有 没有 一 种 好 办 法 ， 既 执 




















人 尺码 段 。 




















符 结构 时 就 已 经 提 过 它 了 ， 不 过 确 






































以 至 于 您 可 能 完全 没有 印象 。 在 段 描述 符 


字段 中 的 C 位 来 表示 i 





段 为 非 一 致 特 





段 ] 





的 是 这 才能 实 





在 数值 





代码 段 。 

一 致 性 代码 段 也 称 为 依从 代码 段 ，Conforming， 用 
致 性 代码 段 是 指 如 果 自 己 是 转移 后 的 目标 段 ， 自 
上 CPL 宇 DPL， 也 就 是 一 致 性 代码 段 的 DPL 是 权限 的 上 限 ， 作 


现 了 
，CPL 实 一 致 必 





一 致 性 代码 段 








标 段 为 一 致 特 


中 也 不 会 再 被 检查 ,处 理 
旨 令 都 是 一 样 的 。 特 权 级 就 是 一 个 个 的 关 
以 必须 要 刷 工 卡 才能 进 公 司 一 样 , 即使 不 刷 





这 种 情况 类 
























































玄 段 是 否 为 一 致 改 



































致 性 代码 段 ， 
“级 转移 。 


























来 实现 从 低 特 权 级 








= | 














上 执行 。 这 似乎 很 奇怪 ,但 却 在 意料 之 中 ,奇怪 的 是 在 低 特权 级 访问 高 








FE 代 码 段 的 DD 


























尺码 转移 。 该 关系 用 公式 表示 如 下 : 


PL 


记过 





代码 段 时 ， 并 不 会 将 CPL | 
大 家 注意 啦 ， 既 然 是 转移 到 特权 级 更 高 的 一 致 性 
升 特权 级 ， 只 是 可 以 跑 到 特权 级 更 高 的 代码 段 中 去 执行 指令 ， 对 计算 机 而 言 并 未 
和 危险， 所 以 在 特权 级 检查 过 程 中 ， 请 求 者 
特权 级 检查 发 生 在 访问 者 访问 受 访 者 的 

















的 一 大 特点 是 转移 后 的 特权 级 不 与 自 
级 一 致 ， 听 从 、 依 从 转移 前 的 低 特 权 级 ， 这 就 是 它 称 为 “依从 、 一 致 ”的 原 
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该 目标 段 的 DPL 替换 。 












































器 也 并 不 会 因 
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的 RPL 并 不 参与 。 
瞬间 ， 只 检查 一 次 , 在 检查 过 
执行 了 高 特权 级 的 代码 而 觉得 自 
FEF， 仅仅 是 进门 


二 














El 














et ; 
LS 
























































您 照样 还 是 





可 以 使 











它们 ， 这 些 资 源 } 


























移 到 一 致 性 代码 段 后 CPL 还 保持 为 原来 的 低 特 权 级 并 未 提升 ， 但 也 没什么 好 奇怪 的 ， 





标 代 码 段 上 


的 指令 ， 
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顺便 


被 比 本 数 





按理 说 ,把 代码 攻 


人 句 ， 




















乎 不 够 体 








5.4.4 











最 为 适合 。 








用 门 ， 通 过 调 





主要 是 为 了 
1 于 以 后 我 们 将 
门 的 实例 ， 让 大 伙 儿 理解 特权 级 那 点 事 儿 。 

















面 ， 人 家 孙悟空 为 了 男 
还 有 4 个 “ 门 ”。 
门 、 调 用 门 

多 次 想 把 调用 
的 ，RPL 的 产 和 9 





与 RPL 
J] 和 RPL 

















sal 





是 为 了 等 级 变换 ， 如 果 还 以 里 微 的 身 


达到 目的 就 行 了 ， 何 必 在 意 身 份 呢 。 
尺码 段 可 以 有 一 致 性 和 非 一 致 性 之 分 ， 
中 段 特权 级 更 低 的 代码 段 访问 。 
I 分 为 不 同等 级 训 






































序 





分 开 单 独 说 ， 
笃 决 系统 调用 















































时 的 “越权 ”问题 ， 系 统 调用 的 实现 方式 中 ， 














实 只 是 提 了 一 下 而 已 
中 ， 如 果 该 段 为 非 系统 段 ( 段 描述 符 的 S 字段 为 0), 可 以 
E 代 码 段 。C 为 1 时 则 表示 该 段 是 
上面 所 提 到 的 代码 段 是 非 一 致 性 代码 段 ， 所 以 只 能 5 
的 代码 向 高 特权 级 的 代码 转移 。 一 
己 的 特权 级 (DPL ) 一 定 要 大 于 等 于 转移 前 的 CPL， 即 数值 
EF 何在 此 权限 之 下 的 特权 级 都 可 以 转 到 此 代码 
竺 权 级 居然 是 可 以 的 ， 而 意料 之 中 


E 代 码 段 后 CPL 不 变 ， 这 说 明 这 种 转移 本 身 3} 
特权 级 升 高 而 产生 潜在 





Luy 




















i type 
C 为 0 时 则 表示 该 


己 的 特权 级 (DPL) 为 主 ， 而 是 与 转移 前 的 低 特权 
。 也 就 是 说 ， 处 理 器 遇 到 目 

















没有 提 


























在 该 段 上 以 后 的 执行 过 程 
了 不 起 , 在 它 眼 里 任何 级 别 的 
时 的 检测 而 已 ， 与 关卡 后 面 的 代码 和 数据 无 关 。 
工 卡 , 您 的 工 位 还 是 那个 工 位 , 电脑 还 是 那个 电脑 ， 
不 会 有 什么 改变 ， 它 们 与 唱 们 是 否 刷 工 卡 是 无 关 的 。 所以， 尽管 转 





























的 是 运行 目 











毕竟 





但 所 有 的 数据 段 总 是 非 一 致 的 ， 即 数据 段 不 允许 


份 去 运行 高 特权 级 的 代码 ， 似 
j 子 还 号 称 为 齐 天 大 圣 呢 ， 其 实 CPU 中 实现 特权 级 变换 的 “门路 ”多 着 呢 ， 





但 几 次 尝试 都 没有 成 功 ， 我 发 现 它们 之 间 是 紧 耦 合 、 密 不 可 分 





以 调用 门 和 中 断 门 


















































处 理 器 只 有 通过 “ 门 结 构 ” 才 能 











循 它 的 用 法 ， 对 处 理 














j 中 断 门 实现 





低 














自己 的 系统 调用 ， 故 在 此 本 着 扩充 知识 面 的 














的 给 大 伙 儿 介绍 调 























特权 级 转移 到 高 特权 级 ， 处 理 费 就 是 这 样 设 训 




















器 来 说 ， 操 作 系 统 只 是 它 的 应 














而 已。 





的 ， 我 们 必须 要 遵 
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门 结构 是 什么 呢 ? 就 是 记录 一 段 程序 起 始 地 址 的 描述 符 。 

描述 符 有 多 种 ， 刚 才 所 说 的 一 致 性 代码 段 ， 虽 然 它 里 面 全 是 代码 ， 但 它 本 身 是 内 存 段 ， 并 不 是 指 具体 
的 一 段 例 程 ， 所 以 可 以 用 “ 段 描述 符 ” 来 “描述 ”。 还 有 一 种 称 为 “ 门 描述 符 ” 的 结构 ， 用 来 描述 一 段 程 
序 。 进 入 这 种 神奇 的 “ 门 ” 处 理 器 便 能 转移 到 更 高 的 特权 级 上 。 

门 描述 符 同 段 描述 符 类 似 ， 都 是 8 字 节 大 小 的 数据 结构 ， 用 来 描述 门 中 通 向 的 代码 。 一 共有 4 种 门 结构 ， 
图 5-49 一 图 5-57 这 4 张 图 所 示 是 4 种 门 描述 符 的 结构 ， 咀 们 先 看 图 ， 然 后 再 简要 介绍 。 


























































































































































































































































































































































































































31 161514 1312 11 87 0 高 
未 使 用 P| DPL 1 -一 未 使 用 32 
位 
31 1615 0 低 
TSS 选择 子 未 使 用 32 
位 
任务 门 描述 符 格 式 
^ 图 5-49 ”任务 门 描述 符 
31 161514 1312 11 87654 0 高 
中 断 处 理 程序 在 目标 段 内 的 偏 移 量 的 。 | p| Dp | S| TYPE | | o| o| 未 使 用 32 
31~16 位 olplililo 位 
31 1615 0 低 
中 断 处 理 程序 目标 代码 段 描述 符 选 择 子 | 时 处 理 程序 在 目标 代 必 自由 的 仿 欧 量 的 | 32 
位 
D 位 为 0 表示 16 位 模式 Pt 
D 位 为 1 表示 32 位 模式 中 断 门 描述 符 格 式 
^ 图 5-50 中断 门 描述 符 
31 161514 1312 11 87654 0 高 
中 断 处 理 程序 在 目标 段 内 的 偏 移 量 的 S| TYPE 
3 P| DPL om "| 未 使 用 
中 断 处 理 程序 在 目标 代码 段 内 的 偏 移 量 的 低 
中 断 处 理 程序 目标 代码 段 描 述 符 选 择 子 区 32 
9 
D 位 为 0 表示 16 位 模式 | 位 
D 位 为 1 表示 32 位 模式 陷阱 门 描述 符 格式 
4 图 5-51 ”陷阱 门 描述 符 
31 161514 1312 11 87654 0 高 
被 调用 例 程 在 目标 代码 段 内 的 偏 移 量 的 S| TYPE 
| 第 31~16 位 P| DPL OE 0 中 参数 个 数 。 
31 1615 0 低 
| 被 调用 例 程 所 在 代码 段 的 描述 符 选 择 子 | 税 呈 用 例 程 在 目标 代 自 内 的 仿 移 看 的 32 
位 


D 位 为 0 表示 16 位 模式 Ne 
D 位 为 1 表示 32 位 模式 调用 门 描述 符 格 式 


4 图 5-52 ”调用 门 描述 符 
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大 家 看 图 5-52 中 的 4 种 门 描述 符 ， 它 们 与 段 描述 符 最 大 的 不 同 是 除了 任务 门 外 ， 其 他 三 种 门 都 是 对 应 
到 一 段 例 程 ， 即 对 应 一 段 函 数 ， 而 不 是 像 段 描述 符 对 应 的 是 一 片 内 存 区 域 。 任 何 程序 都 属于 某 个 内 存 段 ， 所 
以 程序 确切 的 地 址 必须 用 “代码 段 选择 子 + 段 内 偏 移 量 ” 来 描述 ， 可 见 ， 门 描述 符 基 于 段 描述 符 ， 例 程 是 用 
段 描 述 符 来 给 出 基 址 的 ， 所 以 门 描 述 符 中 要 给 出 代码 段 的 选择 子 , 但 光 给 出 基 址 远 远 不 够 ,还 必须 给 出 例 程 
的 偏 移 量 ， 这 就 是 门 描 述 符 中 记录 的 是 选择 子 和 偏 移 量 的 原因 。 

任务 门 描 述 符 可 以 放 在 GDT、LDT 和 IDT 中断 描述 符 表 ， 后 面 章节 在 介绍 中 断 时 大 伙 儿 就 清楚 了 ) 
中 ， 调 用 门 可 以 位 于 GDT、LDT 中 ， 中 断 门 和 陷阱 门 仅 位 于 IDT 中 。 

任务 门 、 调 用 门 都 可 以 用 call 和 jmp 指令 直接 调用 ,原因 是 这 两 个 门 描 述 符 都 位 于 描述 符 表 中 ， 要么 
是 GDT， 要 么 是 LDT， 访 问 它 们 同 普通 的 段 描述 符 是 一 样 的 ， 也 必须 要 通过 选择 子 ， 因 此 只 要 在 call 或 
jmp 指令 后 接任 务 门 或 调用 门 的 选择 子 便 可 调用 它们 了 。 陷 阱 门 和 中 断 门 只 存在 于 IDT 中 , 因此 不 能 主动 
调用 ， 只 能 由 中 断 信号 来 触发 调用 。 

任务 门 有 点 特殊 ， 它 用 任务 TSS 的 描述 符 选择 子 来 描述 一 个 任务 ， 有 关 TSS 的 内 容 会 在 用 户 进 程 部 
分 介绍 。 除 任务 门 之 外 ， 另外 的 三 个 门 描述 符 都 是 用 代码 段 选择 子 及 偏 移 地 址 来 描述 一 段 程序 例 程 的 。 但 
是 ， 无 论 是 哪 种 门 描述 符 ， 它 们 中 所 记录 的 信息 都 已 经 可 以 确定 所 描述 的 对 象 〈 例 程 或 任务 ) 了 ， 所 以 在 
被 调用 时 ，CPU 都 会 忽略 调用 指令 中 的 偏 移 量 。 例 如 : 假设 某 调 用 门 描述 符 位 于 GDT 中 第 1 个 位 置 ， 这 
样 的 指令 “call 0x0008: 0x1234”， 在 调用 此 调用 门 时 ， 偏 移 量 0x1234 会 被 CPU 忽略 。 

提供 了 4 种 门 的 原因 是 它们 都 有 各 自 的 应 用 环境 , 但 它们 都 用 来 实现 从 低 特权 级 的 代码 段 转向 高 特权 
级 的 代码 段 ， 咱 们 这 里 也 只 讨论 有 关 特 权 级 的 功用 。 

1. 调用 门 


call 和 jmp 指令 后 接 调 用 门 选择 子 为 参数 ， 以 j 
现 系统 调用 。call 指令 使 用 调用 门 可 以 实现 向 高 特权 代码 转移 , jmp 指令 使 ) 
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以 int 指令 主动 发 中 断 的 























中 断 门 














们 在 实现 中 断 时 会 展开 细 说 。 
































区 式 实现 从 低 特 权 向 高 特权 转移 ，Linux 系统 调用 便 用 此 中 断 门 实现 ， 以 后 虽 





















































周 用 函数 例 程 的 形式 实现 从 低 特权 向 高 特权 转移 ， 可 





























来 实 

















] 调 | 


i 


] 只 能 实现 向 平 级 代码 转移 。 





























































































































3. 陷阱 门 

以 int3 指令 主动 发 中 断 的 形式 实现 从 低 特权 向 高 特权 转移 ,这 一 般 是 编译 器 在 调试 时 用 ,本 书 中 咱们 
不 用 过 多 关注 。 

4. 任务 门 

任务 以 任务 状态 段 TSS 为 单位 ， 用 来 实现 任务 切换 ， 它 可 以 借助 中 断 或 指令 发 起 。 当 中 断 发 生 时 ， 
如 果 对 应 的 中 断 向 量 号 是 任务 门 ， 则 会 发 起 任务 切换 。 也 可 以 像 调 用 门 那样 ,用 call 或 jmp 指令 后 接任 务 
门 的 选择 子 或 任务 TSS 的 选择 子 。 

坦白 说 ， 现 代 操 作 系 统 很 少 用 到 调用 门 和 任务 门 ,在 咱们 的 系统 中 也 只 用 到 了 中 断 门 ， 而 陷阱 门 是 供 























调试 器 用 的 ， 咱 们 并 未 打 
通过 更 少 的 代码 了 解 操 作 系统 原理 。 
没有 想 过 , 为 什么 可 以 使 用 门 结构 进入 高 特权 级 呢 ? 
有 路 中 写 好 的 规则 ， 





村 





不 知道 大 伙 儿 有 
这 肯定 是 CPU 硬 
























































Acer -| 


























算 文 持 应 


























程序 的 调试 ， 一 方面 
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人 全， 


我 是 这 样 
子 上 往 蹦床 上 唱 


里 解 的 > 举 个 例子 ， 











pA 

















\ 体 我 也 不 清楚 ， 








用 门 提升 特权 级 ， 就 像 站 在 高 处 的 台 





i 工作 量 较 大 ， 男 一 方 下 





i 违背 咀 们 的 初 囊 ， 就 是 想 

















也 不 需要 搞 清 


























一样 ， 人 会 被 蝴 床 弹 











位 于 蹦床 和 


其 效果 妇 


实际 J 


槛 和 门 术 





| 
1 图 5-53 所 示 。 








人 
口 5 


标高 度 之 间 , 至 少 得 和 蹦 














EE 来 比喻 。 


上 ， 门 也 是 按照 这 个 蹦床 原 到 











比 台子 还 高 。 关 键 点 : 台子 的 高 度 
床 一 样 高 , 这 样 人 才能 被 弹 得 更 高 。 


实现 的 ， 我 们 把 “ 门 ” 分 成 门 








低 特权 级 
(当前 特权 级 ) 





门 的 作用 相当 于 蹦床 


高 特权 级 
标 特权 级 ) 



























门 特权 级 更 低 














门 的 “门槛 ”是 访问 者 特权 级 的 下 限 ， 访 问 者 的 特权 级 再 低 也 不 


能 比 门 

















i 述 符 的 特权 级 DPL 低 ， 否 则 访问 者 连 门 都 进 不 去 ， 更 谈 不 j 























受 | 














5-53 “ 门 的 作 








A 











上 使 用 调用 门 。 门 描述 符 的 DPL 特权 
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级 要 低 于 或 等 于 当前 特权 级 CPL， 即 数值 上 CPL 科 门 的 DPL， 此 处 可 见 ， 门 描述 符 相 当 于 数据 段 描述 符 
一 样 ， 只 允许 比 自己 特权 级 高 或 相同 特权 级 的 程序 访问 。 

门 的 “门框 ”是 访问 者 特权 级 的 上 限 , 访问 者 的 特权 级 再 高 也 不 能 比 门 描述 符 中 目标 程序 所 在 代码 段 
的 DPL 高 ， 和 否则 本 身 的 特权 级 就 比 目 标 代码 特权 级 还 高 的 话 ， 还 使 用 门 干吗 ? 而 且 真 要 是 这 样 的 话 ， 这 
意味 是 特权 级 由 高 向 低 转移 了 ， 这 绝对 是 被 禁止 的 。 也 就 是 说 ， 门 中 包含 的 目标 程序 所 在 的 段 的 特权 级 
DPL 要 高 于 或 等 于 当前 特权 级 CPL， 即 数值 上 CPL 三 目标 代码 段 DPL， 进 门 之 后 ， 处 理 器 将 以 目标 代码 
段 DPL 为 当前 特权 级 CPL， 因 此 进门 之 后 ， 就 能 “一 步 登 天 ” 啦 。 

如 上 所 述 ， 并 不 是 任何 当前 特权 级 都 可 以 使 用 门 结构 的 ,在 使 用 门 结构 之 前 ， 处 理 器 要 例行公事 做 特 
权 级 检查 ， 参 与 检查 的 不 只 是 CPL 和 DPL， 还 有 RPL， 为 了 说 清楚 这 个 检查 过 程 ， 咱 们 得 先 介绍 下 RPL。 

RPL， 即 请 求 特 权 级 ， 为 了 解释 清楚 ， 咱 们 得 多 花 点 工夫 好 好 说 道 说 道 。 

我 们 本 节 始 终 在 说 特权 级 转移 ， 处 理 器 从 一 个 特权 级 转移 到 另 一 个 特权 级 ,任意 时 刻 处 理 器 所 处 的 
特权 级 称 为 当前 特权 级 。 重复 叙述 的 目的 是 强调 当前 特权 级 是 对 处 理 器 而 言 的 概念 ， 并 不 是 对 代码 段 而 
言 。 当 前 特权 级 CPL 是 指 处 理 器 任意 时 刻 的 身份 地 位 ， 其 变化 的 原因 是 处 理 器 从 某 一 特权 级 的 代码 段 转 
移 到 另 一 特权 级 的 代码 段 上 运行 ， 代 码 段 的 特权 级 DPL 是 未 来 处 理 器 的 CPL。 

各 种 门 结构 存在 的 目的 就 是 为 了 让 处 理 器 提升 特权 级 , 这 样 处 理 器 才能 够 做 一 些 低 特权 级 下 无 法 完 
成 的 工作 。 比 如 ， 当 用 户 程 序 想 读 取 硬 盘 文 件 时 ， 由 于 处 理 器 在 执行 用 户 程序 时 所 处 的 特权 级 为 3， 一 
般 情 况 下 操作 系统 不 允许 用 户 程序 操作 硬盘 。 此 时 必须 由 用 户 代码 指挥 处 理 器 使 用 某 种 门 结构 (如 调用 
门 ) 进入 0 特权 级 ， 在 提升 了 处 理 器 的 CPL 之 后 才能 控制 硬盘 ， 读 取 文 件 。 是 不 是 说 得 有 些 抽象 ? 其 
实 就 是 用 户 程序 进行 系统 调用 使 处 理 器 进入 内 核 态 执行 内 核 服 务 。 

当 处 理 器 提升 为 0 特权 级 时 ， 任 何事 情 都 能 做 ， 是 最 强大 ， 同 时 也 是 最 危险 的 状态 ， 如 果 用 户 程序 通 
过 某 种 门 结构 使 处 理 器 进入 到 0 特权 级 , 它 很 有 可 能 会 被 3 特权 级 的 用 户 程序 利用 ， 这 样 用 户 程 序 就 有 机 
会 访问 0 特权 级 下 的 数据 。 

调用 门 是 一 个 描述 符 ， 称 为 门 描述 符 ， 其 中 记录 的 是 内 核 服务 程序 所 在 代码 段 的 选择 子 及 在 代码 段 中 
的 偏 移 地 址 。 门 描述 符 定义 在 全 局 描述 符 表 GDT 和 局 部 描述 符 表 LDT 中 ， 所 以 ， 要 想 使 用 调用 门 ， 就 要 
通过 门 描述 符 的 选择 子 ， 这 一 点 和 访问 数据 段 类 似 ， 总 之 ， 保 护 模 式 下 离 不 开 描 述 符 ， 有 描述 符 就 离 不 开 
选择 子 。 

我 们 平时 很 少 有 人 直接 和 调用 门 打交道 , 大 多 数 程序 员 甚 至 都 不 知道 调用 门 是 怎么 回 事 ， 所 以 在 接触 
调用 门 时 通常 会 感到 有 些 吃 力 ， 这 是 由 三 方面 造成 的 。 
(1) 我 们 大 多 数 情况 下 是 用 的 高 级 语言 编程 ,编译 器 或 集成 开发 环境 为 我 们 做 了 太 多 的 工作 ， 大 大 方 
便 了 我 们 的 编码 方式 ， 而 调用 门 是 在 汇编 语言 下 使 用 的 方法 ， 不 做 底层 开发 的 话 我 们 根本 就 碰 不 到 它 。 

(2) 调用 门 是 用 来 实现 系统 调用 的 ， 但 为 了 兼容 等 原因 ， 我 们 平时 接触 的 操作 系统 很 少 使 用 调用 门 
实现 系统 调用 ， 如 Linux 就 是 用 中 断 门 代 奉 。 我 们 顶 多 听 说 过 中 断 门 ， 对 调用 门 了 解 少 之 又 少 。 

(3) 调用 门 一 般 在 过 去 多 段 模型 下 使 用 ， 大 多 数 情况 下 需要 为 调用 门 指定 段 选择 子 。 而 现在 操作 系统 
为 了 方便 ， 早 已 经 采用 了 平坦 模型 ， 所 有 用 户 进程 共享 几 个 选择 子 ， 比 如 用 户 代码 段 选择 子 和 用 户 数据 段 
选择 子 各 一 个 ， 由 所 有 用 户 进程 共享 ， 人 断 门 代 蔡 了 。 

综 上 所 述 ， 调 用 门 是 在 汇编 语言 中 使 用 的 ， 能 发 挥 其 特长 的 场所 是 多 段 模型 ， 若 没有 此 方面 的 编程 经 
验 ， 大 家 先 提前 有 个 印象 ， 也 没什么 杂 的 ， 仅 仅 是 大 家 很 少 接触 而 已。 
调用 门 描述 符 是 位 于 GDT 或 LDT 中 的 ， 所 以 要 调用 它 就 要 通过 门 描述 符 选 择 子 才 行 。 通 常 ， 调 用 门 
1 call 指令 或 jmp 指令 后 接 门 描述 符 选 择 子 来 调用 ， 后 面 还 会 说 到 ， 咱 们 先 初 识 一 下 调用 门 吧 。 

操作 系统 可 以 利用 调用 门 实现 一 些 系统 功能 〈 但 现代 操作 系统 用 调用 门 实现 系统 调用 并 不 是 主流 ,一 
般 是 用 中 断 门 实现 系统 调用 )， 用 户 程序 需要 系统 服务 时 可 以 调用 该 调用 门 以 获得 内 核 帮助 。 结 合 图 5-52 
所 示 调 用 门 描述 符 结构 ， 调 用 门 描述 符 记 录 的 就 是 一 段 函 数 例 程 地 址 ， 以 函数 例 程 地 址 所 在 的 代码 段 选 择 
子 及 所 在 代码 段 的 偏 移 量 组 成 , 只 是 该 例 程 的 提供 者 是 处 于 0 特权 级 下 的 内 核 。 调 用 门 的 执行 流程 如 图 5-54 
所 示 。 
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给 大 伙 儿 说 


经 历 了 5 个 步骤。 
用 门 的 选择 子 ， 该 选择 子 指 
暂且 认为 它 是 指向 GDT 中 的 调用 门 。 








下 调用 门 内 部 执行 流程 
在 用 户 程序 中 有 









































全 局 描述 符 表 
GDT 
用 户 程 序 
call 调用 门 静 择 
rn 选 
择 
症 调用 门 描述 符 
索 内 核 例 程 
4 所 在 代码 段 的 选择 子 


























XX 段 





内 核 
代码 段 




















内 核 例 程 
所 在 代码 段 的 偏 移 量 

















A 图 5-54 





调 









































E， 如 图 5-54 所 示 ， 从 调用 
名 代码 “call 调用 门 选择 子 ”，call 指 
向 GDT 或 LDT 中 的 某 个 门 描述 符 ， 不 管 选择 子 中 的 TI 位 是 0， 还 是 1， 












































址 。 
内 核 例 程 所 在 代 
位 的 索引 值 乘 以 














在 GDT 中 的 偏 移 
中 从 0 起 的 第 3 了 
我 们 知道 ， 在 保护 模式 下 
码 段 的 选择 


在 该 内 核 代码 段 描 








旦 ， 村 








加 





上 寄存 器 GDTR 中 的 GDT 基 ] 








个 








述 符 位 置 ， 


处 理 器 用 门 描述 符 选择 子 的 高 13 位 (索引 位 ) 乘 以 8 作为 该 描 i 
地 址 ， 最 终 找 到 了 门 描述 符 的 地 ] 












































8， 再 加 














量 ， 最 终 得 到 内 




















核 作 























既然 门 描述 














该 位 置 如 图 5-54 所 示 是 门 描述 符 。 














门 选择 子 到 获取 到 内 核 代码 的 地 址 ， 共 


在 该 描述 符 





令 可 以 使 用 调用 门 ， 





参数 就 是 调 
我 们 
述 符 


























目 ， 它 位 于 GDT 
中 记录 的 是 内 核 例 程 的 地 









































i 述 某 个 内 存 地 址 是 离 不 开 














选择 子 和 偏 移 量 的 ， 














所 以 ， 门 描述 符 中 记录 的 是 


























子 及 偏 移 量 。 处 理 器 再 
上 GDT 基 
































述 符 中 找到 内 核 代码 段 基 二 
I 程 的 起 始 地 址 。 
以 上 为 讨论 方便 ， 执 行 过 程 。 
符 用 来 指向 某 个 内 核 例 程 ， 是 例 程 就 需要 参 








未 涉及 分 页 

















特权 级 下 的 内 核 程序 传递 参数 ， 


不 同 特权 级 
级 下 要 用 


























的 , 也 就 


陷入 内 核 后 ， 由 了 











二 
清楚 ， 























想 ,让 操作 系统 再 
有 点 荡 唐 ， 我 们 的 初衷 是 想 通过 调 
然 很 不 科学 。 处 理 器 的 设 








门 ， 这 显 
数 的 自动 复制 ， 


所 以 ， 


下 处 理 嚣 上 





是 说 参数 是 保存 在 用 户 栈 中 的 , 目前 读者 先 这 么 理 
F 特权 级 变化 ， 导 致使 用 的 栈 也 要 跟着 变 
理 器 要 用 0 特权 级 下 的 栈 , 所 以 ， 处 于 0 特权 级 下 的 内 
] 户 传 入 参数 是 在 3 特权 级 下 做 的 ， 
在 0 特权 级 栈 中 获取 参数 ，3 特权 级 的 
于 CPL 为 3 的 进程 访问 DPL 为 0 的 数据 段 ， 数 值 上 CPL>DPL,， 处 至 























提供 


























即 ， 将 









































j 代 码 段 选择 子 ， 











止 ， 用 它 加 上 门 描述 符 

















j 不 同 的 栈 ， 处 理 器 处 于 3 特权 级 下 时 要 














讨论 下 怎样 在 


用 3 特权 级 下 的 栈 , 处 理 器 处 于 





重复 之 前 的 步骤， 用 选择 子 中 高 13 
址 ， 所 得 到 的 地 址 为 该 代码 段 选择 子 所 指向 的 内 核 代 码 段 描述 符 地 址 ， 
中 记录 的 内 核 例 程 在 代码 段 中 的 偏 移 












































j 户 的 3 特权 级 下 为 0 











0 特权 








0 特权 级 下 的 栈 ， 这 么 做 的 原因 主要 是 怕 不 同 特 
乱 ， 而 且 所 有 特权 级 共用 一 个 栈 的 话 很 容易 使 栈 溢出 。 



























































个 调用 门 专门 负责 传 入 参数 到 0 级 栈 
] 门 执行 内 核 程 序 ， 现在 却 为 了 使 用 


























参数 最 初 是 由 


权 下 的 数据 混在 同一 个 栈 中 交叉 引 | 
用 户 程序 以 压 栈 的 形式 提交 给 
解 就 行 , 在 以 后 讨论 调用 约定 时 大 家 就 明白 了 。 

















会 比较 混 
调用 门 






































化 ， 不 能 再 使 ) 
核 程序 需要 在 其 对 
参数 在 3 特权 级 栈 中 ， 内 核 月 
j 户 程序 怎样 能 越权 将 参数 压 入 0 特权 级 下 的 栈 呢 ? 




















自动 复 人 


























制 给 内 核 时 需要 
是 调 


多 可 
































用 至 到 的 和 





传递 31 个 参数 。 

















它 是 专门 给 处 




















j 用 户 程序 下 的 3 特权 级 栈 了 ， 处 














及 务 程 序 是 在 0 特权 级 下 ， 


器 会 引发 异常 的 。 有 
ee 先 不 说 这 样 是 否 可 行 , 不 能 否认 这 的 确 





应 的 0 级 栈 中 获取 参数 。 大 家 要 
它 需 要 
这 种 访问 相当 
没有 读者 这 样 





























十 者 也 看 到 了 这 一 点 ， 为 了 方便 软件 开发 人 员 ， 处 理 器 在 固件 上 实现 
j 户 进程 压 在 3 特权 级 栈 中 的 参数 
您 看 到 在 图 5-52 中 ， 





| 到 0 1 


其 高 32 位 的 起 始 处 有 个 “参数 个 数 ”， 




















参数 在 栈 中 的 顺序 是 挨 着 的 ， 所 以 处 理 
j 门 描述 符 中 “参数 个 数 ” 的 作用 ， 











理 器 准 















































“调用 门 ” 而 去 调用 另外 一 个 调用 
参 
竺 权 级 栈 中 。 











这 是 处 理 器 将 用 户 提 供 的 参数 复 














器 只 需要 知道 复制 几 个 参数 就 行 了 ， 这 就 
备 的 。 该 位 是 用 5 个 BIT 来 表示 的 ， 所 以 最 
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调用 门 可 以 





的 场合 。 
调用 门 
址 ， 所 以 即 




















5.4.5 








的 






































令 





call 指 





] call 指令 和 jmp 指令 调用 ， 











的 使 用 形式 是 : 
jmp 指 
调用 门 的 过 程 保护 
调用 门 涉及 两 个 4 


使 在 cal 和 j 








竺 权 级 ， 


jmp 

















令 后 国 














门 描述 符 选 择 子 ”， 
































你 特权 级 > 这 是 由 门 描述 名 





移 ， 这 是 有 可 


能 的 ， 














核 是 0 特权 级 。 特权 没 法 再 高 了 。 所 以 ， 
的 DPL 也 为 0， 这 柱 
权 级 检查 时 就 无 法 通过 
向 平 级 或 更 高 级 转移 。 





Pay 
只 能 


并 不 是 说 


竹中 选择 


























调 ) 

















就 是 平 











级 转移 。 顺 便 说 











站 























接 下 来 ， 














，; /AN 


有 通过 返回 





指 



































咱们 看 看 在 用 户 进程 中 通过 call 指令 














假设 用 








-进程 要 调 ) 














j 某 个 调用 门 ， 该 














也 就 是 用 户 进程 需要 为 该 调 
调用 


用 后 用 


权 级 为 3， 
栈 ， 调 








参数 2， 如 





(2) 在 这 一 步 又 中 要 确定 新 特权 级 使 用 的 栈 ， 
































图 5-55 所 示 。 























6 








用 门 转移 前 








调用 


调 | 











2 图 











司 用 


前 的 当前 特 














的 是 3 特权 级 




















] 门 前 完成 的 ， 


分 别 是 参数 1 和 


新 特权 级 就 是 未 来 


的 CPL， 它 就 是 转移 后 的 目标 代码 段 的 DPL。 所 以 ， 根 据 门 描述 符 中 


选择 子 对 应 
子 SS 和 栈 指针 ESP， 
(3) 检 





(4) 如 果 转 移 后 的 




















查 新 栈 段 选择 子 对 应 的 描述 符 


























标 代 码 段 DPL 











的 目标 代码 段 的 DPL， 如 前 假设 ， 这 里 DPL 为 0， 处 到 
它们 作为 转移 后 新 的 栈 。 为 方便 叙述 ， 将 它 介 
的 DPL 和 TYPE， 如 果 未 通过 检查 则 处 得 
比 CPL 要 高 ， 说 明 栈 段 选择 子 SS_new 是 特权 级 更 高 的 栈 ， 











属于 一 去 不 回头 的 指令 ， 基 本 上 用 
1 于 会 在 栈 中 留 下 返回 地 址 ， 所 以 在 执行 retf 指令 时 还 能 返 
“call 或 jmp 指令 + 调用 
j 接 偏 移 地 址 也 会 被 处 理 


周 用 门 的 使 命 就 是 向 更 高 特权 级 转移 ， 内 核 程序 也 可 以 调用 “ 调 
] 门 未 必 都 向 高 特权 级 转移 ， 也 可 能 是 
句 ， 即 使 是 通过 调 ) 
令 如 retf 或 iret 才 


] 门 ”的 完整 过 程 ， 
门 描述 符 中 参数 的 个 数 是 2， 
用 门 提 供 2 个 参数 才 行 。 
后 的 新 特权 级 为 0， 所 以 调 
的 是 0 特权 级 栈 。 

(1) 现在 为 此 调用 门 提供 2 个 参数 ， 这 是 在 使 用 调 / 
目前 是 在 3 特权 级 ， 所 以 要 在 特权 级 栈 中 压 入 参数 ， 


A 



































口 o 








由 于 门 描述 符 中 已 经 记录 了 程序 的 偏 
器 忽略 ， 如 call selector ， gate:offsetoffset 





先是 转移 前 的 低 特 权 级 ， 这 是 程序 调用 “调用 门 ” 时 的 CPL， 再 就 是 转移 
子 对 应 的 目标 代码 段 的 DPL 决定 的 。 通 过 调用 











门 有 可 能 是 平 级 转 














移 地 


口 


















































高 地 址 ”3 特权 级 栈 








参数 1 
参数 2 





| 门 
CPL 为 0， 目 标 代 码 段 
门 也 不 能 由 高 特权 级 转向 低 特 权 级 ， 特 
能 够 做 到 由 高 特权 级 转移 到 低 特 权 级 ， 调 


内 








用 门 


以 下 我 们 只 讨论 32 位 模式 。 


esp 














低地 址 


使 用 调用 门 之 前 用 户 进程 的 栈 











受 | 











58-55 














调用 门 控制 转移 前 





器 自动 在 TSS 中 找到 合适 的 栈 段 选 择 
] 记 作 SS_new、ESP_new。 




















器 引发 异常。 











要 特权 级 转换 ， 需 要 切换 到 新 栈 ， 为 叙述 方便 ， 将 旧 栈 段 选择 子 记 作 SS_old， 旧 栈 指 针 记 作 ESP_old。 
移 前 的 旧 栈 段 选择 子 SS_old 及 指针 ESP_old 得 保存 到 新 栈 中 ， 这 样 在 高 特权 级 的 目标 程序 执行 完成 后 才能 通 


过 retf 指令 

















令 恢 复 旧 栈 。 





人 只 能 在 使 用 














ESP old， 之 后 将 





新 栈 后 才能 






































栈 。 由 于 咱们 讨论 的 是 32 位 模式 ， 故 栈 操作 数 也 是 32 位 ，SS_old 只 是 16 位 数据 
充 后 入 栈 保 存 。 如 图 5-56 A 所 示 。 
31 3 0 高 地 址 31 4 0 高 地 址 
楼 0 SS_old SS 0 SS _ old 
向 ESP_old ESP_new Be 
扩 参数 2 a 
展 
低地 址 低地 址 
A B 
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qe 











所 栈 的 选择 子 SS_new 和 
年 SS_old 和 ESP_old 保存 到 
SS_new 加 载 到 栈 段 寄存 器 SS，esp_new 加 载 到 栈 指 针 寄存 器 esp， 
(5) 在 使 用 新 栈 后 ， 将 上 一 步 中 临时 保存 的 SS_old 和 ESP_old 压 入 到 当 

























































































受 ] 














5-56 ”特权 级 转移 新 栈 





ESP_new 还 未 加 载 到 栈 段 寄 
新 栈 中 ， 所 以 处 理 器 先 找 个 地 方 临时 保存 SS_old 和 

















户 栈 








这 说 明 需 











1 于 转 


























存 器 SS 和 























这 样 便 启用 
f 栈 中 ， 








前 间 





也 就 是 0 












































31 15 0 高 地 址 
SS_old 
ESP_old 
参数 1 
参数 2 
ri SS_new 
_new : 
EIP_old ESP_new 
低地 址 
C 


栈 指针 esp 中 ， 


了 新 栈 。 


特权 级 


届 ， 将 其 高 16 位 用 0 填 


(6) 在 这 一 步 中 要 将 用 户 栈 中 的 参数 复制 到 转移 后 的 新 栈 中 ， 根 据 调用 门 描述 符 中 的 “参数 个 数 ” 决 
参数 复制 后 的 效果 如 图 5-56 B 所 示 。 
(7) 由 于 调用 门 描述 符 中 记录 的 是 目标 程序 所 在 代码 段 的 选择 子 及 偏 移 地 址 ， 这 意味 着 代码 段 寄 存 器 CS 





定 复制 几 个 参数 。 





































































































眙 


要 用 该 选择 子 重 
机 





























新 加 载 ， 处理 








































































































器 不 管 新 的 选择 子 和 任何 段 寄存 器 〈 包 括 CS) 中 当前 的 选择 子 是 否 一 致 ， 也 不 管 
两 个 选择 子 是 否 指向 相同 的 段 ， 只 要 段 寄 存 器 被 加 载 ， 段 描述 符 缓冲 寄存 器 就 会 被 刷新 ， 从 而 相当 于 切换 到 了 
新 段 上 运行 ， 这 是 段 间 远 转移 ， 所 以 需要 将 当前 代码 段 CS 和 EIP 都 备份 如 








E 栈 中 ， 这 两 个 值 分 别 记 作 CS_old 和 

















EIP old, 由 于 CS_old 只 是 16 位 数据 , 在 32 位 模式 下 栈 操 作 数 大 小 是 32 位 ， 故 将 其 高 16 位 用 0 填充 后 再 入 栈 。 






















































































这 两 个 值 是 将 来 恢复 用 户 进程 的 关键 ， 也 就 是 从 内 核 进程 中 返回 时 用 的 地 址 。 效 果 如 图 5-56C 所 示 。 
(8) 一 切 就 绪 ， 只 差 运行 调用 门 中 指向 的 程序 啦 ， 于 是 ， 把 门 描述 符 中 的 代码 段 选择 子 装载 到 代码 段 





寄存 器 CS， 把 偏 移 量 装载 到 指 
至 此 ， 处理 器 终于 从 用 户 程 / 








































































































令 指 针 寄存 器 EIP。 



































符 中 对 应 的 内 核 服 务 程 序 。 
话说 如 果 在 第 2 步 中 处 再 


























二 | 

















转移 到 了 内 核 程序 上 ， 实 现 了 特权 级 由 3 到 0 的 转移 ， 开 始 执行 门 描述 





























器 发 现 是 平 级 转移 ， 比 如 内 核 程序 调用 “调用 门 ” 的 情况 ,这 是 0 级 到 0 级 



































的 平 级 转移 ， 处 理 








器 并 不 会 更 新 当前 栈 ， 也 就 是 说 不 会 从 TSS 中 再 次 选择 同 级 的 栈 载 入 SS 和 ESP， 处 理 




















器 只 是 把 此 转移 当成 直接 远 转 移 ， 于 是 路过 中 间 几 步 ， 直 接 做 第 7 步 ， 



















































































将 CS 和 EIP 压 入 当前 栈 中 。 


当 处 理 器 执行 完 内 核 服务 程 序 时 ， 接 下 来 咱们 再 看 看 处 理 器 是 如 何 从 高 特权 级 返回 到 低 特 权 级 的 。 





由 call 指令 调用 的 调用 门 ， 已 经 在 高 
令 将 返回 地 址 从 栈 中 问 
















































































特权 级 栈 中 留 下 了 返回 地 址 及 低 特 权 级 的 栈 ， 所 以 可 以 用 retf 指 
出 到 CS 和 EIP， 将 低 特 权 级 栈 地 址 弹出 到 SS 和 ESP 中 。 



































不 过 ， 话 又 说 回来 了 ， 处 理 器 是 被 所 有 任务 共享 的 ， 它 在 不 同 任务 





刚刚 执行 的 是 哪个 任务 ， 更 不 知 



































道 自己 是 内 





> 间 来 回 切换 ， 它 根本 不 知道 自己 














I 刚 从 低 特权 级 通过 调用 门 过 来 的 。 那 它 靠 什么 保证 正确 的 执行 

















流程 呢 ? 答案 是 ， 靠 人 ， 卖 了 那么 大 的 关子 ， 结 果 答 案 葛 然 如 此 出 人 意料 。 其 实 ， 只 有 人 才 知 道 程序 的 流 





























程 , 所 以 咱们 在 工作 中 才能 有 条 不 率 地 按照 流程 编码 。 处 理 器 只 知道 执行 你 交 给 它 的 指令 , 至 于 合 不 合理 ， 























那 是 由 人 来 控制 的 。 就 拿 这 个 1 
























































周 用 门 来 说 ， 如 果 调 用 的 时 候 用 call 指令 

















也 就 是 说 调用 门 对 应 的 程序 ， 其 结尾 应 该 是 retf 指令 才 合 理 。 如 果 该 调 



































， 这 说 明 还 要 从 目标 程序 中 返回 ， 




































































门 是 用 jmp 调用 的 ， 它 用 在 一 去 
































不 回 的 场合 ， 对 应 的 调用 门 中 就 不 需要 用 retf 指令 。 在 这 个 例子 中 ， 是 用 call 指令 调用 的 ， 所 以 程序 能 下 
到 正确 的 执行 流 上 ， 是 retf 指令 起 的 作用 。 







































































己 刚 刚 做 了 什么 ， 











它 不 ; 
权 级 。 你 懂 的 ， 程 















































序 之 所 以 能 了 





























FE 确 回 到 低 特 权 级 ， 是 因为 咱们 人 为 地 加 





















































想 想 看 ， 如 果 程序 真是 从 调用 门 过 来 的 ， 由 于 在 经 过 调用 门 的 时 候 已 经 做 了 特权 级 检查 ， 按 理 说 程序 
返回 到 低 特权 级 时 ， 就 不 需要 再 做 特权 检查 了 。 可 是 经 过 上 面 的 分 析 ， 大 家 已 经 了 解 了 处 理 器 并 不 知道 自 
青 楚 自己 是 刚才 经 过 调用 门 进 到 高 特权 级 的 ， 
































所 以 它 也 不 知道 应 该 原 路 返回 到 低 特 

















了 retf 指令 来 保证 的 。 所 以 ， 处 理 






































器 有 权 怀 疑 自 己 到 底 是 不 是 从 





下 面 是 利用 retf 指令 从 i 




















骨 用 门 返回 的 过 程 。 








周 用 门 过 来 的 ， 为 以 防 万 一 ， 它 从 调用 门 














回来 时 也 要 做 特权 级 检查 。 











(1) 当 处 理 器 执行 到 retf 指令 时 ， 它 知道 这 是 远 返 回 ， 所 以 需要 从 栈 中 返回 旧 栈 的 地 址 及 返回 到 低 特 
权 级 的 程序 中 。 这 时 候 它 要 进行 特权 级 检查 。 先 检查 栈 中 CS 选择 子 ， 根 据 其 RPL 位 ， 即 未 来 的 CPL， 











判断 在 返回 过 程 ! 
































是 否 要 改变 特权 级 。 





(2) 此 时 栈 项 应 该 指向 栈 中 的 EIP_old。 在 此 步 桑 中 获取 栈 中 CS_old 和 EIP_old， 根 据 该 CS_old 选择 
子 对 应 的 代码 段 的 DPL 及 选择 子 中 的 RPL 做 特权 级 检查 ， 规 则 不 再 痪 述 。 如 果 检查 通过 ， 先 从 栈 中 弹 
32 位 数据 ， 即 EIP old 到 寄存 器 EIP， 然 后 再 















































HT 
HI 








ni 

















弹出 32 位 数据 CS_old， 此 时 要 临时 处 理 一 下 ， 由 于 所 有 的 











段 寄 存 器 都 是 16 位 的 ， 当 然 包 括 CS， 所 以 丢弃 CS_old 的 高 16 位 ， 将 低 16 位 加 载 到 CS 寄存 器 。 此 时 
栈 指针 ESP_new 指向 最 后 一 个 参数 。 




















(3) 如 果 返 回 








指令 retf 后 面 











有 参数 ， 则 增加 栈 指针 ESP_new 的 值 ， 


















































以 跳 过 栈 中 参数 ， 按 理 说 ,“retf+ 


参数 ”是 为 了 跳 过 从 低 特 权 级 栈 中 复制 到 当前 高 级 栈 中 的 参数 ， 如 参数 1 和 参数 2， 所 以 retf 后 面 的 参数 
应 该 等 于 参数 个 数 * 参 数 大 小 。 此 时 ， 栈 指针 ESP_new 便 指向 ESP_old 。 
(4) 如 果 在 第 1 步 中 判断 出 需要 改变 特权 级 ， 从 栈 中 弹出 32 位 数 
































居 ESP_ old 到 寄存 器 ESP。 同 样 寄 
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第 5 章 保护 模式 进 阶 ， 向 内 核 迈 进 
存 器 SS 也 是 16 位 的 ， 故 再 弹出 32 位 的 SS_old， 只 将 其 低 16 位 加 载 到 寄存 器 SS， 此 时 恢复 了 旧 栈 。 相 
当 于 丢弃 寄存 器 SS 和 ESP 中原 有 的 SS_new 和 ESP_new。 

至 此 ， 程 序 流程 便 返 回 到 了 之 前 调用 “调用 门 ” 的 低 特 权 级 程序 。 

注意 ， 如 果 在 返回 时 需要 改变 特权 级 ， 将 会 检查 数据 段 寄存 器 DS、ES、FS 和 GS 的 内 容 ， 如 果 在 它 
们 之 中 ， 某 个 寄存 器 中 选择 子 所 指向 的 数据 段 描述 符 的 DPL 权限 比 返回 后 的 CPL (CS.RPL) 高 ， 即 数值 
上 返回 后 的 CPL> 数 据 段 描述 符 的 DPL， 处 理 器 将 把 数值 0 填充 到 相应 的 段 寄 存 器 。 

为 什么 在 这 种 情况 下 处 理 器 会 在 寄存 器 中 填充 0 呢 ? 

原因 是 这 样 的 ， 处 理 器 的 特权 级 检查 只 发 生 在 往 段 寄 存 器 中 加 载 选 择 子 的 时 候 ， 检 查 通 过 之 后 ， 再 从 
该 段 中 进行 后 续 数 据 访 问 时 就 不 需要 再 进行 特权 检查 了 。 这 是 比较 合理 的 , 哪 有 访问 一 次 数据 就 检查 一 次 
特权 级 的 ， 这 样 太 低 效 了 ， 这 和 现实 中 过 安检 是 一 样 的 ， 只 要 能 通过 “安全 门 ” 之 后 便 认 为 此 人 不 再 是 
危险 分 子 了 ， 总 之 检查 只 发 生 在 关卡 处 。 处 理 器 是 按照 人 的 思维 设计 的 ， 所 以 只 在 往 段 寄存 器 加 载 选 择 子 
时 检查 一 次 就 够 了 ， 之 后 对 该 段 的 读 写 访问 将 不 再 受 限 。 非 常 合理 是 吧 ? 但 问题 也 出 在 这 。 

当 用 户 程 序 通过 调用 门 进 入 内 核 程序 时 ， 处 理 器 的 CPL 变 为 0， 内核 程 序 为 了 返回 用 户 进 程 所 需要 的 
数据 ， 内 核 必 然 会 访问 自己 的 数据 段 ， 其 DPL 为 0， 所 以 在 数据 段 寄存 器 中 的 选择 子 必须 是 内 核 自己 的 选 
择 子 ， 其 RPL 为 0。 这 样 CPL = RPL =0， 数 值 上 小 于 等 于 DPL， 这 样 特 权 级 检查 才 会 成 功 。 

比如 在 内 核 服 务 例 程 中 这 样 访问 内 核 自 己 的 数据 段 : 

mov ax, Selector DS RPLO 

mov ds,ax ; 更 新 数据 段 寄存 器 Ds， 使 其 指向 内 核 数 据 段 

此 时 会 进行 特权 级 检查 ) 

mov ax, [0x1234] ; 时 地 址 0x1234 的 默认 段 寄存 器 是 指向 内 核 数据 段 

在 这 之 后 ， 数 据 段 寄 存 器 ds 一 直 指向 内 核 自己 的 数据 段 。 

当 处 理 器 执行 retf 指令 从 内 核 态 返回 时 ， 处 理 器 顶 多 是 把 栈 中 低 特权 级 的 CS 选择 子 、EIP 的 值 、SS 
选择 子 和 ESP 的 值 分 别 重新 加 载 到 寄存 器 CS、EIP、SS 及 ESP。 像 DS 等 数据 段 寄存 器 是 不 会 被 更 新 的 。 
特权 级 检查 是 发 生 在 往 数 据 段 寄存 器 中 加 载 选择 子 的 时 候 , 此 时 DS 中 的 选择 子 依 然 是 指向 内 核 数 据 段 的 ， 
只 要 不 重新 加 载 段 寄存 器 DS， 特 权 级 检查 就 不 会 发 生 ， 所 以 返回 到 用 户 态 后 ， 此 时 虽然 CPL=3， 但 用 户 
进程 依然 可 以 直接 访问 内 核 数 据 段 中 的 数据 ， 这 还 得 了 。 

一 个 可 行 的 解决 办 法 是 操作 系统 代码 在 使 用 任何 一 个 数据 段 寄存 器 时 ， 先 将 其 入 栈 , 然后 再 更 新 其 选 
择 子 ， 在 使 用 完毕 之 后 ， 操 作 系 统 再 将 压 入 栈 中 的 选择 子 出 栈 恢 复 到 该 段 寄 存 器 。 比 如 : 

Dd 

mov ds,ax 

开始 访问 内 核 数据 自 

执行 内 核 服 务 代码 

在 内 核 服务 例 程 执行 完成 后 

pop ds 和 恢复 ds 

retf 

但 这 只 是 用 软件 来 避免 此 问题 的 方法 ， 谁 也 不 能 确保 软件 都 会 这 样 做 ， 甚 至 包括 操作 系统 。( 题 外 话 ， 
在 Linux 中 就 不 用 调用 门 ， 只 用 中 断 门 来 实现 系统 调用 ， 在 中 断 处 理 程 序 中 会 手动 更 新 所 有 寄存 器 ， 也 就 
是 手动 任务 恢复 上 下 文 ， 所 以 不 会 存在 此 类 问题 。) 

处 理 器 不 相信 第 三 方 的 软件 都 会 处 理 好 此 问题 , 甚至 操作 系统 也 不 值得 相信 , 毕竟 操作 系统 也 是 软件 ， 
处 理 器 只 相信 它 自己 。 








于 是 ， 在 返回 时 若 需 要 改变 特权 级 ， 处 理 
选择 子 所 指向 的 数据 段 描述 符 的 DPL 权限 比 目 标 特权 级 高 ， 处 至 






































器 必须 要 检查 所 有 数据 段 中 的 ; 








器 将 把 数值 


选择 子 , 若 DS、ES、FS 和 GS 中 
0 填充 到 相应 的 段 寄存 器 























把 段 寄 存 器 填充 为 

















其 实 这 和 全 局 描述 符 





0 就 解决 问题 了 吗 ? 显然 不 是 ， 
表 GDT 有 关 ， 
































GDT 中 第 0 个 段 
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目的 是 为 了 让 处 到 
听 兄 弟 慢 慢 道 来 。 


述 符 是 不 可 用 的 ， 称 之 为 哑 描 述 符 ， 为 什么 第 0 个 不 可 

















器 引发 异常。 




















大 

















在 很 久 以 





I 呢 ? 其 实 原 


前 就 说 过 了 ， 这 是 为 了 避免 选择 子 态 记 初 始 化 而 误 选 了 第 0 个 段 描述 符 ， 出 问题 时 通常 很 难 排查 出 来 。 比 
如 ， 如 果 选 择 子 态 记 初 始 化 的 话 ， 即 选择 子 的 高 13 位 段 描述 符 索 引 位 为 0， 这 表示 第 0 个 段 描述 符 ， 选 
择 子 中 的 TI 为 0, 这 表示 在 GDT 中 检索 , RPL 虽然 也 为 0, 但 咱们 不 关心 , 这 种 0 值 的 选择 子 就 会 在 GDT 
中 检索 到 第 0 个 哑 描 述 符 ， 从 而 引发 处 理 器 的 异常 。 

以 上 在 段 寄 存 器 中 填充 0， 便 是 利用 选择 子 为 0 引发 异常 的 原理 。 


5.4.6 ”RPL 的 前 世 今生 


由 于 咱们 用 不 到 调用 门 ， 所 以 大 伙 儿 对 它 的 了 解 不 用 太 深 , 我们 以 调用 门 举例 ， 是 为 了 引出 为 什么 要 
用 请 求 特 权 级 RPL。 
调用 门 大 致 原理 就 是 这 样 ， 咱 们 举 个 例子 来 说 明 潜 在 的 危险 。 看 看 仅仅 靠 CPL 和 DPL 行 不 行 。 
调用 门 A 可 以 帮助 用 户 程 序 把 硬盘 某 个 扇 区 的 数据 写 入 到 用 户 指定 的 内 存 缓冲 区 中 , 说 得 似乎 很 “ 底 
层 ” 的 样子 ， 其 实 就 是 读 文件 的 功能 。 因 此 ， 此 调用 门 需要 三 个 参数 ， 分 别 是 磁盘 逻辑 扇 区 号 LBA、 内 
存 缓冲 区 所 在 数据 段 的 选择 子 、 内 存 缓冲 区 的 偏 移 地 址 。 正 常情 况 下 ， 其 流程 如 图 5-57 所 示 。 
图 中 的 步骤 看 上 去 好 和 谐 ， 似 乎 哪个 环节 都 不 会 出 问题 。 当 3 特权 级 的 用 户 程序 使 用 调用 门 后 ， 处 理 器 进 
入 了 0 特权 级 ， 也 就 是 CPL 为 0， 这 已 经 是 最 高 的 特权 级 了 ， 不 管 受 访 者 的 DPL 是 多 少 ， 如 果 特 权 检 查 仅仅 
靠 CPL 和 DPL 这 两 项 的 话 ， 数 值 上 CPL 志 DPL， 这 时 候 处 理 器 可 以 说 已 经 是 傲视 天 下 了 ， 可 以 访问 并 获得 任 
何 资 源 。 何 况 内 存 缓冲 区 是 3 特权 级 的 用 户 数据 段 ， 这 更 不 在 话 下 ， 处 理 器 是 有 资格 将 数据 写 入 缓冲 区 的 。 

其 实 只 是 正常 情况 下 是 这 样 , 因为 正常 情况 下 用 户 所 提交 的 缓冲 区 的 选择 子 指向 用 户 自己 的 数据 段 。 说 
到 这 估计 您 也 想到 了 ， 问 题 来 了 ， 倘 若 用 户 程 序 怀 着 一 颗 有 非法 企图 的 心 ， 将 参数 一 一 缓冲 区 所 在 数据 段 
的 选择 子 ， 用 内 核 数据 段 的 选择 子 代替 (用 多 个 选择 子 测试 几 次 数据 便 可 推测 内 核 数 据 段 )， 这 样 就 把 内 
核 破坏 了。 结果 如 图 5-58 所 示 ， 绥 冲 区 位 于 内 核 数 据 区 啦 。 
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再 举 个 例子 ， 这 个 例子 可 能 不 现实 ， 但 这 是 可 能 的 ， 仅 仅 是 为 了 暴露 出 问题 。 
假如 用 个 内 存 复 制 功能 的 调用 门 ， 就 可 以 轻易 地 获得 内 核 数 据 ， 让 用 户 进程 获得 内 核 数 据 ， 这 也 是 万 
万 不 可 的 ， 比 如 某 个 调用 门 可 以 完成 类 似 memcpy 的 功能 ， 参 数 是 : 数据 源 所 在 段 的 选择 子 及 数据 源 的 偏 
移 地 址 ， 目 的 地 址 所 在 段 的 选择 子 及 目的 地 址 的 偏 移 地 址 和 拷贝 的 字 节 数据 量 ， 一 共 5 个 参数 。 
当 用 户 进程 通过 调用 门 陷 入 内 核 后 ， 处 理 器 的 特权 级 变 为 0 级 ， 还 是 那 句 话 ， 如 果 特 权 检查 仅仅 靠 
CPL 和 DPL 这 两 项 的 话 ， 这 时 候 处 理 器 可 以 访问 并 获得 任何 资源 。 
正常 情况 下 , 用 户 进程 若 老 老实 实地 提交 自己 的 数据 段 选择 子 作为 数据 源 , 那 当然 是 一 位 遵 纪 守 法 的 好 市 
民 。 但 如 果 提 交 的 数据 源 参数 是 内 核 数 据 段 选择 子 ， 用 户 必 然 会 获取 到 内 核 的 数据 ， 这 等 于 内 核 完全 暴露 。 
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Fz 
您 看 ， 





咱们 看 看 目前 的 两 个 必须 保证 的 客观 条 件 。 
能 访问 系统 资源 ， 不 能 越 姐 代 应 去 做 操作 系统 的 事 ， 这 是 安全 的 底线 ， 操 作 系统 必须 保证 
想 做 点 “大 事 ”， 


(1) 用 户 不 
用 户 程序 不 会 乱 动 系统 资源 。 看 来 ， 用 户 程序 要 


























的 0 特级 级 。 





以 上 是 两 个 雷 打 不 动 的 客观 条 件 ， 必 须要 这 检 























仅仅 靠 CPL 和 DPL 还 真 不 行 ， 





之 无 安全 可 言 ， 了 只 






































(2) 处 理 器 必须 要 陷入 内 核 才 能 帮助 用 户 程 请 








地 交 出 来 ， 也 就 是 说 在 现 有 





仔 


























系统 想 要 数据 ， 它 还 以 为 请 














是 代 





寺 用 户 程 序 来 拿 数 











为 3， 
让 受 ; 


ee 


它 ， 否 则 直 








按 道班 

















访问 者 知道 ， 
接 拒绝 


























请 求 。 

















RPL 完美 地 解决 了 这 个 问题 


RPL 是 谁 ? RPL，Request Privilege Level， 
特权 级 ， 我 的 言 外 之 意 是 说 RPL 其 

以 后 在 请 求 某 特 权 级 为 DPL 级 别 的 资 ; 
的 特权 必须 同时 大 了 
上 CPL>=DPL 并 且 RPL<DPL 
有 没有 读者 想 过 ， 
大 家 想 想 看 ，GDT、LDT 等 全 局 
述 符 的 索引 ， 








数值 








符 、 门 描 


所 以 ， 





























CPL， 为 此 ， 











般 情 


有 没有 同学 | 




















RPL 不 是 位 于 i 





况 下 选择 子 都 是 
































处 理 器 还 提供 了 











程 时 ， 用 户 进程 P 


进程 不 涉及 


的 ， 操 作 系 统 对 上 自 i 


的 客观 条 件 下 ， 看 上 去 无 i 
想 想 ， 出 现 问 题 的 原因 是 : 受 访 者 不 知道 访 
表 求 者 是 操作 系统 呢 。 











f 才 行 ， 当 处 理 咒 在 0 特级 下 时 ， 跟 谁 要 数据 谁 








们 分 析 下 问题 出 在 哪里 。 











必须 要 由 操作 系统 出 面 啦 。 























做 “大 事 ”， 所 以 处 理 器 的 当前 特权 级 会 变 成 至 高 














都 得 











十 可 施 啦 























TY , 


问 者 的 真实 











实际 情 





况 是 请 











求 者 为 3 特权 级 下 的 用 户 程序 ， 内 核 程 





似乎 得 增加 条 件 才 行 。 
身份 ， 在 受 访 者 看 来 ， 是 0 特权 级 的 



































是 的 。 即 资源 的 真正 请 求 者 是 
LE 低 特权 级 的 访问 者 是 不 被 允许 访问 这 些 
真正 请 求 资源 的 是 谁 ， 它 到 


。 之 前 只 是 简单 地 说 了 下 RPL， 现 在 该 是 揭 开 
请 求 特权 级 ， 这 么 说 有 点 歧义 ， 














j 户 程序 ， 















































交 是 代表 真正 





选择 子 中 的 低 2 位 吗 ? | 
系统 数据 表 都 是 
理所当然 选择 子 也 应 该 由 操作 系统 构建 ， 
操作 系统 提供 
系统 服务 ， 如 果 需 要 提交 选择 子 作 为 参数 ， 为 安 
侈 改 rpl 的 相关 指令 ， 后 面 会 介绍 








资源 需求 者 的 CPL， 大 伙 儿 继 纪 
原 时 , 参与 特权 检查 的 不 只 是 CPL, 还 要 加 上 RPL, CPL 和 RPL 
F 等 于 受 访 者 的 特权 DPL， 即 : 











而 它 却 是 破坏 者 。 用 户 程 序 所 处 的 特 








高 特权 级 的 内 核资 源 ， 问 题 就 出 在 这 ， 我 们 要 想 
底 有 没有 资格 获取 这 些 数据 。 如 果 它 有 


























它 的 本 来 面目 的 时 
其 实 它 代表 真正 
志 听 我 说 。 




















求 















































j 户 提供 

















的 选择 子 ， 难 道 






































的 ， 也 就 是 说 控 于 


操作 系统 构建 的 ， 

















问 ， 什 么 时 候 用 户 需 
的 数据 和 代码 单独 存在 于 某 些 代码 段 和 数 
提交 选择 子 做 参数 的 话 ， 操 作 系统 服务 程序 









































为 所 有 用 户 























段 。 因 为 用 
两 个 选择 子 就 


























自己 提交 选择 子 ? 其 实 这 还 是 比较 久远 的 事 了 ,在 非 平坦 模型 
居 段 中 ， 肯 定 是 要 用 选择 子 来 指定 

















户 程 序 在 自己 的 虚拟 地 址 空间 中 运行 ， 





i 够 了 ， 也 就 是 说 用 














序 内 部 就 用 这 两 个 用 户 级 的 选择 子 便 可 
上 面 这 段 内 容 算是 小 扩展 了 一 下 ， 
用 户 程 序 的 CPL 是 不 会 骗 人 的 ， 不 可 能 











寄存 器 CS : 
即使 改 的 话 ， 
当 它 申请 
所 以 ， 即 使 用 
办 
们 系统 ! 




















Er 














用 户 程序 也 只 能 
































arpl 通 


目的 操作 数 可 以 是 任意 
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户 进 程 在 申请 系统 服务 时 无 需 提 供 











以 搞定 
咱们 还 是 回来 继续 说 最 基本 的 东西 。 
操作 系统 在 加 载 





I 权 在 操作 系统 手 里 。 当 
全 起 见 ， 操 作 系统 会 把 选择 子 中 的 RPL 改 为 用 户 程 





只 有 操作 系统 知道 表 中 段 





无 上 


乖乖 


操作 
序 只 
权 级 
办 法 


权限 的 话 就 把 资源 给 


器 了 。 


者 的 


] 户 不 能 伪造 个 RPL? 


描述 





























时 作 系统 分 派 给 用 户 进程 使 
j 户 程序 1 


党 



































求 



































就 行 了。 


操作 
序 的 


下 编 

















的 。 如 果 











内 部 所 用 
,的 东西 还 是 不 用 质疑 的 。 比 如 说 在 平坦 模型 下 ， 整 个 4GB 内 存 是 一 个 段 ， 操 作 系统 


进程 构建 了 两 个 用 户 级 的 RPL 为 3 的 选择 子 ,分 别 指向 4GB 











的 选择 子 肯 定 都 是 操作 系统 自己 的 














的 用 户 数 据 段 和 4GB 的 用 户 











| 户 
构造 





代码 





























各 








一 切 。 





擅 造 ， 它 起 始 是 由 











的 选择 子 也 没 用 ， 
， 在 汇编 中 就 是 arpl 指令 
是 给 介绍 下 比较 踏实 ， 




















的 低 2 位， 就 是 RPL 的 位 置 ， 而 CS 寄存 器 只 能 通过 call、jmp、ret、 
在 3 级 特权 下 折腾 ， 
了 系统 服务 ,， 如 果 提 交 了 选择 子 作 为 参数 ,选择 子 中 的 RPL 也 会 被 操作 系统 
es 
0 RPL 的 指令 
用 不 上 , 还 








其 RPL 








其 用 法 是 : 




















16 位 通 


寄存 器 




















个 通用 寄存 器 或 16 位 大 小 的 内 存 ， 它 们 


] 户 进程 的 虚拟 地 址 不 冲突 ， 所 以 各 用 户 程 序 共 





只 要 用 户 进程 不 请 


会 被 操作 系统 
， 此 指令 




















选择 子 ， 从 而 ,操作 系统 在 系统 服 









































jj 这 
务 程 



























































其 CPL 替换 ， 还 其 

















户 程序 时 赋予 的 ， 记 录 在 段 
int、sysenter 等 指令 修改 ， 
求 操作 系统 服务 ， 它 的 CPL 是 不 会 变 的 ， 
侈 改 为 用 户 进程 的 CPL。 
“ 丰 身 ” 











用 来 修改 选择 子 中 的 RPL。 虽 然 








在 
































用 来 存储 用 户 提交 的 选择 子 ， 





源 操 


作 数 是 16 位 通用 寄存 器 ， 里 面 存储 用 户 进 程 的 代码 段 寄 存 器 CS 的 值 。 实 际 此 指令 操作 数 就 变 成 了 : 
arpl 用 户 提交 的 选择 子 ， 用 户 段 寄 存 器 CS 的 值 
这 样 一 来 ， 不 管用 户 是 否 伪造 了 选择 子 中 的 RPL，RPL 都 通通 被 置 为 正确 的 值 。 

还 有 一 点 要 说 的 是 这 里 的 源 操作 数 ， 也 就 是 用 户 CS 寄存 器 的 值 是 从 栈 中 获取 到 的 (肯定 不 是 用 户 E 

己 主 动 提交 的 ， 它 可 没有 那么 “老实 ”)。 现 在 要 剧 透 一 下 啦 ， 是 这 样 的 :用户 程序 为 3 特权 级 ， 它 当 请 求 

系统 服务 时 ， 需 要 陷入 内 核 ， 处 理 器 会 进入 0 特权 级 ， 此 时 ， 由 于 是 远 转移 ， 处 理 器 会 自动 将 段 寄 存 器 

CS 和 EIP 的 值 压 入 栈 中 ， 而 且 特 权 级 也 发 生 了 变化 ， 所 以 一 块 压 入 的 还 有 寄存 器 SS、ESP， 这 4 项 都 是 

用 户 程序 的 寄存 器 环境 ， 这 方面 内 容 在 讲 完 这 部 分 后 我 们 马上 会 说 。 这 样 操 作 系统 便 可 以 在 栈 中 获取 到 用 

户 程序 的 CS 寄存 器 的 值 ， 以 便 将 其 作为 arpl 指令 的 源 操 作 数 。 
另外 ， 除 了 加 载 用 户 程序 时 ， 在 其 他 时 段 的 CPL 是 由 目标 代码 段 的 DPL 变 成 的 ， 即 切换 到 新 特权 代 

码 段 后 ， 新 代码 段 的 DPL 被 存储 到 段 寄 存 器 CS 中 的 低 2 位 ， 就 是 RPL 的 位 置 。 其 实 这 再 合理 不 过 了 ， 

CPU 是 切换 到 新 的 特权 级 代码 段 上 运行 了 ， 身 份 变 了 ， 当 然 要 用 新 代码 段 的 DPL 做 CPL 。 

RPL 引入 的 目的 是 避免 低 特权 级 的 程序 访问 高 特权 级 的 资源 。 有 了 RPL 之 后 ， 我 们 说 一 下 现在 的 特 

权 检 查 的 步骤 ， 看 看 是 否 能 解决 之 前 的 问题 。 
DPL 相当 于 权限 的 门槛 , 它 代 表 进 入 本 描述 符 所 对 应 内 存 区 域 的 最 低 权 限 , 任何 想 迈 过 这 个 门槛 的 人 ， 

它 的 RPL 和 CPL 权限 必须 都 要 大 于 等 于 DPL， 即 数值 上 CPL<DPL && RPL<DPL。 
特权 级 检查 实际 上 就 是 让 CPU 检查 数值 上 CPL 三 DPL && RPLDPL 是 否 成 立 ， 这 是 工程 师 给 处 理 

器 设置 的 规则 ,用 来 检查 当前 请 求 者 和 真正 的 资源 需求 方 是 否 都 具有 访问 受 访 者 的 资格 。 这 么 做 的 原因 是 

当前 请 求 者 和 资源 需求 方 有 可 能 不 是 同一 个 人 , 也 许 只 是 某 人 拜托 了 一 位 有 能 力 的 人 作为 自己 的 代理 人 去 
































































































































































































































































































































































































































































































































































































































































































































获取 资源 ， 代 理 人 肯定 是 无 所 不 能 的 ， 哪 块 数据 都 能 得 到 ， 但 受 访 者 不 知道 请 求 者 是 否 是 代理 ， 引 入 RPL 
的 目的 是 让 受 访 者 知道 ,不 管 当前 请 求 者 是 不 是 代理 ， 即 使 当前 请 求 者 是 替 别 人 来 合 数 据 的 ， 那 个 人 也 必 
须 得 有 获得 数据 的 权限 才 行 ， 否 则 照样 驱 回 当前 的 请 求 者 。 























特权 级 检查 发 生 在 什么 时 候 呢 ? 如 何 被 触发 ? 

32 位 保护 模式 下 对 内 存 的 访问 要 通过 段 描述 符 ， 段 描述 符 中 有 DPL， 这 是 内 存 的 关卡 ， 咱 们 现实 生 
活 中 的 检查 也 是 在 关卡 处 执行 的 ， 所 以 处 理 器 的 特权 检查 ， 都 是 只 发 生 在 往 段 寄存 器 中 加 载 选择 子 访问 描 
述 符 的 那 一 瞬间 ， 所 以 ，RPL 放 在 选择 子 中 是 多 么 的 合理 。 这 里 所 说 的 加 载 选择 子 ， 是 指 任何 访问 ， 无 论 
是 代码 ， 还 是 数据 。 处 理 器 的 特权 检查 只 发 生 在 访问 前 的 一 瞬间 ， 这 和 现实 生活 中 是 一 样 的 ， 通 过 检查 之 
后 再 也 不 管 了 ， 直 到 遇 到 新 的 关卡 ， 否 则 执行 一 步 指令 就 要 检查 一 次 特权 级 ， 处 理 器 喻 活 都 下 干 了 。 

总 结 下 不 通过 调用 门 、 直 接 访 问 一 般 数据 和 代码 时 的 特权 检查 规则 ， 对 于 受 访 者 为 代码 段 时 : 

。 如 果 目 标 为 非 一 致 性 代码 段 ， 要 求 : 

数值 上 CPL=RPL= 目 标 代码 段 DPL 

。 如 果 目 标 为 一 致 性 代码 段 ， 要 求 : 

数值 上 CPL 三 目标 代码 段 DPL && RPL 宇 目标 代码 段 DPL) 

受 访 者 若 为 代码 ， 只 有 在 特权 级 转移 时 才 会 被 用 到 ， 所 以 有 关 代 码 的 特权 检查 都 发 生 在 能 够 改变 代码 
段 寄存 器 CS 和 指令 指针 寄存 器 EIP 的 指令 中 ， 即 这 些 指 令 要 么 改变 EIP, 要 么 改变 CS 和 EIP。 例如 call、 
jmp、int、ret、sysexit 等 能 改变 程序 执行 流 的 指令 。 

对 于 受 访 者 为 数据 段 时 : 

数值 上 “CPL 三 目标 数据 段 DPL && RPL 科 目标 数据 段 DPL) 

栈 段 的 特权 级 检查 比较 特殊 ， 因 为 在 各 个 特权 级 下 ， 处 理 器 都 要 有 相应 的 栈 〈 后 面 会 说 到 )， 也 就 是 
说 栈 的 特权 等 级 要 和 CPL 相同 。 所 以 往 段 寄存 器 SS 中 赋予 数据 段 选择 子 时 ， 处 理 器 要 求 CPL 等 于 栈 段 
选择 子 对 应 的 数据 段 的 DPL， 即 数值 上 CPL = RPL = 用 作 栈 的 目标 数据 段 DPL 。 

受 访 者 若 为 数据 ， 特 权 级 检查 会 发 生 在 往 数 据 段 寄存 器 中 加 载 段 选择 子 的 时 候 ， 数 据 段 寄存 器 包括 
DS 和 附加 段 寄 存 器 ES、FS、GS。 

举 个 例子 ，mov ds，ax 时 便 会 触发 特权 级 检查 。ax 中 的 值 被 当 作 选择 子 ， 处 理 器 会 拿 ax 中 的 低 2 位 ， 
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即 RPL 和 CPL 分 别 与 ax: 














选择 子 才能 被 加 载 到 DS 中 。 
































选择 子 所 指向 的 段 描 述 符 的 DPL 做 比较 , 如 果 满 足 RPL<DPL && CPL<DPL， 




















大 家 不 要 把 CPL 和 RPL 搞 混 了 ， 不 要 误 以 为 都 是 对 同一 个 程序 而 言 的 ， 它 们 也 许 不 都 属于 同一 个 程序 。 














RPL 是 位 于 选择 子 ' 














是 自己 提供 的 选择 子 ， 那 肯 
两 段 程序 。CPL 是 对 当前 正 尹 


























和 CPL 出 自 


















































“委托 、 











该 调用 门 提供 3 个 参数 : 文件 所 在 的 硬盘 肩 区 号 、 























的 ， 所 以 ， 要 看 当前 运行 的 程序 在 访问 数据 或 代码 时 用 的 是 谁 提供 的 选择 子 ， 如 果 用 的 


















































定 CPL 和 RPL 都 出 


自 同一 个 程序 ， 如 果 选 择 子 是 别人 提供 的 ， 那 就 有 可 能 RPL 
































运行 的 程序 而 言 的 , 而 RPL 有 可 能 是 正在 运行 的 程序 , 也 可 能 不 是 。 











在 一 般 情况 下 ,如 果 低 特权 级 不 向 高 特权 级 程序 提供 自己 特权 级 下 的 选择 子 ， 




















就 是 不 涉及 向 高 特权 级 程序 
































代理 ”办 事 的 话 ，CPL 和 RPL 都 来 自 同 

















程序 。 但 凡 涉 及 “委托 、 代 理 ” 进入 0 特权 级 后 ，CPL 是 



































指 代理 人 ， 即 内 核 ，RPL 则 有 可 能 是 委托 者 ， 即 用 户 程序 ， 也 有 可 能 是 内 核 自 己 。 还 是 拿 之 前 说 过 的 调用 
举例 ， 某 用 户 进 程 运行 在 3 特权 级 ， 它 想 通 过 调用 门 读 取 硬盘 上 某 个 文件 到 它 E 



































门 A 
己 的 数据 缓冲 区 中 。 它 需要 向 








































































































于 宇 获 


























地 址 。 用 户 进程 只 能 把 与 























RPL 必然 为 3。 进 入 i 
读 取 完 数据 后 ， 需 要 将 其 写 入 用 户 的 组 
缓冲 区 所 在 段 的 DPL 为 3， 此 时 CPL 为 0， 即 数 


周 用 门 后 ， 处 理 器 的 CPL 











] 于 存储 文件 的 缓冲 区 所 在 的 数据 段 选 择 子 以 及 缓冲 区 的 偏 

















自己 同一 特权 的 数据 段 作为 缓冲 区 ， 所 以 该 缓冲 区 所 在 段 的 DPL 为 3， 其 选择 子 












































由 运行 用 户 进程 时 的 3 级 变 成 内 核 态 的 0 级 ， 当 内 核 从 硬盘 

















区 中 。 


















































缓冲 区 的 选择 子 是 由 用 户 提供 的 ， 其 RPL 如 上 所 述 为 3， 














值 上 (CCPL 入 DPL && RPL 入 DPL) 成 立 ， 于 是 写 入 成 功 。 大 























伙 儿 看 到 了 ，RPL 是 用 户 进程 提供 的 ， 而 往 缓冲 区 写 数据 时 CPL 指 的 是 内 核 ， 不 是 同一 个 程序 。 





也 许 您 对 上 述 例子 中 使 用 
循序 渐进 。 
门 ， 较 “直接 ”的 访问 : 


特权 级 检查 的 例子 ， 








对 于 一 般 不 通过 使 用 









































周 用 门 时 的 特权 级 检查 感 兴趣 ， 后 面 会 有 详细 的 过 程 ,，n 




















们 先 举 几 个 简单 


bam 


的 





















































比如 ， 当 前 运行 的 是 











j 户 进程 ， 














为 3， 此 时 进程 想 往 自己 的 数据 段 ! 
子 通常 是 由 操作 系统 提供 




















写 入 数据 ， 





























的 )， 由 于 此 时 的 写 入 只 是 同 级 操作 ， 用 户 自 i 


也 就 是 处 理 器 的 CPL (CS.RPL) 为 3， 用 











户 进 程 自己 的 数据 段 DPL 
进程 就 要 提供 自己 数据 段 的 选择 子 到 段 寄存 器 DS 选择 
, 便 能 够 完成 ， 不 需要 系统 功能 调 




































































用 , 所 以 操作 系统 自然 也 不 知道 此 事 。 CPL=RPL=3, DPL=3， 故 数值 上 满足 (RPL<DPL && CPL 志 DPL)， 


写 入 没 问题 。 











择 子 。 


























还 是 这 个 用 户 进程 ， 现 在 它 想 往 内 核 数据 段 
按理 说 内 核 数据 段 选择 子 是 
选择 子 。 因 为 GDT 大 小 是 有 限 的 ， 除 第 0 个 描述 符 不 能 用 


























` 会 暴露 给 

















j 户 的 ， 但 用 





搞 点 破坏 ， 想 写 入 数据 ， 所 以 它 就 要 提供 内 核 数据 段 的 选 
户 能 猜 出 来 ， 所 以 可 以 伪造 一 个 内 核 数据 段 的 

































































的 方法 。 








用 户 进程 在 3 级 环 : 











以 外 ， 其 他 的 都 可 以 挨个 试 ， 哈哈 ， 也许 有 更 好 








浇 下 想 直 接 写 入 内 核 数 据 段 ， 它 伪造 的 选择 子 的 RPL 为 0， 故 CPL =3，RPL= 0， 

















内 核 数 据 段 DPL=0， 故 数值 上 不 满足 RPL 和 DPL && CPL 三 DPL， 从 而 写 入 失败 ， 处 理 器 抛 出 GP 异常 ， 即 





一 般 保护 性 错误 。 


















































其 实 只 要 CPL 为 3， 伪 造 的 RPL 是 多 少 都 不 行 ，CPL 才 是 短 板 。 





在 举例 调用 门 的 例 
了 一 下 ， 因 为 涉及 到 RPL。 现 在 


子 之 前 , I 





























们 得 把 之 前 遗 




















调用 门 本 身 是 个 描述 符 ， 所 以 它 有 个 DPL， 我 们 暂且 














留 的 工作 完成 。 前面 咱 们 在 介绍 调用 门 的 特权 检查 时 暂停 





























民 大 家 说 道 说 道 。 























将 其 记 作 DPL_GATE。 而 且 门 用 来 指向 一 段 程 














序 ， 程 序 所 在 的 代码 段 本 身 也 有 个 DPL， 和 暂且 将 其 记 作 DPL_CODE。 所 以 ， 你 懂 的 ， 使 用 调用 门 会 涉及 
对 这 两 个 DPL 的 特权 级 检查 。 






































级 的 门框 ， 表 示 特 权 上 限 ， 如 图 5-59 所 示 。 


如 图 5-59 所 示 ， 对 于 门 来 说 ， 处 型 





























首先 ， 门 的 作用 相当 于 蹦床 ， 门 槛 低 ， 但 能 跳 到 更 高 的 特权 级 之 上 。 
DPL_ GATE 相当 于 特权 级 的 门槛 ， 








(1) 要 求 CPL 和 RPL 在 DPL GATE 和 DPL CODE 之 间 。 


(2) RPL 只 用 在 进 调用 门 时 禾 











上 DPL GATE 比较 一 次 ， 不 参与 和 





DPL_CODE 
表示 特权 下 限 ，DPL_ CODE 相当 于 特权 门 结构 
ee DPL_GATE 
4 图 5-59 ”CpL 与 门 特 权 级 关系 


























DPL _ CODE 比较 。 原 

















段 的 ， 过 了 这 个 调用 门 

















方面 是 门 描述 符 选 择 子 只 用 来 索引 门 结构 ， 如 调用 门 ， 不 是 




















的 检查 ， 此 选择 了 











中 的 RPL 即使 是 被 ) 
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来 索引 任何 内 存 




















于 也 不 














j 户 进程 伪造 的 ， 为 了 成 功 














需要 了 ， 不 会 有 涝 在 的 威胁 。 另 一 方面 ， 门 描述 符 选 择 子 
， 也 只 能 改 成 比 CPL 更 高 的 特权 ， 否 则 没 意 义 ， 连 门槛 



































DPL_GATE 都 进 不 了 。 所 以 ， 即 使 RPL 是 伪造 的 ，CPL 也 为 相对 较 低 的 特权 ， 它 相当 于 特权 短 板 。 在 接 
下 来 的 检查 中 ， 如 果 要 求 RPL 和 CPL 同时 比 门框 特权 级 DPL_CODE 低 的 话 ， 为 了 避免 RPL 是 伪造 的 ， 
仅 用 CPL 和 DPL_ CODE 比较 就 够 了 ， 无 需 RPL 参与 。 

如 上 所 述 ， 处 理 器 对 于 门 的 特权 检查 ， 公 式 为 : 

(1) 数值 上 DPL _ GATE 宇 CPL 宇 DPL CODE (对 应 上 面 的 1)。 


































































































并 且 
(2) 数值 上 RPL 三 DPL GATE (对 应 上 面 的 2)。 
以 上 两 点 要 同时 满足 。 






































注意 ， 门 描述 符 中 的 选择 子 只 是 用 来 指向 目标 程序 所 在 的 代码 段 的 ， 而 真正 请 求 者 是 使 用 调用 门 的 程 
序 ， 所 以 门 描述 符 中 选择 子 的 RPL 并 不 参与 特权 级 检查 ， 因 为 它 并 不 代表 真正 请 求 者 。 
调用 门 是 用 call 指令 和 jmp 指令 来 调用 的 ，jmp 指令 只 能 用 于 平 级 跳 转 ，call 可 以 跨越 特权 级 。 对 于 
一 致 性 代码 ， 由 于 转移 过 去 后 CPL 并 不 会 有 变化 ， 等 同 于 同 级 转移 ， 所 以 特权 及 检查 对 于 call 和 jmp 来 
说 是 没 区 别 的 ， 都 是 用 上 面 的 两 个 公式 。 可 是 对 于 非 一 致 性 代码 就 不 同 了 ， 转 移 到 非 一 致 性 代码 段 后 ， 会 
涉及 到 特权 级 变化 ，call 指令 支持 跨越 特权 的 转移 ， 其 特权 检查 还 是 上 面 那 两 个 公式 ， 而 jmp 只 适用 于 特 
权 级 平 级 转移 ，CPL 必须 等 于 目标 代码 段 的 DPL。 所 以 ， 对 于 jmp 的 特权 级 检查 ， 公 式 如 下 : 
(1) 数值 上 DPL _GATE 宇 CPL = DPL _CODE。 

并 且 
(2) 数值 上 RPL 入 DPL GATE。 
们 就 说 完了 ， 也 许 有 同学 还 不 是 很 清楚 CPL、RPL、DPL 的 关系 ， 下 面 咱们 通过 
调用 门 的 例子 把 这 一 过 程 梳理 下 。 
段 设 当 DPL 为 3 的 代码 段 上 运行 ， 即 正在 运行 用 户 程 序 ， 故 处 理 器 当前 特权 级 CPL 为 
3。 此 时 用 户 进程 想 获取 安装 的 物理 内 存 大 小 ， 该 数据 存储 在 操作 系统 的 数据 段 中 ， 该 段 DPL 为 0。 由 于 
当前 运行 的 是 用 户 程序 ，CPL 为 3， 所 以 无 法 访问 DPL 为 0 的 数据 段 。 于 是 它 使 用 调用 门 向 系统 救助 。 
调用 门 是 操作 系统 安装 在 全 局 描述 符 表 GDT 中 的 ， 为 了 让 用 户 进程 可 以 使 用 此 调用 门 ， 操 作 系 统 将 该 调 
用 门 描述 符 的 DPL 设 为 3。 该 调用 门 只 需要 一 个 参数 , 就 是 用 户 程 序 用 于 存储 系统 内 存 容量 的 缓冲 区 所 在 

中段 的 选择 子 和 偏 移 地 址 。 调 用 门 描述 符 中 记录 的 就 是 内 核 服 务 程序 所 在 代码 段 的 选择 子 及 在 代码 段 内 
的 偏 移 量 。 用 户 进程 用 “call 调用 门 选择 子 ” 的 方式 使 用 调用 门 ， 此 调用 门 选择 子 是 由 操作 系统 提供 的 ， 
该 选择 子 的 RPL 为 3, 此 时 如 果 用 户 伪 造 一 个 调用 门 选择 子 也 没 用 , 因为 此 选择 子 是 用 来 索引 门 描述 符 的 ， 
并 不 用 来 指向 缓冲 区 的 选择 子 ， 调 用 门 选 择 子 中 的 高 13 位 索引 值 必须 要 指向 门 描 述 符 在 GDT 中 的 位 置 ， 
选择 子 中 低 2 位 的 RPL 伪造 也 没 意 义 ， 因 为 此 时 CPL 为 3， 是 短 板 ， 以 它 为 主 。 此 时 处 理 器 便 进行 特权 
级 检查 ，CPL 为 3，RPL 为 3， 门 描述 符 DPL 为 3， 即 数值 上 《CPLDPL && RPLDPL) 成 立 ， 初 步 
仿 查 通过 。 接 下 来 还 要 再 将 CPL 与 门 描 述 符 中 选择 子 所 对 应 的 代码 段 描 述 符 DPL 比较 ， 这 是 调用 门 对 应 
的 内 核 服务 程序 的 DPL， 为 叙述 方便 将 其 记 作 DPL_CODE。 由 于 DPL CODE 是 内 核 程序 的 特权 级 ， 所 以 
DPL CODE 为 0，CPL 为 3， 即 数值 上 满足 CPL 三 DPL CODE，CPL 比 目 标 特权 级 低 ， 检 查 通 过 ， 该 用 
户 程序 可 以 用 调用 门 ， 于 是 处 理 器 的 当前 特权 级 CPL 的 值 用 DPL_CODE 代替 ， 记 录 在 CS.RPL 中 ， 此 时 
CPL 变 为 0。 接 下 来 ， 处 理 器 便 以 0 特权 级 的 身份 开始 执行 该 内 核 服务 程序 ， 由 于 该 服务 程序 的 参数 是 用 

户 提交 的 缓冲 区 所 在 的 数据 段 的 选择 子 及 偏 移 量 ， 为 避免 用 户 将 缓冲 区 指向 了 内 核 的 数据 区 ， 安 全 起 见 ， 
在 该 内 核 服务 程序 中 ， 操 作 系 统 将 这 个 用 户 所 提交 的 选择 子 的 RPL 变更 为 用 户 进程 的 CPL， 也 就 是 指向 
缓冲 区 所 在 段 的 选择 子 的 RPL 变 成 了 3。 前面 说 过 , 参数 都 是 内 核 在 0 级 栈 中 获得 的 ， 虽 然 用 户 进程 将 组 
冲 区 的 选择 子 及 偏 移 量 压 在 了 3 特权 级 栈 中 , 但 由 于 调用 门 的 特权 级 变换 ， 参 数 已 经 由 处 理 器 在 固件 一 级 
上 自动 复制 到 0 特权 级 栈 中 了 。 用 户 的 代码 段 寄 存 器 CS 也 在 特权 级 发 生变 化 时 ， 由 处 理 器 自动 压 入 到 0 
特权 级 栈 中 , 所 以 操作 系统 需要 的 参数 都 可 以 在 自己 的 0 特权 级 栈 中 找到 .用 户 缓冲 区 的 选择 子 修 改过 后 ， 
接 下 来 内 核 服务 程序 将 用 户 所 需要 的 内 存 容量 大 小 写 到 这 个 选择 子 和 用 户 提 交 的 偏 移 量 对 应 的 缓冲 区 。 如 
果 用 户 程序 想 搞 破坏 ， 所 提交 的 这 个 缓冲 区 选择 子 指向 的 目标 段 不 是 用 户 进 程 自己 的 数据 段 , 而 是 内 核 数 
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提 
被 改 为 3， 数 值 上 不 满足 CPL<DP 


L && RPL<DPL, 


人 


人 





组 


中 段 或 内 核 代 码 段 ， 由 于 目标 段 的 DPL 为 0， 虽然 此 时 已 在 内 核 中 执行 ，CPL 为 0， 
区 中 的 写 入 被 拒绝 ， 处 到 


| 





























用 户 程序 提交 的 缓冲 区 选择 子 确 












































多 是 访问 上 
以 段 选择 子 上 











的 RPL 也 必须 为 0。 








实 指向 
RPL 入 DPL， 人 往 缓冲 区 中 的 写 入 则 会 成 功 。 如 果 
按照 数值 上 “(CPL 三 DPL && RPL 入 DPL) 的 策略 进行 新 一 轮 的 特权 检测 。 

通常 ， 如 果 不 是 用 户 程序 向 内 核 提交 缓冲 区 地 址 来 接收 数 # 
己 的 数据 段 或 代码 段 ， 内 核 服务 程 





] 户 程 











断 服 














序 自 己 的 数 所 








务 程 





日 选择 子 RPL 已 
器 引发 异常 。 如 


了 人 























果 








四 段 ，DPL 则 为 3， 数值 上 满足 CPLDPL && 











序 内 部 再 有 访问 内 核 自 























友 ! 




















绍 远 调用 门 的 执行 流程 
j 门 也 只 是 特权 平 级 转 


A 作 和 撑 
aa | 


GE: 


在 介 
即使 通过 调 
jmp 有 
那样 还 能 
栈 中 弹出 返 
特权 级 转移 只 能 
高 特权 级 的 代码 段 ， 处 理 器 也 J 
指令 从 高 特 到 低 特 权 乡 
































Ma 
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眼看 











口 











的 远 转 移 形式 ， 即 可 以 路 段 跳 转 ， 但 
来 。call 指令 还 能 回来 的 原因 


， 处 到 


移 ? 























后 ， 似 乎 也 该 结束 了 。 不 过 ， 不 知道 大 


居 的 话 ， 
若 访问 内 核 自 己 的 内 存 段 ， 








己 内 存 段 的 操作 ， 还 会 








内 核 不 会 主动 访问 用 户 的 内 存 段 ， 
1 于 内 存 段 的 DPL 为 0, 所 




















火 儿 有 没有 疑问 ， 为 什么 jmp 指令 
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它 












































特权 返 
级 的 栈 中 留 下 返回 地 址 ， 它 只 管 

















级 下 。 这 等 于 低 特权 下 的 资源 再 也 
也 许 这 就 是 它 的 宿命 ， 
用 门 返回 的 场合 。 
CPL、DPL、RPL 都 说 完了 ， 
有 些 模糊 的 。 为 了 帮助 大 伙 儿 理解 
不 知道 大 
小 学 生 A (用 
让 他 进门 ， 连 : 
的 年 龄 肯定 够 了 ， 门 J] 
对 B 说 ， 好 吧 ， 帮 别人 代 报 名 需要 
小 孩子 就 可 以 申请 身份 证 ， 只 是 自 


年 纪 这 么 小 啊 ， 不 到 法 人 


日 
















































































户 进 程 ) 特别 喜欢 开车 ， 他 就 
贰 写 报名 登记 表 的 机 会 都 没有 ， 
对 他 放行 ， 他 来 到 敬 校 招 4 


无 法 访问 了 。 











的 | 


j 途 是 一 去 不 
是 在 栈 中 压 入 了 返回 地 址 ， 将 来 
地 址 到 EIP 或 CS 和 EIP 中 ， 这 取决 于 用 的 是 否 是 跨 段 返回 











头 的 那 种 场合 ， 它 不 像 call 指令 
在 用 ret 系列 的 指令 时 ， 可 以 从 


指令 retf。 














1 低 转 向 高 ， 当 进入 高 特权 级 时 ， 栈 也 要 切换 到 高 特权 下 的 栈 ,假如 jmp 可 以 转移 到 








切换 到 了 高 特权 级 的 栈 ， 想 象 一 下 会 怎样 呢 ? 之 前 说 过 ， 除 可 以 用 
器 是 不 允许 从 高 特权 级 向 低 特权 级 转移 的 , 但 jmp 指令 不 会 在 高 特权 
， 不 管 回来 ， 所 以 即使 用 retf 指令 也 











Tetf 


























找 不 到 回来 的 路 ， 无 法 回 到 低 特 权 


口 
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它 就 是 被 设计 用 于 平 级 转移 的 ， 所 以 jmp 只 


j 在 不 需要 特权 级 变化 ， 且 不 从 调 














不 知道 大 家 有 没有 到 





电解 ， 其 实 我 当初 学 习 特 权 级 的 时 














， 我 在 半夜 失 














后 
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EE 














龄 越 小 有 效 








孩子 危险 驾驶 为 名 把 长 辈 B 批评 了 一 顿 (引发 异常 )。 








5.4.7 10 特权 级 


在 保护 模式 下 ， 处 理 

一 方面 将 指令 分 级 有 
行 ， 医 
作 系 统 ， 所 以 它 不 
行 起 着 非 同 小 可 的 影响 ， 操 作 系 统 

另 一 方面 
决定 的 ， 它 们 用 来 指定 执行 IO 
执行 ， 所 以 它们 称 
发 处 理 器 异常 。 
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体现 在 IO 读 写 控制 上 。IO 读 写 特权 是 
操作 的 最 小 特权 级 。IO 相关 的 和 
为 IO 敏感 指令 (LO Sensitive Instruction)， 如 果 当 前 特权 级 小 于 IOPL 时 执行 这 些 指 令 
这 类 指令 有 in、out、cli、sti。 所 以 你 懂 的 ， 不 只 是 操作 系统 可 以 进 





眠 时 特意 想 了 一 个 例子 。 

火 儿 学 车 了 没有 ， 报 考 驾 校 也 要 有 个 年 龄 限制 ， 即 使 考 C 本 B 本 也 要 分 生 
i 是 想 考 个 驾照 ， 可 驾校 的 门 ] 
么 办 ? 于 是 他 就 求 他 的 长 辈 B《〈 内 核 ) 帮 他 去 报名 ， 长辈 
办公室 后 ， 对 招生 人 员 说 要 
上 示 对 方 的 身份 证 (RPL)， 于 是 长 辈 B 就 把 小 学 9 
了 效 期 越 短 ， 因 为 小 孩子 长 
| 学 车 年 纪 呢 ， 拒 绝 接 收 。 这 时 候 驾 校 招生 人 员 





器 中 的 “阶级 ”不 仅 体现 在 数据 和 代码 的 访问 ， 还 体现 如 








的 原因 是 有 些 指令 的 执行 对 计算 机 有 着 严 习 
此 被 称 为 特权 指令 (Privilege Instruction)。 比 如 hlt 指令 ， 它 
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平时 我 们 被 灌输 的 思想 是 | 
系统 才 有 能 力 访问 外 设 。 操 作 系统 
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程 也 是 可 以 的 ， 只 是 操作 系统 不 允许 
j 户 进程 无 法 直接 访问 硬件 ， 必 须要 向 操作 系统 求助 ， 只 有 高 高 在 上 的 
计算 机 中 的 资源 ， 资 源 包 括 软 伯 














j 户 进程 这 么 








故 。 


人 
中 令 只 
































的 职责 就 是 管理 








w= 


可 以 让 计算 机 停 
得 不 放 在 0 特权 级 下 。 同 类 的 指令 还 有 lgdt、lidt、ltr、popf 等 ， 这 些 对 计算 机 的 正常 运 
只 有 亲自 执行 它们 才 放 心 。 
标志 寄存 器 eflags ' 


刁 对 于 RPL 还 是 





F 龄 的 。 假 如 茶 个 
(调用 门 ) 一 看 他 年 龄 太 小 都 不 








二 口 


1 力 








上 人 报名 。 人 家 招生 人 员 

E A 的 身份 证 (现在 

E 人 员 一 看 ， 
， 以 纵容 小 

















快 嘛 ) 拿 出 来 了 ， 招 4 
的 安全 意识 开始 泛滥 


已 屋 1 入 


可 




















已 人 
此 令 ! 








影响 ， 它 们 只 有 在 
机 ， 





0 特权 级 下 被 执 
处 理 器 只 信任 操 

































































的 IOPL 位 和 TSS 中 的 IO 位 
有 在 当前 特权 级 大 于 等 了 











F IOPL 时 才 






































行 IO 端口 访问 ， 




















操 
PT 、 





























{ 革 让 











F 和 硬件 ， 不 允许 用 


程 直 接 操作 外 设 ， 这 只 是 操作 系统 的 一 种 管理 策略 ， 因 为 这 是 出 于 对 计算 机 的 保护 ， 谁 能 保证 用 户 程序 个 
个 都 那么 善良 可 靠 呢 ? 万 一 用 户 程序 非法 使 用 硬件 ， 这 种 破坏 可 是 难以 估量 呢 ， 保护 计算 机 安全 是 操作 系 
统 的 责任 ， 不 应 该 让 不 受信 任 的 程序 有 破坏 计算 机 的 可 能 。 

我 们 在 很 久 以 前 就 介绍 过 eflags 寄存 器 啦 ， 现 在 来 查看 下 eflags 寄存 器 的 IOPL 位 ， 如 图 5-60 所 示 。 
































































































































31...21 20 19 18 17 161514 13-12 11 10 9 8 7 6543210 
保留 | ID | VIP | VIF | AC | VM | RF | | NT IORL | OF | DF |IF| TF| SF|ZF| |AF| |PF| | CF 


4 图 5-60 ”寄存 器 的 10PL 位 



















































































在 eflags 寄存 器 中 第 12 一 13 位 便 是 IOPL (IO Privilege Level)， 即 IO 特权 级 ， 它 除了 限制 当前 任务 
进行 IO 敏感 指令 的 最 低 特 权 级 外 ， 还 用 来 决定 任务 是 否 允 许 操作 所 有 的 IO 端口 ， 对 ， 没 错 ， 是 全 部 IO 
端口 ，IOPL 位 是 打开 所 有 IO 端口 的 开关 (用 来 单独 设置 端口 访问 的 方式 是 IO 位 图 ， 一 会 儿 介 绍 )。 每 个 
任务 〈 内 核 进 程 或 用 户 进程 ) 都 有 自己 的 eflags 寄存 器 ， 所 以 每 个 任务 都 有 自己 的 IOPL， 它 表示 当前 任 
务 要 想 执行 全 部 IO 指令 的 最 低 特权 级 , 也 就 是 处 理 器 最 低 的 CPL， 只 有 任务 的 当前 特权 级 大 于 等 于 IOPL 
才 人 允许 执行 全 部 IO 指令 ， 即 数值 上 CPLIOPL。 

CPL 为 0 时 处 理 器 是 法 力 无 边 的 ， 所 以 0 特权 级 下 处 理 器 是 不 受 IO 限制 的 。 

IOPL 如 何 设 置 呢 ? 

用 户 程序 可 以 在 由 操作 系统 加 载 时 通过 指定 整个 eflags 设置 ， 操 作 系 统 如 何 设置 自己 的 IOPL 呢 ? 即 
使 内 核 IOPL 为 0 也 得 写 进去 eflags 寄存 器 中 才 生 效 。 可 惜 的 是 没有 直接 读 写 eflags 寄存 器 的 指令 ， 不 过 
可 以 通过 将 栈 中 数据 弹出 到 eflags 寄存 器 中 来 实现 修改 。 可 以 先 用 pushf 指令 将 eflags 整体 压 入 栈 ， 然 后 
在 栈 中 修改 相应 位 ， 再 用 popf 指令 弹出 到 eflags 寄存 器 中 。 另 外 一 个 可 利用 栈 的 指令 是 iretd， 用 iretd 指 
令 从 中 断 返回 时 , 会 将 栈 中 相应 位 置 的 数据 当成 eflags 的 内 容 弹出 到 eflags 寄存 器 中 。 所 以 可 以 改变 IOPL 
的 指令 只 有 popf 和 iretd 指令 ， 依 然 是 只 有 在 0 特权 下 才能 执行 。 如 果 在 其 他 特权 级 下 执行 此 指令 ， 处 理 
器 也 不 会 引发 异常 ， 只 是 没 任何 反应 。 

接 下 来 看 看 IO 位 图 是 怎么 回 事 。 

假如 ,数值 上 FCPL 和 IOPL, 程序 既 可 以 执行 IO 特权 指令 , 又 可 以 操作 所 有 的 IO 端口 .倘若 数值 上 FCPL > IOPL， 
程序 也 不 是 完全 无 法 进行 任何 IO 操作 ， 有 点 奇怪 是 不 ， 似 乎 和 咱们 的 逻辑 不 符 ， 其 实 这 样 是 有 道理 的 。 

之 前 说 过 ，IOPL 是 所 有 IO 端口 的 开关 ， 不 过 ， 这 个 开关 还 留 有 余地 ， 如 果 将 开关 打开 ， 便 可 以 访问 
全 部 65536 个 端口 ， 如 果 开 关 被 关上 ， 即 数值 上 CPL > IOPL， 则 可 以 通过 IO 位 图 来 设置 部 分 端口 的 访问 
权限 。 也 就 是 说 ， 先 在 整体 上 关闭 ， 再 从 局 部 上 打开 。 这 有 点 像 设 置 防火 墙 的 规则 ， 先 默认 为 全 部 禁止 访 
问 ， 想 放行 哪些 端口 再 单独 打开 。 

处 理 器 为 什么 允许 这 么 做 呢 ?” 原 因 是 为 了 提速 。 

如 果 所 有 IO 端口 访问 都 要 经 过 内 核 的 话 , 由 低 特 权 级 转向 高 特权 级 时 是 需要 保存 任务 上 下 文 环境 的 ， 
这 个 过 程 也 是 要 消耗 处 理 器 时 间 的 ， 随 着 端口 访问 多 起 来 ,时 间 成 本 还 是 很 可 观 的。 这 一 典型 的 应 用 就 是 
硬件 的 驱动 程序 ， 它 位 于 特权 级 1。 
什么 是 驱动 程序 ? 
驱动 程序 就 是 通过 in、out 等 IO 指令 直接 访问 硬件 的 程序 ， 它 为 上 层 程序 提供 对 硬件 的 控制 访问 ， 相 
当 于 硬件 的 代理 ， 程 序 员 通 过 它 就 免 去 了 学 习 硬 件 控制 的 相关 知识 ， 简 化 了 程序 设计 。 

所 以 说 ， 驱 动 程序 肯定 是 要 直接 控制 IO 端口 的 ， 尽 管 它 可 以 像 Linux 那样 位 于 0 特权 级 ， 但 它 位 于 
1 特权 级 时 ， 依 然 可 以 直接 操作 硬件 端口 。 

即使 是 在 3 特权 级 下 , 也 要 考虑 某 些 需要 快速 反应 的 场合 , 比如 某 个 应 用 程序 需要 快速 的 以 硬件 交互 ， 
所 以 处 理 器 允许 通过 IO 位 图 来 为 3 特权 级 程序 打开 某 些 端口 的 控制 。 这 些 规则 同样 适用 于 2 特权 级 ， 也 
就 是 说 在 任意 特权 级 下 ， 处 理 器 都 可 以 通过 IO 位 图 为 相应 特权 级 的 程序 开启 特定 的 端口 。 

欲 知 IO 位 图 是 怎么 回 事 ， 咱 们 先 把 位 图 的 概念 明确 。 

位 图 就 是 bit map，map 就 是 映射 ， 建 立 的 是 某 种 对 应 关系 ， 像 地 图 那样 ， 图 上 某 个 区 域 代 表 实 际 地 
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理 范 围 ，bit 就 是 位 ，bit map 就 是 用 一 个 bit 映射 到 某 个 实际 的 对 象 。 位 图 这 种 结构 的 操作 单位 就 是 bit， 
所 以 位 图 其 实 就 是 一 串 二 进 制 01 数字 ， 对 位 图 的 操作 也 就 是 读 写 相应 的 位 ， 处 理 器 中 对 内 存 的 访问 是 以 
字 节 为 单位 的 ， 不 能 直接 操作 位 ， 所 以 对 于 操作 位 图 ， 简 单 说 来 就 是 先 将 该 位 所 在 的 字 节 读 到 内 存 ， 若 是 
想 将 该 位 置 为 1， 可 以 用 1 对 该 位 进行 或 运算 ， 若 想 将 该 位 清 0， 可 以 用 0 对 该 位 进行 与 运算 ， 以 后 咱们 
少不了 操作 位 图 ， 到 时 候 再 实践 。 
Intel 处 理 器 最 大 支持 65536 个 端口 ， 它 允许 任务 通过 IO 位 图 来 开启 特定 端口 ， 位 图 中 的 每 一 bit 代 
表 相 应 的 端口 ， 比 如 第 0 个 bit 表示 第 0 个 端口 ， 第 65535 个 bit 表示 第 65535 个 端口 ，65536 个 端口 号 占 
用 的 位 图 大 小 是 63356/8=8192 字 节 ， 即 8KB。1/O 位 图 中 如 果 相应 bit 被 置 为 0， 表 示 相 应 端口 可 以 访问 ， 
否则 为 1 的 话 ， 表 示 该 端口 禁止 访问 ， 如 图 5-61 所 示 。 
























































































































































































































































































































































、 0 表示 端 允许 访问 

再 次 声明 ，1/O 位 图 只 是 在 数值 上 CPL > IOPL， 即 当前 特权 级 比 1 表示 端口 禁止 访问 
IOPL 低 时 才 有 效 ， 若 当前 特权 级 大 于 等 于 IOPL， 任何 端 口 都 可 直接 访 2929876543210 位 
问 不 受 限 制 。 0|1|1010|1|1|1|10|110| 值 




















VO 位 图 是 位 于 TSS 中 的 ， 它 可 以 存在 ， 也 可 以 不 存在 ， 它 只 是 用 /O 位 图 示意 
来 设置 对 某 些 特定 端口 的 访问 ， 没 有 它 的 话 便 默 认为 禁止 访问 所 有 端 机 
口 。 正 是 由 于 它 可 有 可 无 , 所 以 TSS 的 段 界 限 TSS limit, 即 实 际 大 小 -1， 

并 不 国定 。 当 TSS 中 不 包括 IO 位 图 时 ，TSS 只 有 104 字 节 大 小 。 话 说 回来 了 ， 当 处 理 器 执行 某 些 IO 指 
令 时 ， 若 当前 特权 级 比 IOPL 低 ， 处 理 器 就 会 认为 也 许 只 是 给 当前 任务 单独 放行 了 某 些 端口 ， 于 是 它 就 到 
TSS 中 找 IO 位 图 ， 如 果 IO 位 图 不 存在 ， 即 所 有 端口 都 禁止 访问 ， 于 是 处 理 器 就 会 殷 异 常 。 

读 到 这 里 ， 有 两 个 问题 要 解决 。 

(1) 处 理 器 到 TSS 中 哪里 去 找 IO 位 图 呢 ? 

(2) 怎样 证 明 IO 位 图 不 存在 ? 

在 图 5-47 所 示 TSS 结构 中 ， 有 一 项 是 “IO 位 图 在 TSS 中 的 偏 移 地 址 ”， 它 在 TSS 中 偏 移 102 字 节 的 
地 方 ， 占 2 个 字 节 空间 ， 就 是 图 5-47 的 左上 角 ， 此 处 用 来 存储 IO 位 图 的 偏 移 地 址 ， 即 此 地 址 是 IO 位 图 
在 TSS 中 以 0 为 起 始 的 偏 移 量 。 如 果 某 个 TSS 存在 IO 位 图 的 话 ， 此 处 用 来 保存 它 的 偏 移 地 址 ， 示 意 如 
图 5-62 所 示 。 
















































































































































































































































































































































































f 
IO 位 图 
二 
由 MO 位 图 地 址 过 高 产生 的 空闲 区 域 
TSS LIMIT *I/O 位 图 在 TSS 中 的 偏 移 地 址 (保留 ) 100 

TSS 实 际 尺寸 《 0 保 久 ) ldt 远 择 | 36 
(包括 MO 位 图 ) (保留 ) gs 92 
风 全 

(保留 ) SS0 8 

esp 0 4 

\ 《保留 ) 上 一 个 任务 的 TSS 指 针 | 0 








Tsy 中 MO 位 图 


4 图 5-62 TSS 中 的 1/0 位 
































如 图 5-62 所 示 ，TSS 中 如 果 有 IO 位 图 的 话 ， 它 将 位 于 TSS 的 顶端 ， 这 就 是 TSS 的 实际 尺寸 并 不 固 
定 的 原因 ， 当 包括 IO 位 图 时 ， 其 大 小 是 “IO 位 图 偏 移 地 址 ”+8192+1 字 节 ， 结 尾 这 个 1 字 节 是 IO 位 图 
中 最 后 的 0xff， 说 来 话 长 ， 一 会 再 解释 。 若 不 包括 IO 位 图 ， 其 大 小 则 为 最 小 尺寸 104 字 节 。 由 于 1O 位 
图 偏 移 地 址 并 不 固定 , 可 以 大 于 等 于 104, 所 以 在 TSS 中 偏 移 102 字 节 和 IO 位 图 之 间 可 能 会 有 空闲 区 域 。 

您 看 ， 既 然 JO 位 图 位 于 TSS 内 , 那 它 的 地 址 必须 是 在 TSS 的 尺寸 范围 之 内 ， 即 地 址 的 范围 是 在 TSS 
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十 大 小 -1)， 则 表明 没有 IO 位 图 。 
现在 来 说 下 为 什么 在 IO 位 图 























如 果 对 一 个 端口 连续 读 写 多 个 字 节 , 实 
口 数 据 ， 





比如 in 指令 可 以 读 取 16 位 端 
| in ax, Ox234 
这 相当 于 


in al,Ox234 
in ah, Ox235 


遍 移 (104 一 TSS 有 段 界限 limit) 之 间 ， 





处 理 器 在 进行 端口 读 写 时 ， 若 当前 特权 级 CPL 低 于 IO 特权 级 IOPL 时 ， 如 果 有 IO 位 图 的 i 
相应 的 bit 是 否 为 0。 若 在 某 个 端口 中 读 取 多 个 字 节 ， 处 至 
多 个 端口 在 IO 位 图 中 对 应 的 多 个 bit， 这 些 bit 必须 都 得 为 0 才 人 允许 访问 它们 。 











器 会 在 IO 位 图 中 检查 端 
































如 果 偏 移 地 址 不 在 此 范围 ， 即 大 于 等 


的 结尾 有 个 0xff。 
在 计算 机 系统 硬件 中 ，IO 端口 是 按 字 节 来 编 址 的 ， 意 思 是 说 



































F TSS 段 界限 limit (TSS 尺 

















际 上 是 从 以 该 端口 号 为 起 始 的 多 个 端 























即 一 次 读 取 2 字 节 ， 假 设 端口 0x234 








是 16 位 端口 : 

















连续 的 多 个 bit 也 许 会 跨 字 节 ， 比 如 端 
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上 于 了 




















在 后 


























口 0x234 对 应 的 bit 在 前 





















































舌 ， 处 理 
器 必然 会 检查 连续 的 


个 端口 只 能 读 写 1 个 字 节 的 数据 。 


并 读 进来 的 。 举 个 例子 ， 





个 字 节 的 最 后 一 位 , 0x235 对 应 的 bit 
的 第 0 位， 这样 处 理 器 必须 将 这 两 个 字 节 都 读 进来 处 理 。 























































































































大 多 数 情况 下 跨 字 节 都 没 问题 ， 但 当 第 1 个 bit 在 位 图 的 最 后 一 个 字 节 时 就 会 出 问题 ， 处 理 器 要 读 进 
多 个 字 节 ， 所 以 ， 第 2 个 bit 所 在 的 字 节 就 越界 了 ， 该 字 节 已 经 不 属于 位 图 范围 。 

为 解决 这 个 问题 ， 处 理 器 要 求 位 图 的 最 后 一 字 节 必须 是 0xFF， 此 字 节 有 两 个 作用 。 

第 一 ， 处 理 器 允许 1O 位 图 中 不 映射 所 有 的 端口 ， 即 VO 位 图 长 度 可 以 不 足 8KB， 但 位 图 的 最 后 一 字 





节 必 须 为 0xFF。 如 果 在 位 图 范围 外 的 端 










































































， 处 理 器 一 律 默认 禁止 访问 。 这 样 



































来 ， 如 果 位 图 最 后 一 字 节 






















































































的 0xFF 属于 全 部 65536 个 端口 范围 之 内 ， 字 节 各 位 全 为 1 表示 禁止 访问 此 字 节 代表 的 全 部 端口 ， 这 并 没 
什么 过 错 。 

第 二 , 如 果 该 字 节 已 经 超过 了 全 部 端口 的 范围 , 它 并 不 用 来 映射 端口 , 只 是 用 来 作为 位 图 的 边界 标记 ， 
用 于 跨 位 图 最 后 一 个 字 节 时 的 “ 余 量 字 节 ” 避免 越界 访问 TSS 外 的 内 存 。 

这 就 是 位 图 中 最 后 一 字 节 必须 为 0xFF 的 原因 。 








您 看 IO 位 图 
原理 ， 只 会 有 益 无 害 。 
到 了 这 里 ， 特 权 级 就 讲 
在 所 说 的 是 结束 语 ， 所 以 可 
服 力 ， 咱 们 在 下 一 章 
大 家 ， 大 家 要 养 足 精 神 才 好 。 

































































我 说 得 这 么 热 曾 ， 其 实 咀 们 不 用 它 ， 









































让 大 家 看 到 工作 中 的 内 核 。 这 不 仅 涉及 一 些 学 过 的 知识 ， 而 且 




















这 里 的 介绍 完全 是 为 了 让 大 伙 了 解 IO 访问 的 工作 


完了 ， 本 章 也 结束 了 ， 友 情 提 示 ， 我 知道 本 章 内 容 有 点 多 ， 您 已 经 很 累 了 ， 现 
以 略 过 这 里 不 看 啦 。 虽 然 我 们 已 经 在 内 核 中 ,但 这 种 看 不 到 的 成 果 似 乎 没有 说 











还 有 新 的 东西 








要 带 给 
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上 一 章 中 我 们 终于 完成 了 内 核 ， 但 该 内 核 确实 没 法 
对 它 悉 心 养育 ， 逐 渐 丰 富 它 的 功能 。 


函数 调用 约定 简介 


由 于 我 们 要 将 C 语言 和 汇编 语言 结合 编程 ， 所 以 一 定 会 存在 汇编 代码 和 C 代码 相互 调用 的 问题 ， 有 
些 事情 还 是 要 提前 交待 给 大 家 的 ， 本 节 就 是 要 给 大 家 说 下 函数 调用 规约 中 的 那些 事 儿 。 
函数 调用 约定 是 什么 ? 
调用 约定 ，calling conventions， 从 字 国 
它 体现 在 : 

。 参数 的 传递 方式 ， 是 放 在 寄存 器 中 ? 栈 中 ? 还 是 两 者 混合 ? 

e 参数 的 传递 顺序 ， 是 从 左 到 右 传 递 ? 还 是 从 右 到 左 ? 

。 是 调用 者 保存 寄存 器 环境 ， 还 是 被 调用 者 保存 ? 保存 哪些 寄存 器 呢 ? 

我 估计 ， 我 这 么 解释 调用 约定 的 话 ， 之 前 对 此 不 懂 的 同学 还 是 不 懂 ， 所 以 咱们 得 从 头 说 起 啦 。 没 例子 
还 真 说 不 清楚 ， 咱 们 还 是 拿 例 子 来 说 事 吧 。 

比如 在 C 语言 中 我 们 有 这 样 的 代码 : 


int subtract (int a, int b) { 
return a-b; 


} 

我 们 可 以 用 这 样 的 形式 调用 它 : 
‖ int sub = subtract (3,2); 

这 样 sub 的 值 就 变 成 了 1。 这 是 我 们 司空 见 惯 的 用 法 ， 但 大 家 有 没有 想 过 ， 计 算 机 是 如 何 确定 参数 3 
和 2 在 哪里 的 呢 ? 这 是 有 关 参 数 存 储 的 问题 。 

计算 机 中 可 没有 专门 存储 参数 的 硬件 ， 即 使 有 的 话 ， 我 想 也 不 太 容易 确定 该 硬件 的 容量 ， 毕 竟 参 数 的 
个 数 是 不 定 的 。 而 且 还 有 个 致命 的 问题 ， 若 在 刚刚 传 入 参数 之 后 ， 函 数 执 行 之 前 被 换 下 了 CPU， 新 的 进 
程 上 CPU 后 ， 也 要 调用 函数 ， 也 要 传递 参数 呢 ， 还 是 会 引出 参数 覆盖 的 问题 。 不 过 虽 们 之 前 说 过 ， 参 数 
可 以 放 在 寄存 器 中 ， 也 可 以 放 在 内 存 中 。 

寄存 器 数量 是 有 限 的 ， 假 设 将 参数 放 在 寄存 器 中 传递 的 话 ， 主 调 函数 必然 要 考虑 保存 寄存 器 现场 的 问 
题 , 一 是 用 哪些 寄存 器 传 参数 , 二 是 用 于 传递 参数 的 寄存 器 , 其 原来 的 值 如 果 要 保留 的 话 , 往 哪 里 保存 呢 ? 
估计 大 家 也 是 这 么 想 的 ， 内 存 足 够 大 ， 肯 定 是 往 内 存 中 转 存 啦 ， 那 既然 是 还 要 在 内 存 中 折腾 ， 不 如 直接 把 
参数 放 在 内 存 中 更 直接 省 事 。 

说 到 用 内 存 来 传递 参数 , 还 要 考虑 内 存 地 址 , 用 哪 块 内 存 来 存储 参数 呢 ? 为 了 避免 多 进程 的 参数 窗 新 
问题 , 每 个 进程 的 参数 得 单独 存储 在 不 同 地 址 , 得 在 内 存 中 再 为 每 个 进程 规划 出 一 块 存 储 参数 的 内 存 区 域 ， 
想 想 就 很 麻烦 。 或 许 您 早已 经 迫 不 及 答 想 说 出 答案 啦 ; 栈 也 是 位 于 内 存 中 的 啊 ， 最 好 的 方式 就 是 在 栈 中 来 
保存 。 这 有 两 个 好 处 。 

(1) 首先 ， 每 个 进程 都 有 自己 的 栈 ， 这 就 是 每 个 内 存 自己 的 专用 内 存 空间 。 

(2) 其 次 , 保存 参数 的 内 存 地 址 不 用 再 花 精力 维护 ， 已 经 有 栈 机 制 来 维护 地 址 变化 了 ， 参 数 在 栈 中 的 





了 简陋 了 ， 它 喻 都 没 做 ， 所 以 ， 从 本 章 开始 我 们 要 
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上 理解 ， 它 是 调用 函数 时 的 一 套 约定 ， 是 被 调用 代码 的 接口 ， 
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6.1 函数 调用 约定 简介 
位 置 可 以 通过 栈 顶 的 偏 移 量 来 得 到 。 

好 啦 ， 参 数 存 储 的 问题 解决 了 ， 我 们 决定 在 进程 自己 的 栈 空间 中 保存 参数 ,一 种 可 行 的 方案 是 调用 者 
在 调用 通 数 时 ， 先 把 所 有 参数 压 栈 ， 然 后 再 调用 函数 。 被 调用 函数 在 栈 中 获取 到 参数 后 进行 处 理 。 

以 上 方案 如 果 不 细 想 的 话 似乎 还 挺 好 ， 其 实 解决 了 一 个 问题 后 ， 又 引入 了 两 个 新 的 问题 。 

(1) 参数 若 在 栈 中 保存 ， 由 谁 来 负责 回收 参数 所 占 的 栈 空间 ? 

(2) 当 参 数 很 多 的 情况 下 , 主 调 函 数 将 参数 以 什么 样 的 顺序 传递 呢 ?” 因 为 这 决定 被 调用 函数 获取 参数 
的 准确 性 。 

上 面 提 到 的 回收 栈 空间 或 者 清理 栈 空间 ， 并 不 是 把 参数 在 栈 中 所 占据 的 内 存 清 0， 而 是 回收 参数 所 在 
的 内 存 空 间 ， 也 就 是 让 栈 顶 恢复 到 栈 中 参数 所 在 的 位 置 之 前 ， 即 让 栈 指针 往 高 地 址 处 回 退 。 这 样 一 来 ， 参 
数 原本 占用 的 空间 又 变 得 可 用 了 ， 下 次 再 有 入 栈 操作 时 ，push 指令 可 以 直接 将 其 覆盖 。 

也 许 有 部 分 同学 并 未 意识 到 这 两 个 问题 ， 心 想 , 我 自己 写 的 函数 ,我 自己 调用 ， 难 道 我 自己 还 不 知道 怎 2 
处 理 吗 ? 您 看 ， 这 里 用 了 三 个 “我 自己 ”来 强调 问题 的 关键 所 在 ， 自 己 调用 自己 的 代码 确实 可 以 避免 以 上 两 个 
问题 ， 只 要 自己 协调 好 了 就 一 切 ok， 可 保 不 准 您 会 调用 其 他 同事 写 的 函数 。 

调用 约定 是 为 解决 汇编 语言 的 问题 才 提 出 的 ， 不 像 咱们 平时 所 用 的 高 级 语言 ， 直 接 用 实 参 往 函 数 
中 一 代入 就 算 调用 完成 了 ， 高 级 语言 中 本 身 不 存在 这 两 个 问题 ， 高 级 语言 编译 器 为 了 方便 程序 员 ， 默 
默 承 担 了 这 些 ， 这 两 个 问题 是 高 级 语言 在 被 编译 为 底层 汇编 语言 时 才 有 的 ， 所 以 高 级 语言 中 不 涉及 调 
用 约定 。 

在 C 语言 中 ， 咱 们 不 用 考虑 这 些 问题 ， 还 是 拿 前 面 说 过 的 减法 函数 举例 。 

subtract (int a int b) { // 被 调用 者 

return a-b; 
] 1 sub = subtract (3,2); // 主 调用 者 

函数 subtract 返回 a 减 b 的 差 ， 这 里 只 要 代入 实 参 3 和 2 即 可 完成 调用 。 可 是 ， 在 其 被 编译 为 汇编 语 
言 时 ， 参 数 是 要 压 入 栈 中 的 ， 现 在 问题 来 了 。 我 们 模拟 一 下 这 种 情况 ， 以 上 c 代码 中 的 调用 方 和 被 调用 方 
对 应 的 汇编 代码 如 下 : 

主 调用 者 : 

1 push 2 ; 压 入 参数 b 

2 push 3 ; 压 入 参数 a 
| 3 call subtract ;调用 函数 subt ract 

被 调用 者 : 

1 push ebp ;备份 sbp， 为 以 后 用 ebp 作为 基 址 来 寻 址 参数 

2 mov ebp, esp ;将 当前 栈 项 赋值 给 ebp 

3 mov eax, [ebp+8] ;得 到 被 减 数 ， 参 数 a 

4 sub eax, [ebp+12] ; 得 到 减 数 ， 参 数 b 

5 pop ebp ;恢复 ebp 的 值 

目前 栈 中 的 情况 如 图 6-1 所 示 。 

如 果 调 用 者 和 被 调用 者 〈subtract 函数 ) 都 是 同一 个 程序 员 写 的 ， 他 栈 
很 清楚 自己 压 入 栈 中 参数 的 顺序 ， 所 以 他 在 subtract 函数 中 ， 明 确 地 知道 栈 扩展 
栈 中 [ebp+8] 处 的 内 容 是 被 减 数 a，[ebp+12] 处 的 是 减 数 b。 其 实 ， 这 个 程 。 方向 一 
训 员 在 潜意识 中 自己 跟 自己 建立 了 个 约定 ， 先 被 压 入 栈 的 是 减 数 b， 后 被 | et 
压 入 的 是 被 减 数 a， 这 样 他 才能 确信 从 容 地 在 subtract 函数 体 中 获取 到 正 ”ebp 一 
确 的 参数 。 其 实 他 也 可 以 反 着 来 ， 先 把 被 减 数 a 压 入 栈 ， 再 把 减 数 b 压 入 SE 
栈 ， 这 样 在 subtract 函数 中 通过 [ebp+8] 得 到 的 是 参数 b( 减 数 )，[ebp+12] 得 到 的 是 参数 a 被 减 数 )。 总 之 














参数 很 多 的 情 
个 “这 样 ”的 
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况 下 就 会 涉及 到 参数 传递 的 顺序 问题 ,即使 是 
顺序 传递 参数 ， 
要 么 从 左 到 右 ， 要 么 从 右 到 左 











自己 负责 传递 参数 的 话 ， 也 很 少 有 人 会 今天 一 











明天 一 个 “那样 ”的 顺序 传递 参数 。 
能 选择 一 种 。 











妹 此 参数 传递 的 顺序 应 该 是 始终 如 一 的 ， 
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ey 




















以 上 是 








己 调用 自 


己 代 码 的 情况 )， / 避 
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不 知道 





革 subtract 把 





么 说 都 比较 方便 。 可 万 
[ebp+8] 当 作 被 减 数 a， 还 是 减 数 b， 






































































































































， 被 调用 函数 subtract 不 是 自己 写 的 ， 
咱们 该 以 怎样 的 顺序 将 参数 压 入 栈 中 呢 ? 这 得 跟 人 家 


咱们 
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商量 了 ， 双 方 得 协调 个 大 家 认同 的 参数 入 栈 顺 序 ， 这 就 是 最 初 调用 约定 的 由 来 。 

我 们 要 解决 的 不 只 是 参数 压 栈 顺 序 问题 ， 还 有 栈 空 间 的 清理 工作 呢 。 其 实 问题 倒 也 不 难 解决 ， 这 都 是 属 
于 调用 方 和 被 调用 方 之 间 协 调 的 问题 ， 只 要 双方 提前 商量 好 传 入 参数 的 顺序 和 由 谁 来 负责 清理 栈 空间 就 行 。 

在 高 级 语言 中 ,这 两 个 问题 是 是 通过 调 约定 来 解决 的 ,调用 约定 就 是 调用 方 和 被 调用 方 就 以 上 问题 达 
成 一 致 解决 方案 的 约定 ， 双 方 按照 这 种 约定 合作 就 不 会 发 生 问 题 。 我 们 按照 由 谁 来 清理 栈 空 间 分 类 ， 目 前 
的 调用 约定 见 表 6-1。 

表 6-1 调用 约定 简 述 

栈 清理 负责 类 别 描述 
cdecl (CC declaration， 即 C 声明 )， 起 源 于 C 语言 的 一 种 调用 约定 ， 在 C 语言 中 ， 函 数 参数 是 
从 右 到 左 的 顺序 入 栈 的 。GNU/Linux GCC， 把 这 一 约定 作为 事实 上 的 标准 ，x86 架构 上 的 许 
cdecl 多 C 编译 器 也 都 使 用 这 个 约定 。 在 cdecl 中 ， 参 数 是 在 栈 中 传递 的 。EAX、ECX 和 EDX 寄存 
器 是 由 调用 者 保存 的 ， 其 余 的 寄存 器 由 被 调用 者 保存 。 函 数 的 返回 值 存 储 在 EAX 寄存 器 。 
调用 者 清理 栈 空 间 
调用 者 清理 SR 与 cdecl 类 似 ， 参 数 从 右 到 左 入 栈 。 参 数列 表 的 大 小 被 放置 在 AL 寄存 器 中 。syscall 是 32 位 
Sy OS/2 API 的 标准 
参数 也 是 从 右 到 左 压 栈 。 从 最 左边 开始 的 三 个 参数 会 被 放置 在 寄存 器 EAX, EDX 和 ECX 中 ， 
ri 最 多 四 个 浮 点 参数 会 被 传 入 ST (0) 到 ST (3) 中 ,虽然 这 四 个 参数 的 空间 也 会 在 参数 列表 的 
R 栈 上 保留 。 函数 的 返回 值 在 EAX 或 ST(0) 中 ,保留 的 寄存 器 有 EBP EBX, ESI 和 EDI。 optlink 
在 IBM VisualAge 编译 器 中 被 使 
a 基于 Pascal 语言 的 调用 约定 ， 参 数 从 左 至 右 入 栈 〈 与 cdecl 相反 )。 被 调用 者 负责 在 返回 前 清理 堆栈 。 
P 比 调用 约定 常见 在 如 下 16-bit API 中 : OS/2 1.x， 微 软 Windows 3.x， 以 及 Borland Delphi 版 本 1.x 
register Borland fastcall 的 别名 
这 是 一 个 Pascal 调用 约定 的 变 体 , 被 调用 者 依旧 负责 清理 堆栈 , 但 是 参数 从 右 往 左 入 栈 一 一 与 
被 调用 者 清理 stdcall cdecl 一 致 。 寄 存 器 EAX, ECX 和 EDX 被 指定 在 函数 中 使 用 ， 返 回 值 放 置 在 EAX 中 。stdcall 
所 对 于 微软 Win32 API 和 Open Watcom C++ 是 标准 
fasteall | 此 约定 还 未 被 标准 化 ， 不 同 编译 器 的 实现 也 不 一 致 。 典 型 的 fastcall 约定 会 传递 一 个 或 多 个 参 
数 到 寄存 器 上 ， 以 减少 对 内 存 的 访问 
Microsoft Microsoft 或 GCC 的 fastcall 约定 ， 也 即 msfastcall， 传 入 涉 两 个 参数 (从 左 至 右 ) 到 ECX 
fastcall 和 EDX 中， 剩 下 的 参数 从 右 至 左 压 栈 
ed 从 左 至 右 ， 传 入 三 个 参数 至 EAX，EDX 和 ECX 中 。 剩 下 的 参数 入 栈 ， 也 是 从 左 至 右 。 在 32 
被 调用 者 清理 ee 位 编译 器 Embarcadero Delphi 中 ， 这 是 默认 的 调用 约定 ， 在 编译 器 中 以 register 形式 为 人 知 。 
在 i386 上 的 某 些 版 本 Linux 也 使 用 了 此 约定 
在 调用 C++ 非 静态 成 员 函 数 时 使 用 此 约定 。 基 于 所 使 用 的 编译 器 和 函数 是 否 使 用 可 变 参数 ， 有 两 
个 主流 版 本 的 thiscall。 对 于 GCC 编译 器 ，thiscall 几乎 与 cdecl 等 同 : 调用 者 清理 堆栈 ， 参 数 从 右 
调用 者 或 被 调 到 左 传递 。 差别 在 于 this 指针 ，thiscall 会 在 最 后 把 指针 推 入 栈 中 ,虽然 在 函数 原型 中 它 是 隐 式 的 第 
者 清理 thiscall 一 个 参数 。 在 微软 Visual C++ 编译 器 中 ，this 指针 被 传 到 ECX 寄存 器 上 ， 被 调用 者 负责 清理 堆栈 ， 
人 其 余 同 此 编译 器 的 C 版 本 和 Windows API 函数 使 用 的 stdcall 约定 。 当 函数 使 用 可 变 参数 ， 此 时 调 
者 负责 清理 堆栈 (参考 cdecl)。 thiscall 约定 只 在 微软 Visual C++ 2005 及 其 之 后 的 版 本 被 显 式 指 
定 。 其 他 编译 器 中 ，thiscall 并 不 是 一 个 关键 字 《 反 汇编 器 ， 如 IDA 使 用 _thiscall) 

以 上 信息 是 我 在 wiki 中 摘录 汇总 的 ， 并 非 原创 ， 所 以 我 也 没有 能 力 将 每 种 调用 约定 都 给 大 家 说 明白 。 
这 里 还 是 本 着 “ 够 用 就 行 ” 的 原则 ， 咱 们 用 了 哪 种 就 介绍 哪 种 ， 。 C 语言 遵循 的 调用 约定 是 cdecl， 咀 
们 也 自然 要 遵守 cdecl 约定 了 。 不 过 为 了 起 到 对 比 的 作用 ， 除 了 介绍 cdecl 外 ， J 绍 下 stdcall。 

既然 咱们 用 的 调用 约定 是 cdecl， 那 对 它 的 介绍 最 好 让 它 离 下 一 节 的 内 容 近 一 些 ， 所 以 先 说 一 下 咱们 
不 用 的 stdcall， 其 实 这 两 个 差别 就 在 于 由 谁 来 回收 栈 空间 。 

stdcall 的 调用 约定 意味 着 。 

(1) 调用 者 将 所 有 参数 从 右 向 左 入 栈 。 


人 0 
(2) 被 调用 者 清理 参数 所 占 的 栈 空间 。 
这 两 点 在 表 6-1 的 介绍 中 大 家 已 有 所 了 解 ， 下 面 咱们 将 理论 实践 一 下 ， 还 是 拿 上 面 说 过 的 函数 举例 。 


浊 
1 int subtract (int a，int b);  // 被 调用 者 
2 int sub = subtract (3,2);} // 主 调用 者 



































































































































第 1 行 是 个 函数 声明 ， 其 实现 已 经 在 前 面 看 到 了 ， 就 是 “return a-b”。 
第 2 行进 行 函数 调用 ， 实 参 分 别 是 3 和 2。 在 实际 调用 中 ， 参 数 按照 从 右 向 左 的 顺序 ， 参 数 b 会 先 被 
压 入 栈 ， 然 后 是 参数 a 压 入 栈 。 在 stdcall 调用 约定 下 ， 这 个 c 代码 被 编译 后 的 汇编 语句 是 : 
主 调用 者 : 
; 从 右 到 左 将 参数 入 栈 
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1 push 2 ; 压 入 参数 b 

2 push 3 ; 压 入 参数 a 

3 call subtract ;调用 函数 subt ract 














以 上 是 主 调 函 数 ， 现 在 看 下 被 调 函 数 subtract 中 做 了 什么 。 
被 调用 者 : 

















; 压 入 ebp 备份 

;将 esp 赋值 给 ebp 
; 用 ebp 作为 基 址 来 访问 栈 中 参数 
3 mov eax, [ebp+0x8] ; 偏 移 8 字 节 处 为 第 1 个 参数 a 


1 push ebp 和 
Ld 
* 

4 add eax, [ebp+0xc] ; 偏 移 0xc 字 节 处 是 第 2 个 参数 b 
二 
r 
* 
[4 


2 mov ebp,esp 





















































5 mov esp,ebp 





;为 防止 中 间 有 入 栈 操作 , 用 ebp 恢复 esp 
; 本 句 在 此 例子 中 可 有 可 无 ,属于 通用 代码 



































6 pop ebp € 
7 ret 8 ;数字 8 表示 返回 后 使 esp+8 
; 函数 返回 时 由 被 调 函 数 清 理 了 栈 中 参数 


当 执 行 流 进入 到 subtract 后 ， 在 它 的 内 部 为 了 用 ebp 作为 基 址 引用 栈 中 参数 ， 先 执行 了 push ebp 来 备 
份 ebp， 再 将 栈 指针 赋 给 了 ebp。 目 前 栈 中 布局 如 图 6-2 所 示 。 










































































































































































大 家 根据 图 6-2 很 容易 地 看 出 ebp 偏 移 8 字 节 是 参数 a， 偏 移 12 模 扩 展 可 
字 节 是 参数 b。 以 上 代码 值得 说 一 下 的 是 ret 8 这 句 。stdcall 是 被 调用 者 le ee 
负责 清理 栈 空间 ， 这 里 的 被 调用 者 是 函数 subtract。 也 就 是 说 ，subtract | ne | 
需要 在 返回 前 或 返回 时 完成 。 在 返回 前 清理 栈 相对 困难 一 些 ， 清 理 栈 是 “pep 呈 





































































































指 将 栈 顶 回 退 到 参数 之 前 。 因 为 返回 地 址 在 参数 之 下 ，ret 指令 执行 时 必 “四 6 -2 进入 suptract 男 数 后 核 中 布局 
须 保证 当前 栈 顶 是 返回 地 址 。 所 以 通常 在 返回 时 “顺便 ”完成 。 于 是 ret 指令 便 有 了 这 样 的 变 体 ， 其 格式 为 : 

ret 16 位 立即 数 

这 是 允许 在 返回 时 顺便 再 将 栈 指针 esp 修改 的 指令 。 顺 便 说 一 句 ， 由 于 32 位 下 push 指令 不 是 压 入 字 ， 就 
是 压 入 双 字 ， 所 以 ret 的 参数 必须 是 偶数 。 在 ret 8 执行 之 前 ， 当 前 栈 顶 必须 是 返回 地 址 ， 即 使 没有 第 5 行 的 代 
码 ， 当 前 esp 也 等 同 于 ebp， 因 为 之 前 没有 任何 push 压 栈 操作 ， 这 是 编译 器 为 了 通用 性 而 加 进去 的 ， 所 以 我 们 
在 注释 中 写 到 ， 此 名 可 有 可 无 。 在 经 过 第 6 行将 栈 顶 〈 当 前 esp 指向 的 内 存 ) 弹出 到 ebp 之 后 ，ebp 被 恢复 ， 
此 时 esp 指向 了 +4 字 节 的 位 置 ， 即 当前 栈 顶 为 主 调 函数 的 返回 地 址 。 结 合 图 6-2, ret 指令 将 栈 顶 的 数据 弹出 到 
寄存 器 eip 后 ， 栈 指针 esp 自 加 4， 由 于 还 有 个 参数 8， 所 以 esp 又 被 加 了 8， 从 而 跳 过 了 参数 a 和 b， 顺 利 地 
完成 了 被 调用 者 清理 栈 的 任务 。 

stdcall 是 调用 者 在 栈 中 压 入 参数 ， 由 被 调用 者 回收 栈 空间 。 和 貌似 分 工 很 明确 ， 配 合 很 默契 。 因 为 被 调 
用 者 知道 自己 需要 几 个 参数 ， 所 以 知道 要 回收 多 少 栈 空间 。 但 转念 一 想 ， 凡 事 都 要 自己 亲 力 亲 为 才 放 心 ， 
调用 者 压 入 的 参数 ， 万 一 被 调用 者 忘记 回收 栈 空间 该 怎么 办 〈 这 一 点 由 高 级 语言 编译 器 保证 ， 一 般 不 会 ， 
大 伙 儿 放心 ， 本 段 这 么 写 是 为 了 表述 下 一 种 调用 约定 方式 的 特点 )， 参 数 多 了 栈 会 溢出 的 。 下 面 咱们 就 要 
介绍 这 种 “ 亲 力 亲 为 ”的 调用 约定 ， 即 调用 者 自己 向 栈 中 压 入 参数 ， 还 是 由 调用 者 自己 回收 栈 空间 。 

好 啦 ，stdcall 调用 约定 就 到 此 为 止 ， 下 面 咱们 聊 聊 cdecl 调用 约定 ， 这 才 是 咱们 所 使 用 的 调用 规范 。 

cdecl 调用 约定 由 于 起 源 于 C 语言 ， 所 以 又 称 为 C 调用 约定 ， 是 C 语言 默认 的 调用 约定 。cdecl 的 调 
用 约定 意味 着 。 
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(1) 调用 者 将 所 有 参数 从 右 向 左 入 栈 。 
调用 者 清理 参数 所 占 的 栈 空间 。 

您 也 看 到 了 ， 它 和 stdcall 一 样 都 是 从 右 向 左 将 参数 入 栈 的 ， 区 别 就 是 cdecl 由 调用 者 清理 栈 空间 。 这 

就 是 刚才 所 说 的 “ 杀 力 杀 为 ”的 调用 约定 。 也 许 您 会 说 ， 难 道 调用 者 就 不 会 忘记 清理 栈 空 间 吗 〈 编 译 器 一 

般 不 会 忘 ) ? 哈哈 ， 也 许 也 会 吧 ， 不 过 既然 调用 者 和 被 调用 者 都 有 可 能 忘记 清理 栈 ，cdecl 至 少 把 控 了 栈 

的 控制 权 ， 这 不 是 也 很 好 吗 。 

其 实 ，cdecl 调用 约定 最 大 的 亮点 是 它 允 许 函 数 中 参数 的 数量 不 固定 ,我 们 熟识 的 printf 函数 ， 它 能 够 

支持 变 长 参数 ,就 是 利用 此 cdecl 调用 约定 的 性 质 设计 出 来 的 , 它 的 原理 是 利用 字符 串 参数 format 中 的 '%' 

来 匹配 栈 中 的 参数 ， 以 后 咱们 在 动手 实现 printf 函数 时 会 体验 到 这 一 优势 。 

好 啦 ， 上 菜 啦 ， 咱 们 看 看 在 cdecl 调用 约定 下 产生 的 汇编 代码 ， 这 里 还 是 拿 之 前 的 subtract 函数 举例 。 


1 int subtract (int a，int b);  // 被 调用 者 
2 int sub = subtract (3,2); // 主 调用 者 





































































































































































































































































































主 调用 者 : 





















































; 从 右 到 左 将 参数 入 栈 

1 push 2 ; 压 入 参数 b 

2 push 3 ; 压 入 参数 a 

3 call subtract 调用 函数 subtract 

4 add esp, 8 ;回收 ( 清理 ) 栈 空间 
被 调用 者 : 

1 push ebp ; 压 入 ebp 备份 


2 mov ebp,esp ;将 esp 赋值 给 ebp 
; 用 ebp 作为 基 址 来 访 间 栈 中 参数 
; 偏 移 8 字 节 处 为 第 1 个 参数 a 

c 字 节 处 是 第 2 个 参数 b 
;参数 a 和 相 加 后 存 入 eax 
;为 防止 中 间 有 入 栈 操作 ， ebp | 恢复 esp 
; 本 句 在 此 例子 中 可 有 可 无 , 属于 通用 代码 

; 将 ebp 恢复 























3 mov eax, [ebp+0x8] 
4 add eax, [ebp+0xc] 
































5 mov esp,ebp 
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pop ebp 
7 ret 


和 stdcall 相 比 ， 在 cdecl 调用 约定 下 生成 的 汇编 代码 ， 就 是 在 被 调用 者 中 的 回收 栈 空间 操作 挪 到 了 主 
调用 者 中 ， 在 主 调用 者 代码 中 的 第 4 行 ， 通 过 将 esp 加 上 8 字 节 的 方式 回收 了 参数 a 和 参数 b， 本 例 中 的 
其 他 代码 都 和 stdcall 一 样 。 
好 啦 ， 说 完 cdecl 后 ， 有 关 调 用 约定 的 内 容 咱们 也 介绍 完了 ， 现 在 咱们 该 去 写 内 核 啦 。 


上 汇编 语言 和 .语言 混合 编程 


本 来 说 好 的 接 下 来 的 工作 是 要 去 “丰满 ”我 们 的 内 核 , 可 咱们 这 种 一 步 一 回头 的 学 习 方式 还 得 继续 啊 。 
其 实 我 了 解 大 家 急切 写 内 核 的 心情 , 但 本 书 的 目的 不 是 写 一 个 操作 系统 就 完事 了 , 而 是 让 大 家 明白 一 个 至 
少 能 运行 的 操作 系统 为 什么 要 这 样 写 , 所 以 咱们 的 学 习 方式 必然 是 边 学 习 理 论 知 识 边 实践 。 如 果 不 给 大 家 
交待 清楚 必要 的 理论 知识 ， 我 也 对 不 起 自己 的 良心 ， 我 不 能 为 了 自己 的 懒惰 而 假装 大 家 都 明白 了 。 另 外 ， 
既然 咀 们 都 淘 望 学习 ， 能 了 解 到 更 多 的 混合 编程 方式 不 是 更 好 吗 ? 
6.2.1 浅 析 C 库 函 数 与 系统 调用 

开门 见 山 ， 汇 编 语言 和 C 语言 混合 编程 可 分 为 两 大 类 。 

(1) 单独 的 汇编 代码 文件 与 单独 的 C 语言 文件 分 别 编译 成 目标 文件 后 ， 一 起 链接 成 可 执行 程序 。 

(2) 在 C 语言 中 嵌入 汇编 代码 ， 直 接 编 译 生成 可 执行 程序 。 

本 节 所 说 的 “汇编 语言 和 C 语言 混合 编程 ”属于 第 1 种 ， 第 2 种 的 内 髓 汇编 又 称 为 内 联 汇编 ， 以 后 
3 们 会 有 专门 的 章节 来 说 的 。 在 内 核 文件 中 ， 有 些 比较 长 的 汇编 代码 真 不 适合 用 内 联 汇编 完成 ， 还 是 需要 
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汇编 语言 和 C 语言 混合 编程 








专门 写 个 汇编 代码 文件 专项 专用 。 
们 先 学 习 下 Linux 系统 调用 ， 利 用 系统 调用 能 够 帮助 简化 演示 的 模型 。 

套子 程序 ， 它 和 Windows 的 动态 链接 库 dll 文件 的 功能 一 样 ， 用 来 实 
的 功能 , 比如 最 常见 的 读 写 人 硬盘 文件 , 只 有 操作 系统 有 权限 去 访问 硬件 ， 
只 能 向 操作 系统 寻求 帮助 ， 故 系统 调用 是 供用 
上 ， 不 需要 使 用 自己 对 外 发 布 的 功能 接口 ， 即 系统 调用 。 
操作 系统 提供 的 功能 ， 所 以 系统 调用 又 称 为 操作 系统 功能 调用 。 
] 《在 很 久 很 久 以 前 咱们 有 说 过 BIOS 中 断 、DOS 中 断 等 内 容 )， 只 不 过 
#， 几 乎 一 个 功能 就 有 一 个 入 口 ， 所 


现 一 





统 权 利 至 高 无 ] 

由 于 是 用 户 程序 想 使 有 
系统 调用 很 像 BIOS 中 断 调 
调用 的 入 口 只 有 一 个 ， 即 第 0x80 号 中 断 ， 它 不 像 BIOS 中 断 那 村 
在 BIOS 中 断 手 册 中 会 见 到 那么 多 的 中 断 调用 啦 ， 比 如 中 断 号 0 一 0x20 都 是 BIOS 的 中 断 调 用 。 
只 有 一 个 入 口 昵 ? 以 后 咱们 学 习 中 断 机 制 的 时 候 就 会 明白 ， 
多 中 断 项 〈 号 ) 是 被 预 留 的 ， 不 能 


系统 
以 您 




















统 调 
本 。 


简单 起 见 ， 上 




































































系统 调用 是 Linux 内 核 提 供 的 






































系列 在 用 户 态 不 能 或 不 易 实现 
用 户 程序 是 没有 权限 的 ， 用 户 程序 
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为 什么 系统 调用 
苗 述 符 表 的 ， 表 中 













































































区 














































































































中 断 的 实现 是 要 用 到 中 断 



































户 程 序 来 使 用 的 ， 操 作 系 
















































































统 调用 的 统一 入 口 ， 具 体 的 子 功能 在 寄存 器 eax 中 单独 指定 。 


总 之 ，BIOS ， 

































































断 走 的 是 中 断 向 量 表 ， 所 以 有 很 多 中 断 号 给 它 用 ， 而 系统 调 
项 而 已 ， 所 以 只 用 了 第 0x80 项 中 断 。 


















































系统 调用 的 子 功 能 要 用 eax 寄存 器 来 指定 ， 所 以 咱们 要 看 看 有 
用 是 定义 在 /usr/include/asm/unistd.h 文件 中 ， 该 文件 只 是 个 统一 的 入 口 ， 指 向 了 32 位 和 64 位 两 种 版 


























录 下 提供 了 这 两 个 版 本 ， 文 人 





在 asm 











i 


























昌 占 ， 所 以 Linux 就 选 了 一 个 可 用 的 中 断 号 作为 所 









































j 走 的 是 中 断 描述 符 表 中 














那些 系统 调用 啦 ， 在 Linux 系统 中 ， 系 









































32 位 x86 平台 下 的 unistd 32. 文件 ， 如 图 6-3 所 示 。 





本 是 CentOS release 6.3 (Final)， 
我 们 要 用 的 系统 调用 是 第 4 号 调用 ， 即 NR _ write。 不 要 被 它 前 面 的 两 个 下 


己 ， 它 代表 我 们 
如 果 不 知道 某 个 系统 调用 的 
2 write 看 看 ， 如 图 


man 


个 字 节 写 入 fd 指 






































所 说 的 write 系统 调用 。 


























F 名 分 别 是 unistd 32.h 和 unistd_64.h， 这 里 给 大 家 摘录 了 部 分 












































在 /usr/include/asm/unistd_32.h 文件 中 共 定 义 了 348 个 系统 调用 ， 哦 ， 给 大 家 说 一 下 ， 我 用 的 Linux 版 
不 知道 新 版 本 内 核 中 是 否 增加 了 新 的 系统 调用 功能 。 
















































































6-3 





6-4 所 示 。 





NAME 

















画 线 吓 到 ， 就 是 个 命名 而 




















法 , 可 以 用 man 命令 来 查看 , 方法 是 man 2 系统 调用 名 。 咱 们 执行 man 





write - write to a file descriptor 


SYNOPSIS 
#include <unistd.h> 


ssize_t writeCint fd, const void 


DESCRIPTION 
write() writes up to count bytes 


buf to the file referred to by the file 





$buf，size_t count); 


from the buffer pointed 
descriptor fd. 











部 分 Linux 系统 调 























EL 可 

















6-4 所 示 只 是 部 分 帮助 信息 
向 的 文件 描述 符 ， 
如 果 在 C 语言 中 调用 write 日 














以 用 



































A 图 6-4 write 系统 调 

















的 数字 2 表示 查看 System Calls 方面 的 帮助 ， 对 于 man 自己 的 帮 
man man 来 查看 。 

















, 虽 们 了 解 这 些 就 
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说 明 














助 信息 ”Ian 命令 也 可 以 

















多 用 了 。 write 的 功能 是 把 buf 指向 的 缓冲 区 中 的 count 





执行 成 功 后 返回 写 入 的 字 节 数 ， 失 败 则 返回 -1。 















































J 话 ， 直 接 代 入 实 参 就 行 了 ， 这 是 最 简单 的 方式 ， 如 代码 c_syscall.c: 
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#include <unistd.n> 
int main(){ 

write(1,"hello,world\n", 4); 
return 0; 


} 





为 了 使 用 c 标准 库 中 的 write 函数 ， 文 件 开头 包含 了 标准 头 文件 unistd.h， 通过 该 函数 可 以 使 用 系统 的 








write 系统 调用 ， 该 文件 在 磁盘 上 的 路 径 是 /usr/include/unistd.h。 不 过 在 本 机 上 测试 发 现 不 包含 unistd.h， 其 
也许 这 和 隐 和 式 声明 有 关 ， 这 里 不 
调用 “系统 调用 ”有 两 种 方式 。 
(1) 将 系统 调用 指令 封装 为 c 库 函 数 ， 通 过 库 函 数 进 行 系统 调 | 
(2) 不 依赖 任何 库 函 数 ， 直 接 通过 汇编 


编译 、 运 行 都 没 问 题 ， 






































深究 。 












































j， 操 作 简单 。 


百 











旨 令 int 与 操作 系统 通 




















以 上 的 < 代码 就 是 用 的 第 一 种 方式 ， 不 知道 

















您 是 否 对 write 函数 的 内 部 实现 感 兴趣 ， 其 实 我 也 没 研究 























































































































过 ， 不 过 万 变 不 离 其 宗 ， 核 心思 想 是 必须 进行 内 核 沟 通才 能 获得 内 核 提供 的 功能 。 所 以 ，write 内 部 封装 
的 一 定 是 系统 调用 指令 ， 按 照 这 种 设想 ， 一 会 星 们 会 模拟 一 下 它 的 实现 。 

我 们 这 里 要 介绍 下 第 二 种 : 路过 库 函 数 直 接 与 系统 内 核 通信 ， 这样 最 终 的 程序 不 需要 与 任何 库 文 件 链 
接 ， 这 是 获得 系统 功能 效率 最 高 的 方式 。 

我 相信 ， 如 果 曾 经 学 过 汇编 语言 ， 老 师 都 给 咱们 演示 过 第 二 种 方式 ， 但 大 多 数 同学 还 是 觉得 云 里 雾 里 ， 即 
使 照 萌 疡 画 味 完成 了 打印 字符 串 的 工作 ， 也 有 部 分 同学 不 清楚 自己 在 做 什么 ， 所 以 我 在 这 里 尽量 多 说 一 点 。 








前 面 我 们 已 经 知道 了 write 系统 调用 函数 的 C 语言 使 用 方式 ,我 们 要 用 汇编 代码 直接 与 内 核 通 信 该 怎 
么 做 ? 我 们 要 看 看 系统 调用 输入 参数 的 传递 方式 。 
当 和 输入 的 参数 小 于 等 于 5 个 时 ， 








放 入 连续 的 内 存 区 域 ， 并 将 该 



















































































Linux 用 寄存 器 传递 参数 。 当 参数 个 数 大 于 5 个 时 ， 把 参数 按照 顺序 
区 域 的 首 地 址 放 到 ebx 寄存 器 。 这 里 我 们 只 演示 参数 小 于 等 于 5 个 的 情况 。 













































































eax 寄存 器 上 
传送 参数 的 顺序 如 下 。 

(1) ebx 存储 第 1 个 参数 
(2) 
(3) 
(4) esi 存储 第 4 个 参数 。 
(5) edi 存储 第 5 个 参数 。 
好 啦 ， 理 论 知识 够 用 啦 ， 


.data 


























section 
| 
| 





str syscall: db 


oo ~QOwW 必 wm 上 


Section .text 
global start 
Ear 


‘Oo 


verre 方式 1: 
push str c lib len 
push str c lib 
puish-1 


call simu write 
add esp,12 
19 7777777777777 方式 2: 
mov eax,4 


ebx, 1 


0x80 
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] 来 存储 子 功能 


o 


ecx 存储 第 2 个 参数 。 
edx 存储 第 3 个 参数 。 


Lib: db "c library says: 
lib len equ $-str c lib 


"syscall says: 
str syscall len equ $- 








号 (寄存 器 eip、ebp、esp 是 不 能 使 用 的 )。5 个 参数 存放 在 以 下 寄存 器 中 ， 








现在 赶紧 实践 一 把 ， 见 以 下 代码 syscall_write.S 





hello world!"，0xa ;0xa 为 LF ASCII 码 


hello world!", Oxa 


Str Sysacall 


























模拟 c 语言 中 系统 调 


;按照 C 调 
































定义 的 simu write 


间 

















;调用 下 
;回收 栈 空 


跨 过 库 函 数 ， 进行 系统 调用 ;7 7 57757777 


接 寺 
;第 4 号 子 功能 是 write 系统 调用 ( 不 是 C 库 函 数 write ) 






















































































ecx, str_ syscall 
edx, str _ syscall len 


;发 起 中 断 ， 通 知 Linux 完成 请 求 的 功能 


















































6.2 汇编 语言 和 C 语言 混合 编程 
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并 帅 程序 汪汪 区 光 光大 

27 mov eax,l1 ;第 1 号 子 功能 是 exit 

28 int Ox80 ;发 起 中 断 ， 通 知 Linux 完成 请 求 的 功能 

29 

30 ;;;;;;; 下 面 自 定 义 的 simu_write 用 来 模拟 Cc 库 中 系统 调用 函数 write 
277777 这 里 模拟 它 的 实现 原理 

31 simu write: 

32 push ebp 备份 ebp 

33 mov ebp,esp 

34 mov eax, 4 ;第 4 号 子 功能 是 write 系统 调用 ( 不 是 c 库 函 数 write ) 

35 mov ebx, [ebp+8] ;第 1 个 参数 

36 mov ecx, [ebp+12] ;第 2 个 参数 

37 mov edx, [ebp+16] ;第 3 个 参数 

38 int 0x80 ;发 起 中 断 ， 通 知 Linux 完成 请 求 的 功能 

39 pop ebp ;恢复 ebp 

40 ret 














代码 syscall_write.S 中 , 我 们 演示 了 系统 调用 的 两 种 方式 。 程序 开头 定义 了 两 种 方式 下 打印 的 字符 串 ， 
其 中 0xa 为 LF (LineFeed) ASCII 码 ， 这 样 就 会 输出 一 个 换行 符 。 




















第 11 一 17 行 是 在 演示 方式 1， 模 拟 调用 C 库 函 数 write 的 方式 。 因 为 write 是 C 库 函 数 ， 按 一 般 的 做 





























法 是 汇编 程序 需要 与 C 代码 生成 的 目标 文件 链接 才能 调用 C 的 代码 。 在 这 个 例子 中 我 们 并 没有 这 样 做 ， 
因为 我 想 让 大 家 了 解 write 函数 的 本 质 ， 所 以 ,在 这 里 为 大 家 定义 了 simu_write 来 代替 C 库 函 数 write， 用 











































































































它 来 简单 解释 write 的 原理 ， 它 定义 在 第 1 一 40 行 。 这 里 是 按照 C 调用 约定 将 参数 从 右 到 左 依次 入 栈 ， 随 























后 调用 simu_write 实现 字 











符 串 打印 功能 。 




















第 19~24 行 是 在 演示 第 2 种 系统 调用 的 方式 ， 这 是 最 简单 直接 可 依赖 的 方式 。 第 0 一 24 行 是 在 eax 














中 赋予 子 功能 号 ， 参 数 按 





第 31 一 40 行 是 simu 


藤 顺 序 依次 写 入 对 应 的 寄存 器 。 
write 的 实现 ， 它 内 部 在 本 质 上 和 第 2 种 方式 样 , 都 是 在 内 部 调用 int 指令 直接 

































































和 系统 通信 实现 系统 调 
好 啦 ， 编 译 链接 过 程 





jj。 此 函数 只 是 为 了 试图 揭 开 C 库 函 数 的 实现 原理 


























恨 苦 用 心 您 懂 的 。 











如 下 : 


| nasm -f elf -~o syscall write.o syscall write.s 














的 目标 文件 链接 ， 所 以 格 




















最 后 用 ld 程序 将 syscall_write.o 链接 成 elf 格式 的 二 进 制 可 执行 文件 。 

















其 中 -f 参数 用 来 指定 编译 输出 的 文件 格式 ， 这 里 需要 指定 为 elf， 目 的 是 将 来 要 和 gcc 编译 的 elf 格式 























式 必须 相同 。nasm 输出 为 目标 文件 ， 已 经 用 -o 指定 文件 名 为 syscall_write.o。 





| ld -o syscall write.bin syscall write.o [work@localhost book]$ nasm -f elf -0 syscall_write.o syscall_write.S 





程序 执行 后 的 效果 如 


顺便 说 一 句 ，syscall 








法 执行 时 ， 可 以 用 以 下 指 


| chmod utx syscall wr 





[work@localhost book]$ ld -o syscall_write.bin syscall_write.o 


图 60-5 所 示 。 [work@localhost book]$ ./syscall_write.bin 


c library says: hello world! 


write.bin 如 果 因 为 权限 不 足 而 无 、 区 fe 六 








六 | 





令 增 加 执行 权限 。 4 图 6-5 模拟 C 库 函数 write 


ite.bin 











6.2.2 汇编 语言 和 C 语言 共 同 协 作 


由 于 有 了 上 一 节 的 铺 
C 语 言 相互 调用 。 

会 两 种 不 同 语言 的 人 
建立 了 语言 符号 与 事物 形 
开 认 知 的 葡萄 ， 是 因为 我 
如 果 脑 子 中 不 存在 这 个 形 
总 之 ， 对 于 具体 的 事物 ， 








丛 





Ne 
















































































垫 ， 本 贡 的 内 容 相对 较 少 , 这 里 给 大 家 准备 了 两 个 小 文件 来 实例 演示 汇编 语言 和 












































， 只 是 掌握 了 同一 件 事物 的 两 种 表达 方式 。 人 在 学 习 一 种 新 语言 时 ， 潜 意识 里 是 
象 的 映射 关系 ， 比 如 我 们 在 学 习 grape 这 个 单词 时 ， 我 们 之 所 以 认为 它 就 是 我 们 
们 知道 这 两 个 名 词 都 是 在 描述 同一 种 圆 圆 的 、 黑 紫色 、 甜 酸 的 这 一 水 果 的 形象 ， 
象 的 话 ， 不 光 是 学 不 会 grape 这 个 英文 单词 ， 就 连 中 文 的 葡萄 也 不 知道 是 何 意 

定 是 先 有 其 形象 ， 再 有 其 描述 ， 这 样 才能 理解 该 事物 ， 了 解 了 事物 的 本 质 形象 






























































后 ， 无 论 该 事物 的 名 字 怎 
也 许 有 同学 会 问 ， 以 



































样 变化 ， 我 们 都 能 将 它们 相互 转换 。 
上 这 些 所 说 的 目的 是 什么 ? 























“汇编 语言 和 C 语言 可 以 互相 调用 ”这 人 句 话 并 不 是 如 表面 陈述 的 那样 ， 似 乎 是 两 种 语言 能 直接 交流 ， 划 
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实 并 不 是 这 样 。C 语言 和 汇编 语言 完全 是 不 同 的 东西 , 它们 怎么 能 认识 对 方 呢 。 这 就 像 跟 不 懂 汉 语 的 人 说 汉语 ， 
那 人 听 了 肯定 会 晕 头 转向 的 ,除非 身边 有 个 翻译 帮忙 转述 , 这 个 翻译 所 做 的 工作 实质 上 是 在 脑子 中 找到 这 种 语 
























































述 的 事物 形象 ， 然后 给 出 这 种 事物 形象 的 另 一 种 语言 表达 ， 这 个 事物 形象 才 是 翻译 的 核心 。 这 有 些 类 似 




















上 面 提 到 的 葡萄 的 例子 , 在 同一 种 指令 集 上 的 各 种 计算 机 程序 语言 ， 最 终 也 要 编译 为 那些 相同 的 机 器 码 ， 这 些 
机 器 码 便 是 高 级 语言 的 本 质 形象 。 对 于 上 面 提 到 的 翻译 ， 在 计算 机 世界 里 ， 就 是 编译 器 ， 只 不 过 这 个 翻译 有 多 
个 ， 例 如 本 书 所 说 的 C 语言 编译 器 gcc 和 汇编 语言 编译 器 nasm， 它 们 能 在 一 起 配合 ， 是 因为 它们 都 懂 机 器 语 
言 。 举 个 例子 ， 就 像 小 明 只 会 汉语 和 英语 ， 小 红 只 会 汉语 和 法 语 ， 若 他 们 之 间 在 交流 时 ， 小 明说 英语 ， 小 红 说 





百 。 村 


法 语 ， 


























































































































他 俩 相互 都 听 不 懂 ， 所 以 ， 当 说 英文 的 小 明 想 跟 说 法 语 的 小 红 借 作业 时 ， 他 必须 用 汉语 告诉 小 红 。 





















































编译 器 知道 高 级 语言 所 描述 的 事物 形象 是 机 器 码 , 所 以 各 种 编译 在 高 级 语言 方面 的 交流 ,本 质 上 是 将 





























它们 都 变 成 统一 的 机 器 码 后 实现 的 。 
不 知道 我 表达 清楚 了 没有 ， 这 里 给 读者 准备 了 两 个 小 文件 : C_with S_cc 和 C _with S_S.S。 大 家 快速 
浏览 一 下 即 可 ， 在 代码 后 面 我 会 讲解 。 

































































代码 C_with_S _c.c 


1 extern void asm print (char*,int); 
2 void cC print (char* tr)y { 


3 


OO 


‘OOUNUAODODPP 






























































































































































int len=0; 

while(str[len++] ); 

asm print (str, len); 

代码 C with _S_S.S 

section .data 
str: db "asm print says hello world!", Oxa, 0 
; 0xa 是 换行 符 , 0 是 手工 加 上 的 字符 串 结束 符 \0 的 ASCII 码 
str len equ $-str 
section .text 
extern c print 
global start 
_start: 
210772727277272; 调用 c 代码 中 的 函数 c_print 77777777777 

push str ; 传 入 参数 

call c print ;调用 c 函数 

add esp,4 ;回收 栈 空间 
0 证， 天 六 关 二 和 太 六 二 克 二 写 志 六 太 六 成 光 坟 

mov eaxy 工 ;第 1 号 子 功 能 是 exit 系统 调 

int Ox80 ;发 起 中 断 ， 通 知 Linux 完成 请 求 的 功能 
global asm print ;相当 于 asm print (str,size) 
asm print: 

push ebp ;备份 ebp 

mov ebp,esp 

mov eax,4 ;第 4 号 子 功能 是 write 系统 调 

mov ebx, 1 ;此 项 固定 为 文件 描述 符 1， 标 准 输出 ( stdout ) 指向 屏幕 

mov ecx, [ebp+8] 7 第 开 个 参数 

mov edx, [ebp+12] ;第 2 个 参数 

int 0x80 ;发 起 中 断 ， 通 知 Linux 完成 请 求 的 功能 

pop ebp ;恢复 ebp 

rat 


代码 C_with S cc 中 的 函数 c_print 是 被 汇编 代码 ”汇编 代码 Cwith_S.S.S CC 代码 C_with_S_c.c 














C_with_S_S.S 调用 的 , 在 c_print 的 实现 中 , 它 又 调用 汇编 代码 

中 的 asm_print。 它 们 的 关系 如 图 6-6 所 示 。 尖 用 prt 一 一 忆 E 襟 问 ，| 
有 了 这 样 的 全 局 印象 后 ， 我 们 细 说 下 这 两 个 文件 。 asm_print 实现 | 4 一 一 一 | 调用 asm_print 
尺码 C_with_S_c.c 的 第 工行 是 声明 外 部 函数 asm_print, 通 

知 编译 器 这 个 函数 并 不 在 当前 文件 中 定义 。 我 们 知道 它 定义 在 ^ 图 6 -6 汇编 代码 与 C 代码 相互 调 


















































































































































文件 C_with_S_S.S 中 ， 但 编译 器 是 不 知道 的 ， 所 以 只 能 在 链接 阶段 将 此 函数 重新 定位 ， 编 排 地址 。 
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经 过 


所 在 的 .o 文人 


接 阶段 时 将 其 
串 结尾 必须 是 
们 转 过 去 看 看 。 
在 代码 C_with_S_S.S 的 第 2 行 ， 定义 待 打印 的 字符 串 时 ， 在 结尾 人 为 地 加 了 个 0， 它 就 是 空 字 符 \0' 






































第 2~6 行 是 c_print 的 实现 ， 在 它 的 内 部 ， 它 又 调用 了 汇编 代码 C_with_S_S.S 中 的 函数 asm_print， 
第 1 行 的 声明 ， 我 们 








要 给 它 提 供 两 个 参数 : 字符 串 的 起 始 地 址 及 长 度 。 



































特别 强调 一 下 ， 由 于 这 里 并 不 打算 把 C 标准 库 也 链接 进来 ， 所 以 在 求 字 符 串 长 度 时 ， 我 们 不 能 
string.h 中 的 strlen 函数 。 也 就 是 说 即使 include <string.h> 将 其 strlen 的 声明 加 进来 , 没有 strlen 实现 本 身 













































































F 也 是 不 行 的 。 函 数 声 明 的 作用 是 : 一 方面 告诉 编译 器 该 函数 的 参数 所 需要 的 栈 空间 大 小 及 
返回 值 ， 这 样 编译 器 能 为 其 准备 好 执行 环境 ; 另 一 方面 如 果 该 函数 是 在 外 部 文件 中 定义 的 ,一 定 要 在 链 

































































对 

















的 ASCII 码 。 


AAA 








应 的 目标 文件 一 块 链接 进来 。 所 以 这 里 第 3~4 行 通过 while 循环 求 字 符 串 的 长 度 。 字 符 
空 字 符 \0' 才 行 ， 否 则 while 就 是 死 循环 了 。 这 个 字符 串 是 代码 C_with_S_S.S 提供 的 ， 我 










































































第 8 一 9 行 是 将 _start 导出 为 全 局 符号 ， 为 的 是 给 链接 器 用 的 ， 之 前 解释 过 了 。 





























为 了 在 汇编 文件 中 引用 外 部 的 函数 未必 是 C 代码 中 的 )， 需 要 用 extern 来 声明 所 需要 的 函数 名 。 


由 于 我 们 用 到 了 外 部 的 函数 c_print， 所 以 在 第 7 行 用 extern c_print 来 声明 c_print 函数 是 外 部 的 。 第 


























11 一 13 行 是 为 外 部 函数 c_print 压 栈 传 参 ， 调 用 它 后 清理 栈 空 间 。 

















第 16 一 17 行 是 调用 exit 系统 调用 告诉 Linux 我 要 正常 退出 。 


























在 汇编 语言 中 导出 符号 名 用 global 关键 字 ， 这 在 之 前 说 _start 时 大 伙 已 有 所 耳闻 ，global 将 符号 导出 


































































































为 全 局 属性 ， 对 程序 中 的 所 有 文件 可 见 ， 这样 其 他 外 部 文件 中 也 可 以 引用 被 global 导出 的 符号 啦 ， 无 论 该 


符号 是 函数 ， 还 是 变量 。 


asm_print。 我 们 在 第 19 行 用 global asm_print 将 其 导出 。 
第 20 行 之 后 是 asm_print 的 实现 ， 相 信 大 家 已 经 非常 明白 了 ， 不 解释 。 

通过 这 两 个 例子 我 相信 大 家 已 经 掌握 C 和 汇编 混合 编程 的 方法 啦 ， 确 切 说 是 方法 之 一 。 对 于 这 种 汇 
编 代 码 和 C 代码 单独 编译 的 方式 还 是 较 容 易 的 。 
有 关 混 合 编程 的 部 分 


extern 。 











rp 














== 




















由 于 在 c 代码 文件 C_with_S_c.c 中 也 调用 了 这 里 的 asm_print 函数 ， 所 以 为 了 让 外 部 代码 可 以 引用 











































































































就 说 完了 2 总 结 一 下 o 






































。 在 汇编 代码 中 导出 符号 供 外 部 引用 是 用 的 关键 字 global， 引 用 外 部 文件 的 符号 是 用 的 关键 字 




































































。 在 C 代码 中 只 要 将 符号 定义 为 全 局 便 可 以 被 外 部 引用 (一 般 情 况 下 无 需 用 额外 关键 字 修 饰 ， 具 体 


青 参考 C 语言 手册 )， 引 









































外 部 符号 时 用 extern 声明 即 可 。 


实现 自己 的 打印 函数 


一 直 以 来 ， 我 们 在 往 屏 幕 上 输出 文本 时 ， 要 么 利用 BIOS 中 断 ， 要 么 利用 系统 调用 ， 这 些 都 是 依赖 别 
人 的 方法 。 咱 们 还 用 过 一 个 稍微 有 点 独立 的 方法 ， 就 是 直接 写 显存 ， 但 这 貌似 又 没什么 技术 含量 。 如 今 我 
们 要 写 一 个 打印 函数 了 。 


6.3.1 显卡 的 端口 控制 


的 寄存 器 罗列 出 来 。 


次 看 到 DVD 版 本 的 
家 现在 者 














































































































在 第 3 章 我 们 讲述 了 有 关 显 卡 的 知识 , 但 当时 怕 影 响 兄弟 们 的 学 习 积 极 性 , 我 们 并 没有 说 把 有 关 显 - 
如 今 我 们 需要 通过 端口 来 控制 显卡 的 行为 ， 有 些 问 题 还 是 要 面 对 的 。 
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之 前 咱们 对 显卡 的 操作 和 对 普通 内 存 操作 是 一 样 的 ， 打 印字 符 时 ， 就 是 往 显 存 中 mov 一 些 字符 的 
ASCII 码 和 属性 ， 那 还 是 我 们 在 显存 默认 的 文本 模式 下 。 您 想 ， 我 们 都 爱 看 视频 、 电 影 ， 话 说 十 年 前 第 一 






























































电影 时 我 都 被 震撼 到 了 ， 当 时 看 的 是 《星河 战队 》， 清 晰 到 毛发 可 见 的 程度 ， 何 况 大 
偏爱 蓝光 高 清 版 本 ， 总 之 能 够 让 我 们 看 到 如 此 炫丽 的 画面 ,这 都 是 显卡 的 功劳 ， 这 说 明显 卡 还 可 


















































以 工作 在 彩色 图 形 模式 。 











对 于 显卡 的 操作 可 不 是 咱们 之 前 的 mov 来 mov 去 就 行 了 。 不 过 我 们 也 并 不 需要 
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那么 复杂 的 功能 ， 咀 们 还 是 在 80*25 的 文本 模式 下 转悠 ， 而 且 还 只 是 简单 的 操作 。 
之 前 我 们 已 经 对 硬盘 有 过 端口 操作 了 ， 无 非 就 是 用 in 和 out 指令 加 不 同 的 端口 号 ， 对 显卡 也 是 如 此 。 
显卡 中 的 寄存 嚣 很多， 不 ， 是 非常 多 ， 这 里 按照 它们 在 图 形 管 线 (位 于 CPU 和 video 之 间 ) 中 的 位 置 的 



































































































































顺序 给 大 家 介绍 下 ， 见 表 6-2。 




































































































































































表 6-2 VGA 寡 存 器 
寡 存 器 分 组 寡 存 器 子 类 读 端口 | 写 端口 说 明 
Address Register 3CEh 
Graphics Registers 
Data Register 3CFh 
Address Register 3C4h 
Sequencer Registers 
Data Register 3C5h 
Attribute Controller | Address Register 3COh 
Registers Data Register 3Clh 3COh 
CRT Controller Address Register 3x4h x 的 值 取 决 于 Input/Output Address Select 字段 , 它 决 
Registers Data Register 3x5h 定 映射 的 端口 号 为 3B4h-3B5h 或 3D4h-3D5h 
DAC Address Write Mode Register | 3C8h 
DAC Address Read Mode Register 不 可 3C7h 
Color Registers 
DAC Data Register 3C9h 
DAC State Register 3C7h 不 可 
Miscellaneous Output Register 3CCh 3C2h 
Extemal (General) | Feature Control Register 3CAh 3xAh 写 端口 为 3BAh (mono 模式 ) 或 3DAh (color 模式 ) 
Registers Input Status #0 Register 3C2h 个 Read-only at 3C2h 
Input Status #1 Register 3xAh 不 五 读 端 口 为 3BAh (mono 模式 ) 或 3DAh (color 模式 ) 
如 您 所 见 ， 表 6-2 中 列 出 的 寄存 器 的 数量 似乎 没 我 说 的 那么 为 怖 ， 其 实 这 些 只 是 寄存 器 的 目录 而 已 。 
























































以 上 所 说 的 目录 其 实 就 是 寄存 器 分 组 ， 在 这 些 寄存 器 中 也 不 全 是 分 组 。 前 四 组 寄存 器 属于 分 组 ,它们 
有 一 个 特征 ， 就 是 被 分 成 了 两 类 寄存 器 ， 即 Address Register 和 Data Register。 这 两 个 寄存 器 是 干吗 的 呢 ? 
这 得 先 从 寄存 器 为 什么 要 分 成 组 开始 说 。 

端口 实际 上 就 是 IO 接口 电路 上 的 寄存 器 , 为 了 能 访问 到 这 些 CPU 外 部 的 寄存 器 ,计算 机 系统 为 这 些 
寄存 器 统一 编 址 ， 一 个 寄存 器 被 赋予 一 个 地 址 ， 这 些 地 址 可 不 是 我 们 所 说 的 内 存 地 址 ， 内 存 地 址 是 用 来 访 
问 内 存 用 的 ， 其 范围 取决 于 地 址 总 线 的 宽度 ， 而 寄存 器 的 地 址 范围 是 0~65535 《Intel 系统 )。 这 些 地 址 就 
是 我 们 所 说 的 端口 号 ， 用 专门 的 IO 指令 in 和 out 来 读 写 这 些 寄 存 器 。 至 于 计算 机 内 部 访问 端口 怎么 实现 
的 ， 这 是 硬件 工程 师 的 事 ， 咱 们 暂且 奉行 拿 来 主义 ， 认 同 这 个 事实 就 够 了 。 

IO 接口 电路 上 的 寄存 器 数量 有 多 有 少 ， 这 要 看 具体 的 外 设 了 ， 我 这 么 说 您 就 明白 了 ， 这 里 给 寄存 器 
分 组 的 原因 是 显卡 (显示 器 的 IO 接口 电路 ) 上 的 寄存 器 太 多 了 ， 如 果 一 个 寄存 器 就 要 占用 一 个 系统 端口 
的 话 ， 这 得 多 浪费 硬件 资源 ， 万 一 别 的 硬件 也 这 么 干 ， 这 63336 个 地 址 可 就 捉襟见肘 了 。 所 以 计算 机 系统 
说 了 ， 我 不 管 你 们 内 部 有 多 少 寄存 器 ， 给 你 们 的 端口 地 址 是 有 数 的 ， 你 们 自己 内 部 协调 吧 。 

计算 机 工程 师 是 非常 聪明 的 ,把 数据 结构 中 数组 的 知识 用 到 了 硬件 中 。 他们 把 每 一 个 寄存 器 分 组 视 为 
一 个 寄存 器 数组 , 提供 一 个 寄存 器 用 于 指定 数组 下 标 , 再 提供 一 个 寄存 器 用 于 对 索引 所 指向 的 数组 元 素 ( 也 
就 是 寄存 器 ) 进行 输入 输出 操作 。 这 样 用 这 两 个 寄存 器 就 能 够 定位 寄存 器 数组 中 的 任何 寄存 器 啦 。 

这 两 个 寄存 器 就 是 各 组 中 的 Address Register 和 Data Register。Address Register 作为 数组 的 索引 〈 下 
标 )，Data Register 作为 寄存 器 数组 中 该 索引 对 应 的 寄存 器 ， 它 相当 于 所 对 应 的 寄存 器 的 窗口 ， 往 此 窗口 
读 写 的 数据 都 作用 在 索引 所 对 应 的 寄存 器 上 。 

所 以 ， 对 这 类 分 组 的 寄存 器 操作 方法 是 先 在 Address Register 中 指定 寄存 器 的 索引 值 
作 的 寄存 器 是 哪个 ， 然 后 在 Data Register 寄存 器 中 对 所 索引 的 寄存 器 进行 读 写 操作 。 











































































































































































































































































































































































































































































































be 





来 确定 所 
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上 面 CRT Controller Registers 寄存 器 组 中 的 Address Register 和 Data Register 的 端口 地 址 有 些 特 殊 , 它 
的 端口 地 址 并 不 固定 ， 具 体 值 取决 于 Miscellaneous Output Register 寄存 器 中 的 Input/Output Address Select 



















































































字段 ， 现 在 咱们 看 





下 这 个 5 存 器 ， 见 表 6-3。 





表 6-3 Miscellaneous Output Register ( 读 端 口 3CCh， 写 端口 3C2h ) 
7 6 5 4 3 2 1 0 
VSYNCP HSYNCP O/E Page Clock Select RAM En. LOAS 





























和 大 家 坦白 一 点 ， 显 卡 参 数 还 需要 专业 人 士 来 解释 ， 由 于 咱们 用 不 到 这 么 高 深 的 设置 ， 加 之 我 对 显 - 








ZX 
























































没有 深入 学 习 ， 所 以 这 里 面 有 好 多 参数 术语 ， 我 不 敢 随意 翻译 成 中 文 ， 担 心 误导 大 家 ， 所 以 我 直接 把 此 寄 



















































































苗 述 搬 过 来 了 ， 至 于 中 文 的 意思 ， 大 家 仁者 见 仁 、 智 者 见 智 吧 ， 请 您 见 该 ， 见 表 6-4。 



















































































存 器 各 字段 的 英文 
表 6-4 Miscellaneous Output Register 各 字段 英文 描述 
字 段 描 述 

"Determines the polarity of the vertical sync pulse and can be used (with HSP) to control the vertical 

VSYNCP 5 i Ss 
size of the display by utilizing the autosynchronization feature of VGA displays. 

(Vertical Sync Polarity) 人 

= 0 selects a positive vertical retrace Sync pulse. 

HSYNCP "Determines the polarity of the horizontal sync pulse. 

(Horizontal Sync Polarity) = 0 selects a positive horizontal retrace Sync pulse." 

O/EP "Selects the upper/lower 64K page of memory when the system is in an eve/odd mode (modes 0,1,2,3,7). 

age 
8 =0 selects the low page 

(Odd/Even Page Select) 2 
= 1 selects the high page" 
This field controls the selection of the dot clocks used in driving the display timing. The standard 
hardware has 2 clocks available to it nominally 25 Mhz and 28 Mhz. It is possible that there may be 
other "external" clocks that can be selected by programming this register with the undefined values. 
The possible valuse of this register are: 

Clock Select 00 -- select 25 Mhz clock (used for 320/640 pixel wide modes) 
01 -- select 28 Mhz clock (used for 360/720 pixel wide modes) 
10 -- undefined (possible external clock) 
11 -- undefined (possible external clock) 
"Controls system access to the display buffer. 

RAM En. >: 。 

=0 disables address decode for the display buffer from the system 

(RAM Enable) 2 teen 
= 1 enables address decode for the display buffer from the system" 
"This bit selects the CRT controller addresses. When set to 0, this bit sets the CRT controller 

LOAS addresses to Ox03Bx and the address for the Input Status Register 1 to Ox03BA for compatibility 
with the monochrome adapter When set to 1, this bit sets CRT controller addresses to Ox03Dx and 

(Input/Output Address Select) the Input Status Register 1 address to 0x03DA for compatibility with the color/graphics adapter. The 
Write addresses to the Feature Control register are affected in the same manner." 

这 里 IJOAS (Input/Output Address Select) 字段 不 仅 影响 CRT Controller Registers 寄存 器 组 的 Address 
Register 和 Data Register 的 端口 地 址 , 而 且 还 影响 Feature Control register 寄存 器 的 写 端 口 地 址 和 Input Status 


#1] Register 寄存 器 



































的 端口 地 址 〈 此 寄存 器 只 有 读 端口 )， 也 就 是 影响 了 表 6-2 中 所 有 端口 地 址 中 包括 x 的 





























寄存 器 。 所 以 ， 此 字段 意义 重大 ， 尽 管 咀 们 用 不 着 设置 《后 面 解释 )， 我 还 是 斗 胆 给 大 家 翻译 了 ， 和 希望 别 
误导 大 家 ， 大 概 意思 如 下 。 
e IOAS (Input/Output Address Select) 














此 位 用 来 选择 












































CRT controller 寄存 器 组 的 地 址 ， 这 里 是 指 Address Register 和 Data Register 的 地 址 。 





。 当 此 位 为 0 时: 





CRT controller 
端口 地 址 实际 值 为 




















寄存 器 组 的 端口 地 址 被 设置 为 0x3Bx， 结 合 表 6-2，Address Register 和 Data Register 的 


3B4h-3B5h。 并 且 为 了 兼容 monochrome 适配器 〈 显 卡 )，Input Status #1 Register 寄存 




















器 的 端口 地 址 被 设置 为 0x3BA。 
e 当 此 位 为 1 时 : 
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CRT controller 寄存 器 组 的 端 














器 的 





























端口 地 址 被 设置 为 0x3DA。 


Feature Control register 寄存 器 的 写 端口 也 是 3xAh 的 








的 影 


的 IOAS 位 ， 


























地 址 实际 值 为 3D4h-3DSh。 寺 




























































































啊 。 

e 如 果 JIOAS 位 为 0， 写 端口 地 址 为 3BAh。 
e 如 果 JIOAS 位 为 1， 写 端口 地 址 为 3DAh。 
翻译 结束 ， 对 以 上 中 文 版 请 大 家 自行 其 酌 。 














默认 情况 下 ，Miscellaneous Output Register 寄存 器 的 值 为 0x67， 其 他 字段 不 管 ， 咱 们 只 关注 这 最 台 
值 为 1。 也 就 是 说 : 

e CRT controller 寄存 器 组 的 Address Register 的 端 
地 址 0x3D5 。 






































Data Register 的 端 





























区 式 ， 该 端口 地 址 取信 


地 址 被 设置 为 0x3Dx， 结 合 表 6-2，Address Register 和 Data Register 的 


F 且 为 了 兼容 color/graphics 适配器 (显卡 )，Input Status #1Register 寄存 









































地 址 为 0x3D4， 


e Input Status #1Register 寄存 器 的 端口 地 址 被 设置 为 0x3DA。 


























































































































以 同 相 


的 方式 受 IOAS 位 











中 























































































































。 Feature Control register 寄存 器 的 写 端 口 是 0x3DA。 
坦白 说 ， 由 于 咱们 涉及 到 的 显卡 操作 只 用 到 了 CRT Controller Registers 分 组 中 的 寄存 器 ， 其 他 分 组 中 的 寄 
存 器 咱们 没 用 到 ， 目 前 掌握 的 内 容 已 经 可 以 让 我 们 继续 后 面 的 任务 了 。 虽 然 如 此 ， 我 还 是 将 其 余 分 组 的 寄存 器 
都 列 出 来 了 ， 万 一 有 同学 对 其 他 分 组 寄存 器 感 兴趣 也 用 得 着 ， 见 表 6-5 一 表 6-8。 
表 6-5 CRT Controller Data Registers 
索引 寄 存 器 索引 寄 存 器 

00h Horizontal Total Register 0Dh Start Address Low Register 
01h End Horizontal Display Register 0Eh Cursor Location High Register 
02h Start Horizontal Blanking Register OFh Cursor Location Low Register 
03h End Horizontal Blanking Register 10h Vertical Retrace Start Register 
04h Start Horizontal Retrace Register 11h Vertical Retrace End Register 
05h End Horizontal Retrace Register 12h Vertical Display End Register 
06h Vertical Total Register 13h Offset Register 
07h Overflow Register 14h Underline Location Register 
08h Preset Row Scan Register 15h Start Vertical Blanking Register 
09h Maximum Scan Line Register 16h End Vertical Blanking 
0Ah Cursor Start Register 17h CRTC Mode Control Register 
0Bh Cursor End Register 18h Line Compare Register 
0Ch Start Address High Register 

表 6-6 Graphics Registers 

索引 寄 存 器 

00 Set/Reset Register 
01 Enable Set/Reset Register 
02 Color Compare Register 
03 Data Rotate Register 
04 Read Map Select Register 
05 Graphics Mode Register 
06 Miscellaneous Graphics Register 
07 Color Don't Care Register 
08 Bit Mask Register 
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表 6-7 Sequencer Registers 
索 引 寡 存 器 
00 Reset Register 
01 Clocking Mode Register 
02 Map Mask Register 
03 Character Map Select Register 
04 Sequencer Memory Mode Register 
表 6-8 Attribute Controller Registers 
索引 寄 存 器 
00-0Fh Palette Registers (16 个 寄存 器 ) 
10h Attribute Mode Control Register 
11h Overscan Color Register 
12h Color Plane Enable Register 
13h Horizontal Pixel Panning Register 
14h Color Select Register 



































好 啦 ， 有 关 显 卡 寄 存 器 的 部 分 咱们 就 说 完了 ， 下 面 进入 实习 阶段 。 














6.3.2 ”实现 单个 字符 打印 


万 事 开 头 难 , 我 们 先 从 简单 的 打印 字符 开始 。 这 个 功能 类 似 C 语 

本 putchar， 每 次 只 打印 一 个 字符 ， 由 于 此 函数 咱们 是 在 内 核 中 

实现 的 ， 暂 且 将 其 命名 为 put_char。 
在 这 之 前 ,为 了 开发 方便 ， 我们 定义 一 些 数据 类 型 。 主 要 是 参考 
了 Linux 的 /usr/include/stdint.h 文件 ， 有 环境 的 同学 可 以 自行 看 下 , 没 
环境 的 同学 ， 请 看 图 6-7。 

该 文件 在 我 目前 的 Linux 版 本 上 是 320 行 ， 这 里 只 是 冰山 一 角 ， 
图 各 种 宏 显 得 好 高 大 上 啊 ， 不 过 请 放心 ， 把 这 个 图 贴 出 来 就 是 为 
本 «< 吓 晓 ” 大 家 的 ， 咱 们 不 会 写 这 么 复杂 ， 不 信 请 看 代码 6-1。 


代码 6-1 (project/c6/a/lib/stdint.h ) 


ifndef _LIB STDINT H __extension__ 
tdefine ILIB STDINT H 
typedef signed char int8 t; 
typedef signed short int int16 t; A 图 6-7 Linux 头 文件 stdint.h 截图 
typedef signed int int32 t; 

typedef signed long long int int64 t; 

typedef unsigned char uint8 t; 

typedef unsigned short int uint16 t; 

typedef unsigned int uint32 t; 

typedef unsigned long long int uint64 t; 

#endif 

































































一 extension__ 













































































































































































PPOo lawm 必 wm 


上 


























怎么 样 ， 确实 是 很 简单 吧 。 以 后 我 们 采用 的 任何 数据 类 型 就 要 用 这 些 定义 好 的 啦 。 估 计 大 家 也 注意 到 
啦 ， 了 咱们 定义 的 stdint.h 文件 位 于 lib 目录 下 ， 也 就 是 说 我 新 建 了 个 lib 目录 用 来 专门 存放 各 种 库 文件 。 不 
仅 如 此 ， 在 lib 目录 下 还 建立 了 user 和 kernel 两 个 子 目录 ， 以 后 供 内 核 使 用 的 库 文 件 就 放 在 lib/kernel/ 下 ， 
lib/user/ 中 是 用 户 进程 使 用 的 库 文 件 。 

我 们 要 实现 的 字符 打印 函数 叫 put_char， 它 是 用 汇编 语言 写 的。 因为 要 和 显卡 打交道 啦 ， 里 面 涉及 到 
端口 的 读 写 操作 ， 目 前 还 是 用 纯 汇 编 文 件 较 方 便 ， 以 后 慢 慢 发 展 起 来 后 ， 咱 们 会 采取 内 联 汇 编 的 方式 。 
接 上 代码 啦 ， 我 们 的 打印 函数 统统 在 print.S 文件 中 完成 ， 该 文件 是 各 种 打印 函数 的 核心 ， 重 中 之 
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这 里 先 给 大 家 介绍 下 它 的 处 理 流程 。 
(1) 备份 寄存 器 现场 。 
(2) 获取 光标 坐标 值 ， 光 标 坐 标 值 是 下 一 个 可 打印 字符 的 位 置 。 





(3) 获取 外 














村 打印 的 字符 。 














(4) 判断 字符 是 否 为 控制 字符 ， 若 是 回 车 符 、 换 行 符 、 退 格 符 三 种 控制 字符 之 一 ， 则 进入 相应 的 处 理 



























































流程 。 否 则 ， 其 余 字符 都 被 粗暴 地 认为 是 可 见 字符 ， 进 入 输出 流程 处 理 。 
(5) 判断 是 否 需要 滚屏 。 
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(6) 更 新 光标 坐标 值 ， 使 其 指向 下 一 个 打印 字符 的 位 置 。 














(7) 恢复 寄存 器 现场 ， 退 出 。 
该 文件 相对 来 说 又 有 点 长 ， 故 需要 将 其 拆 分 成 3 部 分 ， 先 给 大 伙 儿 呈 上 其 第 一 部 分 ， 见 代码 6-2-1。 

















代码 6-2-1 (project/c6/al/lib/kernel/print.S ) 


TI_GDT equ 0 
RPLO equ 0 








1 
2 
3 SELECTOR i 
4 
5 
6 


VIDEO equ (0x0003<<3) + TI_GDT + RPLO 


] 


三 PUt GNar 二 一 汪 一 一共 二 天 二 一共 二 一 基站 天 二 天 一 





[bits 32 
section . 
是 
8 ; 功 能 描述 
9 i 








: 把 栈 中 的 1 个 字符 写 入 光标 所 在 处 


0 BT put_ char 
1 Dut Car: 













































































































































































了 和 pushad ;备份 32 位 寄存 器 环境 
13 ;需要 保证 gs 中 为 正确 的 视频 段 选 择 子 
; 为 保险 起 见 ， 可 次 打印 时 都 为 gs 赋值 
14 mov ax，， SELECTOR_ VIDEO ”; 不 能 直接 把 立即 数 送 入 段 寄存 器 
:5 mov gs, ax 
16 
17 ;D77777;;; 获取 当前 光标 位 置 ; ;;D;D;D;D;;; 
18 ; 先 获 得 高 8 位 
19 mov dx, 0x03d4 ;索引 寄存 器 
20 mov al, Ox0e 提供 光标 位 置 的 高 8 位 
21 Gut dw 
22 mov dx, 0x03d5 ;通过 读 写 数据 端口 0x3d5 来 获得 或 设置 光标 位 
23 in al, dx ; 得 到 了 光标 位 置 的 襄 8 位 
24 mov ah, al 
25 
26 ;再 获取 低 8 位 
27 mov dx, 0x03d4 
28 mov al, OxOf 
29 out dx, al 
309 mov dx, 0x03d5 
3 于 生计 工区 
32 
33 ;将 光标 存 入 bx 
34 mov bx, ax 
35 ; 下面 这 行 是 在 栈 中 获取 待 打 印 的 字符 
36 mov ecx, [esp + 36] ;pushad 压 入 4Xx8= 32 字 节 ， 
;加 上 主 调 函 数 4 字 节 的 返回 地 址 ， 故 esp+36 字 节 
37 cmp cl, Oxd ;CR 是 0x0d，LF 是 0x0a 
38 jz .is carriage return 
39 cmp cl, 0xa 
40 jz .is line feed 
41 
42 cmp cl, 0x8 ;BS (backspace) 的 asc 码 是 8 
43 jz .is backspace 
44 jmp .put other 


45 772777777 


rrrrrrrrrr 














put_char 函数 是 以 后 我 们 任何 一 个 打印 功能 的 核心 ， 所 以 光 它 的 实现 就 要 112 行 ， 这 似乎 是 我 们 目前 写 过 的 
最 长 的 一 个 函数 了 ， 我 保证 以 后 也 没有 这 么 长 的 啦 。 好 啦 ， 长 归 长 ， 不 过 也 没什么 难度 ， 下 面 咱们 开讲 啦 。 


put_char 的 







































































打印 原理 是 直接 写 显 存 ， 在 32 位 保护 模式 下 对 内 存 的 操作 是 “[ 段 基 址 〈 选 择 子 ): 段 内 偏 








移 量 ]”， 所 以 这 就 涉及 视频 段 选择 子 啦 。 


























直 以 来 我 们 都 是 











] 段 寄存 器 gs 来 存储 视频 段 选择 子 的 ， 以 后 


也 是 ， 所 以 得 保证 在 写 显 存 之 前 ，gs 中 的 值 是 正确 的 选择 子 。 第 14 一 15 行 是 我 们 为 GS 寄存 器 赋值 的 代 





码 ， 别 小 看 这 两 行 ， 大 有 来 尖 ， 可 不 亚 于 挫 上 大 事 呢 ， 吃 





道 说 道 吧 ， 大 家 要 做 好 心理 准 
第 1 一 3 行 是 定义 了 视频 段 的 选择 子 ， 

直接 在 这 定义 了 ， 好 的 习惯 是 放 在 配置 文 从 
了 是 通过 关键 字 global 把 函数 put_char 导出 为 























以 调用 。 
































第 12 行 是 



































备 。 咱 们 9 


Se 





说 别 的 。 











筷 ， 待 时 

















们 把 put_char 函数 说 完 






































J 开始 定义 函数 put_char。 
] pushad 指令 备份 32 位 寄存 器 的 环境 ， 按 天 
为 ， 将 8 个 32 位 全 部 备份 了 。PUSHAD 是 push all double， 该 指令 压 入 所 有 

















tk 是 8 个 ， 它 们 的 入 栈 有 


第 14 一 15 行 是 为 gs 


























se 



































全 局 符号 ， 这 届 





























说 用 到 哪些 寄存 器 就 要 备份 哪些 ， 
































安装 正确 








的 选择 


























我 们 在 打印 字符 时 ,通常 都 不 月 











光标 的 位 置 处 显示 的 ， 而 上 且 











光标 的 位 置 会 









































也 没 


中 

















己 经 习惯 了 跟随 光标 。 我 想 大 伙 】 








关系 。“ 光 标 在 哪 字 符 就 在 哪 ” 这 是 我 们 人 为 
在 光标 处 打印 字符 ， 让 光标 和 字符 的 位 置 分 开 。 这 一 点 在 理论 上 就 能 证 
bh 址 处 。 在 文本 模式 80*25 下 的 显 











写 入 在 显存 中 的 茶 个 

















> 





本- 半 ? 几 虹 


















































= 








字 节 是 字符 的 ASCII 码 ， 高 字 节 是 前 景色 和 


二 





的 任意 2 字 节 我 们 都 可 以 写 入 字符 ， 
们 快速 找到 屏幕 上 的 活跃 位 置 ， 














能 够 帮助 























出 

















色 属 性 ， 





] 的 字符 一 


za 
Vv 





村 








2 
oO 


J 
入 人 有 

















有 什么 奇怪 , 原 





大 | 

















是 字符 是 在 当前 
直 跟 着 光标 走 ， 似乎 光标 就 是 字符 的 导航 
的 关系 了 ， 对 ,它们 的 关系 就 是 没有 任何 
I 意 设置 的 ， 我们 是 在 光标 处 打印 字符 。 也 就 是 说 ,我们 也 可 以 不 


了 跟 大 家 好 好 说 


于 只 需要 这 三 行 ， 专 门 定义 个 配置 文件 有 点 不 值 当 的 ， 所 以 
， 大 家 在 实践 中 不 要 学 我 。 
F 对 外 部 文件 便 可 见 了 ， 外 部 文件 


我 这 里 是 偷懒 行 
双 字 长 的 寄存 器 ， 这 里 的 “所 有 ” 
Et 后 顺序 是 : EAX->ECX->EDX->EBX-> ESP-> EBP->ESL>EDI，EAX 是 最 先入 栈 。 

子 ， 原 因 如 前 所 述 完事 
指定 字符 显示 的 坐标 位 置 ， 大 家 
直 更 新 顺延 ， 我 人 
L 己 经 清楚 了 光标 和 字 














明 ， 我们 知道 打印 字符 本 质 上 就 是 把 字符 



























































































































































存 可 以 显示 80*25=2000 个 字符 ， 每 个 字符 占 2 字 节 ， 低 
所 以 在 4000 字 节 的 显存 空间 中 ， 只 要 起 始 地 址 为 偶数 
您 看 ， 这 哪里 是 光标 能 限制 的 。 光 标 只 是 个 亮点 ， 
它 本 身 与 字符 显示 的 位 置 没 有 关系 。 


] 来 吸引 用 户 眼 球 的 ， 它 









































维 

















话 昌 然 这 么 说 ， 但 光标 的 作用 已 经 被 认同 为 当前 可 输入 或 显示 字符 的 位 置 ， 字符 在 光标 处 显示 ， 这 已 





的 线性 坐标 ， 是 屏幕 上 





经 成 了 字符 打印 的 传统 观念 ， 所 以 在 咱们 的 实现 中 也 要 传承 复制 这 种 观念 。 

光标 是 什么 ? 不 要 感到 奇怪 。 

我 们 Linux 用 户 最 熟悉 了 ， 就 是 屏幕 上 那 一 小 白 竖 块 ， 和 文本 软件 中 的 小 竖 线 是 一 回 事 ， 它 们 都 是 用 来 告诉 
用 户 当前 文本 输入 点 在 哪里 的 。 光 标 是 字符 的 坐标 ， 只 不 过 该 坐标 不 是 二 维 的， 而 是 
所 有 字符 以 0 为 起 始 的 顺序 。 在 默认 的 80*25 模式 下 ， 每 行 80 个 字符 共 











故 该 坐标 值 的 范围 

















是 0~1999。 第 0 行 
最 后 一 行 的 所 有 字符 是 1975 一 1999。 






























































的 坐标 位 置 是 存放 在 光标 坐标 寄存 器 : 













































































25 行 ， 屏 幕 上 可 以 容纳 2000 个 字符 ， 
























































的 所 有 字符 坐标 是 0~24， 第 1 行 的 所 有 字符 坐标 是 25~49， 以 此 类 推 ， 
于 一 个 字符 占用 2 字 节 ， 所 以 光标 乘 以 2 后 才 是 字符 在 显存 中 的 地 址 。 


1， 光标 的 坐标 并 不 会 





光标 的 ， 当 我 们 在 屏幕 上 写 入 一 个 字符 时 
自动 +1， 因 为 光标 跟随 字符 并 不 是 必要 的 ， 比 如 我 们 想 删 除 文本 中 的 某 个 字符 时 ,咱们 就 可 以 把 光标 移动 
到 该 字符 后 面 ， 再 按 下 delete 键 ， 这 样 字 符 就 被 删除 了 ， 这 就 是 光标 与 字符 分 离 的 应 用 之 一 。 所 以 ， 光 标 
位 置 并 不 会 自动 更 新 , 因为 光标 坐标 寄存 器 是 可 写 的 , 如 果 需 要 的 话 , 程序 员 可 以 自己 来 维护 光标 












































为 了 在 光标 处 打印 久 
坐标 值 。 
之 前 中 


> 

















们 介绍 显卡 上 











们 得 








符 , 1 








先知 道光 标 在 曙 

















那么 多 的 寄存 器 终于 发 挥 / 


















































8， 所 以 第 一 件 事 就 是 读 取 光 标 多 





标 寄存 器 ， 者 


的 坐标 。 
A 取 光 标 





处 了 ， 我 们 看 下 表 6-5CRT Controller Data Registers 


中 索引 为 0Eh 的 Cursor Location High Register 寄存 器 和 索引 为 0Fh 的 Cursor Location Low Register 寄存 器 ， 


这 两 个 寄存 器 都 是 8 位 


长 度 ， 分 别 




















来 存储 光标 匀 











访问 CRT controller 寄存 器 组 的 寄存 器 , 需要 先 往 端 品 




















寄存 器 的 索引 ， 再 从 端 











地 址 为 0x3D5 的 Data Register 寄存 器 读 、 写 数据 。 





标的 低 8 位 和 高 8 位 地 址 。 
地 址 为 0x3D4 的 Address Register 寄存 器 中 写 入 

















在 代码 第 17 一 31 行 














来 获取 光标 值 ， 先 在 第 19 一 21 行 设 





SG /十 


























待 操 


标的 高 8 位 ， 所 以 要 将 索引 0x0e 写 入 Address Register 寄存 器 ， 其 端 
确定 了 要 操作 的 寄存 器 是 Cursor Location High Register 后 ， 我 们 在 第 22 一 24 行 通过 Data Register 寄 




















为 0x03d4。 








乍 的 寄存 器 索引 ， 我 们 先 获 取 的 是 多 





[ 斧 
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存 器 ， 其 端口 是 0x3d5， 将 坐标 读 入 到 al 寄存 器 ， 
既然 要 把 坐标 的 高 8 位 存 到 寄存 器 ah ' 
次 ， 对 于 in 指令 ， 如 果 源 操作 是 8 位 寄存 器 ， 








寄存 器 。 也 许 您 心 存 疑惑 ， 
变 成 in ah, dx? 还 多 倒 腾 一 次 干吗 ? 真 的 抱 


al， 如 果 源 操作 数 是 16 位 寄存 器 ， 















































目的 操作 数 必须 是 ax。 











第 26 一 32 行 





SA 











同样 的 方法 获取 到 多 
第 35 行 是 将 光标 值 从 ax 寄存 器 ! 











16 位 实 模式 





址 和 变 址 寄存 器 可 以 是 全 部 的 32 位 的 通 








标的 低 8 位 ， 至 此 ， 寄 存 器 ax ! 








| 于 al 中 是 坐标 的 高 8 位 ， 所 以 第 24 行将 其 
， 为 什么 不 把 in 


























存储 在 ah 
和 令 中 的 al 换 成 ah， 


























是 光标 完整 的 








的 操作 数 必 须 是 

















16 位 坐标 值 。 


















































寄存 器 ， 就 是 刚才 


























复制 到 bx， 这 么 做 的 原因 是 习惯 / 


] pushad 指令 压 入 的 












































寄存 器 bx 做 基 址 寻 址 ， 还 记得 吗 ， 在 
下 其 址 寄存 器 必须 是 bx 或 bp， 变 址 必须 是 寄存 器 si 或 di。 在 32 位 保护 模式 下 没 必要 这 么 做 了 ， 基 
嘟 8 个 ， 忘 了 往 上 翻 翻 。 以 后 


























的 处 理 都 要 基于 bx 寄存 器 了 ， 在 此 知道 bx 现在 已 经 是 光标 坐标 值 就 行 了 ， 它 是 下 一 个 可 打印 字符 的 位 置 。 
压 入 的 字符 的 ASCII 码 ， 也 就 是 待 打印 的 字符 ， 
地 址 占 4 字 节 外 ， 还 有 最 开始 的 pushad 指令 压 入 的 8 个 32 位 的 通用 寄存 器 共 32 
字 节 的 数据 ， 所 以 竺 打印 的 字符 在 栈 顶 偏 移 36 字 节 的 位 置 。 

之 后 的 第 36 一 44 行 开 始 判断 参数 是 什么 字符 ,只 





第 


2 


用 put_char 函数 的 返回 ] 












































36 行 是 获取 栈 ' 


















































这 是 1 字 节 

































































的 数据 。 栈 中 除了 调 





们 这 里 只 把 回 车 符 CR (carriage_return)、 换 行 符 LF 




















(line_ feed) 和 退 格 键 backspace 当 作 不 可 见 字 符 ， 按 照 其 实际 控制 意义 来 处 理 ， 其 他 





可 见 字 符 。 回 车 符 的 ASCII 码 是 0xd， 换 行 符 的 ASCII 码 是 0xa， 


























我 们 这 里 的 处 理 是 














还 是 换行 符 ， 一 律 按 我 们 平时 所 理解 的 回 车 换行 符 〈CRLF) 处 理 〈Linux 中 就 把 换 





行 )， 即 这 两 个 动作 的 合成 :光标 回 撤 到 入 
行 符 时 再 说 ， 处 理 退 格 键 也 是 在 后 
说 到 这 ， 不 知道 是 否 让 您 有 些 意外 ， 对 于 回 车 、 换 行 等 控制 字符 ， 其 实际 意义 还 





















































而 的 























首 + 换 到 下 一 行 。 
尺码 中 ， 咱 们 一 会 儿 再 说 。 








具体 实现 还 得 在 代码 











字符 暂时 一 律 认 为 是 
不 管 参数 是 回 车 符 ， 

行 符 处 理 成 回 车 + 换 
6-2-2 中 处理 回 车 换 





I 










































































处 理 ? 难道 我 直接 写 入 
































符 的 行为 ,说白 
的 表现 





























了 ， 咀 们 就 像 个 控制 字符 的 动 



































多 式 取决 于 软件 


的 逻辑 ， 所 以 ， 咱 们 甚至 可 以 将 shift 键 解释 为 换行 ， 不 过 只 
释 这 些 字符 编码 的 行为 ， 即 换行 符 就 是 切换 到 下 一 行 ， 退 格 键 就 是 删除 前 一 个 字符 。 




















码 的 行为 解释 





需要 咱们 自己 手动 来 

















可 车 的 ASCII 码 0xd 并 不 生效 ? 答案 让 您 失望 了 , 必须 是 , 咱们 得 手工 展示 控制 字 
作 模 拟 器 。 硬 件 不 负责 这 些 字符 























字符 编码 
































们 还 是 按照 常识 来 解 



















































































然 会 覆盖 此 处 的 字符 




































































































































































代码 6-2-2 (project/c6/a/lib/kernel/print.S ) 
46 
47 .is backspace: 
媳 全 天 丰产 让 这 区 站 全 元 全 产 人 backspace 的 一 点 说 明 7777777777 
49 ; 当 为 backspace 时 ， 本 质 上 只 要 将 光标 移 向 前 一 个 显存 位 置 即 可 .后 输入 的 字符 上 
50 ; 但 有 可 能 在 键入 backspace 后 并 不 再 键入 新 的 字符 ， 这 时 光标 已 经 向 前 移动 到 待 删除 的 字符 位 置 ， 但 字符 还 在 原 处 
51 ; 这 就 显得 好 怪异 ， 所 以 此 处 添加 了 空格 或 空 字符 0 
52 dec bx 
53 shl bx,1 ;光标 左 移 1 位 等 于 乘 2 
;表示 光标 对 应 显存 中 的 偏 移 字 节 
54 mov byte [gs:bx], 0x20 ;将 待 删除 的 字 节 补 为 0 或 空格 皆 可 
S59 inc bx 
56 mov byte [gs:bx], Ox07 
el She bes 
58 jmp .set cursor 
59 7777777777777777777777777777777 7 
60 
61 .put other: 
62 shl px, 1 ;光标 位 2 字 节 表示 ， 将 光标 值 乘 2 
;表示 对 应 显存 中 的 偏 移 字 节 
63 mov [gs:bx], cl ; ASCII 字符 本 身 
64 inc bx 
65 mov byte [gs:bx],0x07 ; 字符 属性 
66 shr bx, 1 ; 恢复 老 的 光标 值 
67 inc bx ; 下 一 个 光标 值 
68 cmp bx, 2000 
69 jl .set cursor ; 若 光 标 值 小 于 2000， 表 示 未 写 到 
; 显存 的 最 后 ， 则 去 设置 新 的 光标 值 
70 ; 车 超出 屏幕 字符 数 大 小 ( 2000 ) 
; 则 换行 处 理 
71 .is line feed: ; 是 换行 符 LF (\n) 
72 .is carriage return: ; 是 回 车 符 CR (\r) 
73 ;如 果 是 CR(\r)， 只 要 把 光标 移 到 行 首 就 行 了 
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代码 6-2-2 处 理 控制 键 〈 不 可 见 字符 ) 下 


经 在 代码 6-2-1 第 34 行 变 成 了 下 一 个 可 打印 字符 的 光标 坐标 值 


QX 


.is carriage return end: 


add bx, 80 

cmp bx, 2000 
.is line feed end: 

jl .set cursor 





















































义 本 











2 








;也 就 是 下 


; 光标 值 减 去 除 
; 以 上 4 行 处 理 \r 











了 的 行 



































; 回 车 符 CR 处 理 结束 








nux，Linux 中 \n 表示 


系统 中 








都 处 理 为 Linux 中 \n 的 意思 


的 余数 便 是 取 
的 代码 








; 若是 LF (\n) ,将 光标 移 +80 便 可 


























对 地 址 ， 接 下 来 在 该 地 址 处 写 入 























字符 用 空格 覆盖 。 第 52 行 是 用 
将 bx 左 移 1 位 ， 相 当 于 乘 以 2， 

















再 通过 





ASCII 码 ， 
inc 指令 把 bx 加 上 1， 这 档 





























dr LA 


字符 。 
1 于 字符 的 ASCII 码 只 是 1 字 节 ， 所 以 只 ) 
第 47 一 58 行 是 用 来 处 理 退 格 键 backspace 的 





同样 在 代码 6-2-1 的 第 


车 换行 符 及 退 格 键 ， 以 及 普通 可 见 字 符 。 























寄存 器 cl 

















您 也 看 到 了 ， 不 如 直接 在 第 54 行 写 入 0x0720 
如 果 忘 记 了 可 以 看 下 表 3-16。 

















dec 指令 9 


























E 将 bx 减 1， 这 样 光标 4 


就 够 了 。 





36 行 ， 寄 存 器 ecx 








， 光 标 值 乘 以 2 后 便 是 光标 在 显存 中 的 相 
己 经 是 待 打印 的 参数 了 。 



























































尺码 。backspace 的 原理 就 是 将 光标 回回 移动 1 位 ， 将 该 处 的 
标 便 指向 前 









































个 字符 了 ， 第 53 行 用 shl 指令 




















mul 指令 方便 。 














1 于 字符 在 显存 中 占 2 字 节 ， 低 字 节 是 








j shl 指令 做 乘法 比 用 
高 字符 是 属性 ， 所 以 第 54 行 在 bx 处 ， 也 就 是 低 字 节 处 先 把 空格 的 ASCII 码 0x20 写 入 ， 第 





























# bx 便 指 向 了 该 字符 的 


= 











第 55 行 














属性 位 置 ， 第 36 行 








再 将 属性 0x7 写 入 到 高 字 节 (其 实 























取 间 里 ， 





























为 了 提醒 自 
经 变 成 了 奇数 ， 第 57 行 通 过 右 移 指 令 


























循序 渐进 ， 
其 实 这 是 显卡 默认 的 前 景色 和 背景 色 ， 所 以 不 加 也 行 。 这 里 显 式 地 写 入 属性 是 
己 往 显存 中 写字 符 ， 不 仅 要 写 ASCI 码 。 此 时 的 bx 由 于 之 前 已 经 加 1 指向 属性 了 ， 所 以 它 现在 已 
shr 将 bx 右 移 1 位 相当 于 除 2 取 整 ， 余 数 不 要 了 ， 这 样 bx 便 由 显存 中 








后 面 我 们 会 这 么 做 )。0x7 表示 黑屏 白字 ， 
























































的 相对 地 址 恢复 成 了 光标 坐标 ， 此 时 的 bx 指向 新 覆盖 的 空格 。 在 不 考虑 余数 的 情况 下 ， 用 右 移 指令 做 除法 比 























div 指令 要 省 事 。 由 于 删除 了 一 个 字符 ，bx ! 
的 流程 .set_cursor， 经 过 它 的 处 理 ， 
第 61 一 69 行 处 理 可 见 字符 的 代码 ， 其 中 第 62 一 66 行 和 上 



















































































的 光标 坐标 已 经 被 更 新 为 前 一 位 ， 




















之 后 在 第 58 行 跳 到 设置 光标 











光标 才 会 显示 在 新 位 置 。.set_cursor 的 代码 将 在 代码 6-2-3 中 展示 。 















































尺码 类 似 ， 区 别 是 在 








面 处 理 backspace 中 的 




















第 67 一 68 行 ， 通 过 inc 指令 把 光标 坐标 bx 值 加 1， 使 bx 成 为 新 的 可 以 打印 字符 的 坐标 ， 之 后 再 判断 这 个 

























































































Se 










































































新 坐标 是 否 超 过 了 屏幕 显示 的 范围 , 这 个 新 坐标 值 就 是 下 次 打 E 


屏幕 可 显示 的 字符 数 是 2000， 这 里 











字符 的 位 置 。 前 面 说 过 了 在 80*25 模式 下 























] cmp 指令 把 下 次 打印 字符 的 坐标 和 2000 比较 ， 若 小 于 2000 则 表示 



































































































































































































































































































































下 次 打印 时 ,字符 还 会 在 当前 屏幕 的 范围 之 内 ,于 是 在 第 69 行 直接 跳 转 到 .set_cursor 更 新 光标 坐标 。 如 果 
下 次 打印 字符 的 坐标 不 小 于 2000 “在 咱们 的 应 用 中 顶 多 是 等 于 2000 的 情况 )， 这 意味 着 需要 滚屏 了 。 
滚屏 是 什么 ? 如 您 所 料 ， 就 是 滚动 屏幕 ， 让 屏幕 之 外 的 内 容 可 以 显示 在 屏幕 上 ， 如 图 6-8 所 示 。 
以 上 我 们 所 说 的 只 是 一 种 需要 滚屏 的 情况 ， 其 实 还 有 其 他 情况 也 深 尼 ， 类 们 于 屏幕 在 显存 中 上 下 滑 
(1) 新 的 光标 值 超出 了 屏幕 右 下 角 最 后 一 个 字符 的 位 置 。 会 et 
(2) 最 后 一 行 中 任意 位 置 有 回 车 或 换行 符 。 4 
咱们 看 一 下 实现 深 屏 的 方法 。 显存 共 25 行 a 
之 前 咱们 说 过 ,在 80*25 文本 模式 下 屏幕 可 显示 2000 个 字 ( 字 符 )， 可 显示 2000 字 符 
4000 字 节 的 内 容 。 显 存 有 32KB， 按 理 说 显存 中 可 以 存放 32KB/4000B | 外 
约 等 于 8 屏 的 字符 ， 这 8 屏 的 字符 肯定 不 能 一 下 子 都 显示 在 1 个 屏幕 
上 ， 所 以 显卡 就 为 咱们 提供 了 两 个 寄存 器 ， 用 来 设置 显存 中 那些 在 屏 人 
幕 上 显示 的 字符 的 起 始 位 置 ， 它 们 分 别 是 表 6-5 中 索引 为 0xc 的 Start Address High Register 和 0xd 的 Start 
Address Low Register， 这 两 个 都 是 8 位 寄存 器 ， 如 名 字 所 示 ， 它 们 分 别 设置 地 址 的 高 8 位 和 低 8 位。 只 要 





指定 起 始 地 址 ， 屏 幕 自动 从 该 地 址 起 ， 向 后 显示 2000 











人 人 人心 全 


个 子 付 。 









































注意 ， 如 果 起 始 地 址 过 大 ， 显 卡 会 将 其 在 
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显存 中 回 绕 wrap around。 好 了 ， 您 已 经 猜 到 了 ， 一 种 方案 是 通过 设置 显示 的 起 始 地 址 ， 让 屏幕 在 显存 ! 
滑动 起 来 实现 窗口 滚动 。 
其 实 ， 咱 们 还 有 另外 一 个 方案 。 
默认 情况 下 这 两 个 寄存 器 的 值 是 0, 也 就 是 说 默认 情况 下 屏幕 上 的 内 容 是 从 显存 的 首 地 址 (物理 地 址 ) 
0xb8000 起 ， 一 直到 以 该 地 址 向 上 偏 移 3999 字 节 的 地 方 。 假 如 我 们 把 屏幕 固定 在 此 ， 这 样 就 不 用 再 设置 
显示 的 起 始 地 址 了 ， 其 永远 为 0。 这 两 个 寄存 器 Start Address High Register 和 Start Address Low Register 
我 们 就 不 用 动 了 。 
第 一 种 方案 的 优势 是 显存 中 可 缓存 16KB 个 字符 ,屏幕 外 的 文本 也 能 找 回 。 缺点 就 是 要 设置 那 两 个 起 
始 地 址 寄存 器 ， 编 程 复 杂 一 点 。 
第 二 种 方案 的 优势 就 是 编程 简单 ， 缺 点 是 只 能 缓存 2000 个 字符 ， 屏 幕 上 的 字符 便 是 全 部 缓存 了 。 
话说 ， 虽 然 第 一 种 方案 能 缓存 那么 多 个 字符 ， 但 显存 容量 毕竟 是 有 限 的 ， 当 输出 字 节 量 超过 32KB 时 ， 

们 照样 要 丢弃 之 前 旧 的 字符 ,不 是 所 有 屏幕 外 的 字符 都 能 找 回 , 而且 要 多 个 设置 寄存 器 的 操作 。 毕 竞 越 简 
单 越 容易 帮助 大 家 看 清 操作 系统 原理 ， 要 不 咱们 就 简单 点 ， 采 取 第 二 种 方案 。 
屏幕 每 行 80 个 字符 ， 共 25 行 ， 咱 们 的 滚屏 实现 比较 简单 ， 现 在 说 一 下 用 此 方案 实现 滚屏 的 步骤 。 

(1) 将 第 1 一 24 行 的 内 容 整 块 搬 到 第 0 一 23 行 ， 也 就 是 把 第 0 行 的 数据 履 盖 。 

(2) 再 将 第 24 行 ， 也 就 是 最 后 一 行 的 字符 用 空格 覆盖 ， 这 样 它 看 上 去 是 一 个 新 的 空 行 。 

(3) 把 光标 移 到 第 24 行 也 就 是 最 后 一 行 行 首 。 

经 过 这 三 步 ， 屏 幕 就 像 向 上 滚动 了 一 行 〈 似 乎 我 们 是 字符 的 搬运 工 )。 另 外 ， 由 于 第 3 步 只 是 计算 好 了 
新 的 坐标 值 并 没有 在 光标 寄存 器 中 更 新 ， 所 以 它 的 顺序 不 是 很 重要 ， 也 可 以 放 在 前 面 先 做 。 
来 继续 说 代码 6-2-2， 第 71 一 84 行 是 处 理 回 车 换行 符 的 代码 ， 我 们 刚 说 的 滚屏 操作 也 需要 它 。 因 为 在 滚 
屏 操作 中 ， 除 了 将 当前 屏幕 所 有 内 容 上 移 一 行 外 ， 光 标的 坐标 也 要 更 新 为 下 一 行 的 行 首 ， 这 实际 上 相当 于 在 最 
后 一 行 的 行 尾 键入 了 回 车 符 ， 在 此 用 处 理 回 车 换行 符 的 代码 帮助 我 们 实现 上 面 第 3 步 的 更 新 光标 值 。 

回 车 换行 本 质 上 是 两 个 操作 ， 一 个 是 回 车 carriage_return， 将 光标 回 撤 到 当前 行 的 行 首 ， 另 一 个 是 换 
行 line _ feed， 就 是 切换 到 下 一 行 。 这 两 个 动作 合成 到 一 起 便 是 我 们 平时 涡 下 一 个 回 车 键 的 效果 : 光标 出 现 
在 下 一 行 行 首 。 
第 74 一 78 行 是 在 处 理 回 车 符 ， 也 就 是 将 光标 回 撤 到 行 首 。 这 里 的 方法 是 将 光标 坐标 值 bx 对 80 求 模 ， 
用 坐标 值 bx 减 去 余数 就 是 行 首 字符 的 位 置 。 第 75 一 77 行 就 是 对 80 求 模 ， 经 过 div 除法 操作 后 ，dx 寄 
存 器 中 为 余数 。 在 第 78 行 用 坐标 值 减 余 数 ， 经 过 “sub bx, dx ”后 ，bx 便 为 当前 行 首 坐 标 ， 实 现 了 回 车 符 的 
功能 (不 过 目前 还 没有 更 新 光标 坐标 寄存 器 ， 更 新 之 后 才 算 真正 完成 )。 

接 下 来 是 处 理 换行 符 line_feed， 也 就 是 将 光标 切换 到 下 一 行 。 方 法 是 将 当前 光标 坐标 值 加 上 每 行 的 字 
符 数 80， 这 样 便 是 下 一 行 的 坐标 啦 。 这 是 在 第 82 行 完 成 的 ， 至 此 我 们 完成 了 回 车 、 换 行 两 个 字符 的 处 理 
我 们 滚屏 操作 中 的 第 3 步 也 完成 了 。 
第 83 行 是 回 车 换行 符 处 理 流程 中 自己 的 深 屏 判断 ， 它 和 前 面 所 说 的 深 屏 流程 无 关 ， 不 要 误 以 为 是 接 
上 面 的 滚屏 说 的 。 倘 若 没 有 之 前 的 滚屏 ,在 单独 的 回 车 换行 处 理 流 程 中 也 要 判断 在 将 光标 更 新 为 下 一 行 后 
是 否 超出 了 屏幕 范围 而 需要 滚屏 。 这 就 是 我 们 前 面 所 说 的 第 2 种 需要 滚屏 的 情况 , 即 在 最 后 一 行 中 的 任意 
一 个 位 置 有 回 车 或 换行 符 都 将 导致 滚屏 。 

显然 ,我 们 这 里 需要 换行 的 原因 是 由 于 屏幕 已 经 满 了 ， 当 前 光标 坐标 〈 不 是 下 一 个 可 打印 位 置 的 光标 
坐标 ) 已 经 是 在 最 后 一 行 的 最 后 一 列 ， 需 要 滚屏 了 。 我 前 面 说 过 啦 ， 这 种 情况 下 滚屏 “相当 于 ”在 屏幕 右 
下 角 后 面 敲 入 一 个 回 车 键 , 尽管 没有 回 车 符 或 换行 符 , 但 它 能 使 屏幕 新 起 一 行 , 这 恰恰 是 滚屏 需要 的 。 所 以 ， 
这 就 是 借用 回 车 换行 符 处 理 流程 的 原因 ， 它 能 为 滚屏 增加 个 新 的 空 行 。 

从 处 理 这 几 个 控制 字符 大 家 就 能 够 看 出 ,字符 集 其 实 就 是 一 套 字 符 行为 表现 的 约定 , 基本 上 可 见 字 符 
表现 在 图 形 ， 不 可 见 字符 表现 在 动作 。 但 这 也 只 是 约定 ， 您 懂 的 ， 将 字符 编码 解释 成 什么 样 ， 完 全 取决 于 
子 符 处 理 软 件 的 意愿 。 
继续 看 代码 6-2-3， 这 是 print.S 的 最 后 一 部 分 ， 我 们 滚屏 操作 中 的 前 2 步 和 往 光 标 寄 存 器 中 更 新 坐标 
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值 都 在 这 里 。 
代码 6-2-3  ( project/c6/a/lib/kernel/print.S ) 
86 
87 ;屏幕 行 范围 是 0 ~ 24， 滚 屏 的 原理 是 将 屏幕 的 第 1 ~ 24 行 搬运 到 第 0 ~ 23 行 
;再 将 第 24 行 用 空格 填充 

88 .roll screen: ; 若 超出 屏幕 大 小 ， 开 始 滚屏 

89 cld 

90 mov ecx, 960 ; 2000-80=1920 个 字符 要 搬运 ， 共 1920*2=3840 字 节 

;一 次 搬 4 字 节 ， 共 3840/4=960 次 

91 mov esi, Oxc00b80a0 ; 第 1L 行 行 记 

92 mov eqi，0xc00b8000 ; 第 0 行 行 六 

93 rep movsd 

94 

95 ;;;;;; ;将 最 后 一 行 填充 为 空 E 

96 mov ebx, 3840 ; 最 后 一 行 首 字符 的 第 一 个 字 节 偏 移 = 1920 * 2 

97 mov ecx, 80 ; 一行 是 80 字符 ( 160 字 节 )， 每 次 清空 1 字符 

; (2 字 节 )， 一 行 需要 移动 80 次 
098 ELS 
99 mov word [gs:ebx], 0x0720;0x0720 是 黑 底 白 字 的 空格 键 
100 add ebx, 2 
101 loo0p “cls _ 
102 mov bx,1920 ;将 光标 值 重 置 为 1920， 最 后 一 行 的 首 字 符 
103 
104 .set cursor: 
105 ;将 光标 设 为 px 值 
106  ;;;;;;; 1 先 设置 高 8 位 ;;;;;;;; 
107 mov dx, 0x03d4 ;索引 寄存 器 
108 mov al, 0x0e ; 提供 光标 位 置 的 高 8 位 
109 out dx, al 
110 mov dx, 0x03d5 ;通过 读 写 数 据 端 口 0x3d5 来 获得 或 设置 光标 位 
二 法 二 mov al, bh 
112 oUt 
113 
114 ;;;;;;; 2 再 设置 低 8 位 ;73727777 
下 省 注 mov dx, 0x03d4 
116 mov al, OxOf 
EA Out Ry 
8 mov dx, 0x03d5 
119 mov al, bl 
120 ob re > 光 江 
之 生 .Put_char done: 
122 popad 
123 ret 

本 代码 开头 就 是 滚屏 的 部 分 .roll_screen， 第 89 行 先 用 cld 指令 清除 方向 位 ， 就 是 把 eflags 寄存 器 中 方 
向 标志 位 DF (Direction Flag) 清 0。 前 面 说 过 了 ，cld， 字 符 串 “搬运 ”指令 movs[bwd] 和 rep 三 剑客 组 合 
完成 大 数据 的 复制 。 

第 90 行 是 将 ecx 赋值 为 960， 它 用 来 控制 rep 重复 执行 指令 的 次 数 ， 这 里 是 要 把 第 1 一 24 行 的 字符 整 
体 往 上 提 一 行 ， 复制 到 第 0 一 23 行 。 要 复制 的 字符 数 是 2000-80=1920 个 ， 每 个 字符 是 2 字 节 ， 共 3840 字 
节 。 我 们 是 用 movsd 指令 来 复制 的 ， 它 一 次 复制 4 字 节 数据 ， 所 以 需要 执行 3840/4=960 次 。 

第 91 行 是 把 要 复制 的 起 始 地 址 赋 给 esi 寄存 器 , 也 就 是 屏幕 第 1 行 的 起 始 地 址 , 物理 地 址 是 0xb80a0。 
将 来 实现 用 户 进程 后 ， 为 方便 用 户 进 程 的 管理 ， 此 处 会 用 其 虚拟 地 址 0xc00b80a0 代 蔡 。 

第 92 行 是 把 目的 地 址 赋 给 edi 寄存 器 , 也 就 是 屏幕 的 第 0 行 的 起 始 地 址 , 物理 地 址 是 0xb8000, 同上 ， 
将 来 也 会 用 其 虚拟 地 址 0xc00b8000 代 蔡 。 

第 93 行 用 rep 指令 配合 movsd 指令 ， 开 始 循环 复制 ， 直 至 把 第 24 行 的 数据 复制 完毕 。 

滚屏 操作 还 差 一 步 ， 需 要 将 最 后 一 行 用 空格 填充 ， 这 是 在 第 95 一 101 行 中 完成 的 。 

第 96 一 97 行 是 在 准备 复制 的 起 始 地 址 和 循环 次 数 。 最 后 一 行 在 显存 中 的 偏 移 地址 是 3840， 循 环 次 数 
是 每 行 的 字 节 总 数 除 以 每 次 处 理 的 字 节 数 ， 具 体循环 次 数 要 先 看 下 面 的 实现 部 分 。 

第 98 行 的 cls 是 准备 清空 最 后 一 行 ， 第 99~101 行 是 循环 处 理 屏幕 最 后 一 行 中 的 每 1 个 字符 (2 字 节 )， 
次 写 入 2 字 节 数据 将 字符 置 为 黑屏 白字 的 空格 符 。0x0720 是 一 个 空格 的 数据 ， 低 字 节 是 空格 的 ASCII 码 0x20， 
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辣子 




















节 是 前 景色 和 背景 色 属 性 0x07。 这 里 通过 “mov dword [gs: ebx]， 0x0720” 处 理 1 个 空格 ， 在 第 101 行 用 
op 指令 来 实现 循环 执行 ， 它 也 是 用 ecx 作为 循环 计数 器 ， 每 执行 一 次 ，ecx 自动 减 1， 直 到 为 0 时 停止 执行 。 
























































现在 大 伙 儿 知道 为 什么 在 第 97 行为 ecx 赋值 为 80 了， 每 行 80 个 字符 共 160 字 节 ， 一 次 清空 1 个 字 





第 102 行 的 movbx，1920 是 把 bx 设置 为 最 后 一 行 起 始 ，bx 作为 光标 坐标 值 ， 进 入 .set_cursor 完成 光 







































































了 lo 
符 ， 即 2 字 节 ， 故 循环 次 数 是 160/2=80 次 。 
标 坐 标的 更 新 。 

滚屏 说 完了 ， 下 面 说 一 下 光标 设置 。 
值 。 


位 和 低 8 位 。 这 部 分 代码 我 相信 大 家 已 经 能 看 明 


的 寄存 器 中 ， 环 境 恢复 ， 第 123 行 ret 指令 返回 。 
其 实 我 此 时 长 呼 一 口气 ， 终 于 说 完了 put_char， 不 过 ， 转 念 一 想 ， 似 乎 还 有 点 小 尾巴 …… 我 要 说 道 说 

















第 104 一 120 行 是 .set_cursor， 这 是 用 来 设置 光标 的 代码 ， 它 把 光标 坐标 寄存 器 设置 为 寄存 器 bx 中 的 












































原理 也 是 先 通 过 0x3d4 端口 写 入 待 操作 寄存 器 的 索引 ， 这 和 之 前 获取 坐标 值 的 代码 是 一 样 的 。 只 不 过 
操作 0x3d5 端口 不 再 是 读 取 指 令 in， 而 是 写 入 指令 out， 我 们 要 把 bx 中 的 值 更 新 到 光标 坐标 寄存 器 的 高 8 





























了 ， 不 再 细 说 。 
























































第 121 一 123 行 完成 了 put_char 的 处 理 流程 ， 












































用 popd 指令 将 之 前 入 栈 的 8 个 32 位 寄存 器 恢复 到 各 个 





道 之 前 在 代码 6-2-1 中 埋 下 的 伏笔 了 ， 大 伙 儿 再 坚持 一 会 儿 。 











下 面 这 些 内 容 是 为 了 解释 此 处 为 GS 赋值 的 原因 ， 是 为 了 避免 将 来 挫 上 大 事 儿 ， 这 与 特权 级 相关 。 先 
































简要 和 大 伙 儿 解释 下 , 咱们 还 没有 到 真正 使 用 特权 
引出 特权 级 只 是 为 了 解释 第 14 一 15 行为 什么 给 gs 赋值 , 它 只 是 为 了 防止 将 来 因为 GS 为 0 导致 CPU 抛 异 
常 才 提前 加 的 ， 这 和 put_char 本 身 的 功能 是 无 关 的 。 


关 的 操作 ， 不 过 ， 这 只 是 咱们 的 愿景 ， 可 不 能 保证 用 户 进程 会 乖乖 听话 ， 得 有 一 套 机 制 来 防止 用 户 进程 直 
接 访 问 内 核资 源 的 这 种 越权 行为 。 
CPU 负责 的 ， 不 过 不 要 觉得 CPU 有 多 智能 ， 它 只 会 老 老实 实 不 知 疲倦 地 执行 
， 根 本 不 知道 目前 运行 的 指令 是 属于 内 核 的 ， 还 是 属于 用 户 进程 的 ， 所 以 CPU 分 不 出 来 谁 是 谁 ， 更 谈 不 上 


十 已 人 
指令 











I 已 



























































好 啦 ， 进 入 正题 。 





























级 的 地 方 , 以 后 在 说 用 户 进 程 的 时 候 才 是 它 发 挥 的 时 机 。 



























































和 硬件 相关 的 访问 都 属于 内 核 的 工作 , 打印 输出 也 是 , 用 户 进程 只 能 依靠 内 核 的 帮助 来 完成 和 硬件 相 


















































检测 这 些 “ 越 权 ” 的 行为 是 










































































































































































来 找 出 越权 了 。 真 正 起 检测 作用 的 是 人 为 给 CPU 设置 的 规则 ，CPU 按照 这 套 规 则 办 事 就 受 受 的 了 ， 这 里 所 












































越 小 特权 越 大 ， 在 Linux 中 ， 内 核 工作 在 0 级 ， 


























说 的 规则 就 是 特权 级 ， 用 户 进程 反 不 了 天 ， 主 要 就 是 因为 有 特权 级 管 着 呢 。 特 权 级 分 为 0、1、2、3 共 4 个 等 级 ， 



































用 户 进程 工作 在 3 级 ， 特 权 级 1、2 都 空 着 没 用 到 ， 咱 们 这 









































有 也 








VS | 



































是 学 习 Linux 的 做 法 ， 内 核 在 0 级 特权 ， 用 户 进程 在 3 级 特权 。 先 给 大 家 简要 介绍 几 个 术语 ， 以 后 我 们 会 详 
说 明 。CPL， 即 当前 特权 级 ， 也 就 是 程序 运行 时 所 处 的 特权 等 级 。RPL， 即 请 求 特权 级 ， 它 是 选择 子 中 的 RPL 
































字段 。 还 有 就 是 段 描 述 符 中 已 经 说 过 的 DPL， 它 表示 段 描述 符 所 代表 的 内 存 区 域 的 特权 级 。 


在 0 





大 家 





























在 loader 中 ， 我 们 早已 经 将 gs 赋予 成 正确 的 选择 子 ， 程 序 进入 保护 模式 之 后 就 继承 了 0 特权 级 ， 内 核 也 

















特权 级 下 工作 。 到 现在 为 止 这 一 切 都 很 正常 ， 可 是 在 不 和 久 的 将 来 ， 当 我 们 有 了 用 户 进程 之 后 ， 问 题 来 了 。 












































为 了 解释 清楚 , 需要 提前 和 大 家 说 一 下 , 用 户 进程 是 需要 用 iretd 返回 指令 上 CPU 运行 的 , 这 些 以 后 会 说 的 ， 
暂且 接受 这 个 结论 。CPU 在 执行 iretd 指令 时 会 做 特权 检查 ， 它 检查 DS、ES、FS、GS“ 数 据 ” 段 寄存 器 的 






























































内 容 ， 这 里 的 数据 我 加 了 引号 ， 它 只 是 修饰 段 寄 存 器 的 定语 ， 用 来 指 除 代码 段 寄存 器 CS 和 栈 段 寄存 器 SS 之 外 
的 段 寄存 器 。 在 32 位 保护 模式 下 它们 中 存储 的 都 是 选择 子 ， 要 是 有 任何 一 个 段 寄存 器 所 指向 的 段 描述 符 的 DPL 
高 于 从 iretd 命令 返回 后 的 CPL 〈 这 个 返回 后 的 CPL 也 就 是 新 的 CPL，CPL 就 是 加 载 到 CS 寄存 器 中 选择 子 
的 RPL)，CPU 就 会 将 该 段 寄存 器 赋值 为 0。 这 样 做 是 有 意 设 计 的 ， 相 当 于 一 种 间接 的 保护 策略 ， 它 是 如 何 起 到 
作用 的 呢 ? 没有 人 迫害 就 谈 不 上 保护 , 其 实 CPU 这 么 做 的 原因 就 是 怕 高 特权 级 的 资源 能 被 低 特权 级 程序 访问 ， 
能 访问 说 不 定 就 能 破坏 ， 所 以 CPU 是 不 会 让 低 特 权 级 程序 有 访问 高 特权 级 资源 的 机 会 的 。 虽 然 已 经 将 段 寄存 器 


权限 


保护 


置 0 




































































































































































了 ， 但 如 果 不 访问 的 话 ， 一 切 相 安 无 事 ， 一 旦 将 











来 用 该 段 寄 存 器 访问 内 存 时 ， 由 于 选择 子 为 0， 这 表示 选择 











子 ! 
可 用 
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的 索引 位 、IT 位 和 RPL 位 都 为 0， 所 以 会 在 GDT 中 检索 到 第 0 个 段 描述 符 ， 由 于 第 0 个 段 描述 符 是 空 的 不 











(这 是 Intel 有 意 为 之 的 ， 为 避免 忘记 初始 化 选择 



































子 而 误 选 到 了 GDT 中 的 第 0 个 描述 符 )， 这 就 会 导致 CPU 



































抛 出 异常 。 总 之 ， 如 果 CPU 发 现 新 的 CPL 权限 比 数据 段 寄存 器 (DS、ES、FS、GS) 指向 的 段 描述 符 的 DPL 
































权限 小 ，CPU 便 认 为 这 是 一 种 越权 访问 。CPU 中 的 检测 规则 是 人 定 的 ， 人 的 思维 是 : 访问 别人 ， 至 少 权限 得 和 





人 家 一 样 才 行 ， 所 以 
进程 想 直接 访问 内 核 的 











十 算 机 世界 里 的 规则 按照 人 类 思维 来 理解 是 非常 合理 的 。 在 这 里 可 以 理解 为 CPU 发 现 用 户 
资源 ，CPU 是 绝对 不 能 答应 的 ， 





































































































所 以 把 权限 不 符合 条 件 的 寄存 器 填充 为 0, 给 它 点 颜色 看 















































看 。 尺 管 选择 子 





已 经 为 0， 但 如 果 用 户 进程 乖乖 地 竺 在 自己 的 地 盘 不 去 访问 内 核 的 空间 ，CPU 也 不 会 难为 它 ,， 用 






























































户 进程 就 像 个 正常 的 程序 一 样 ， 否 则 进程 不 老实 的 话 ，CPU 这 才 抛 出 异常 呢 。 










































































好 啦 ， 看 看 我 们 实际 的 情况 , 用户 进程 的 特权 级 由 CS 寄存 器 中 选择 子 的 RPL 字段 决定 ， 它 将 成 为 进 
程 在 CPU 上 运行 时 的 CPL。 将 来 为 用 户 进程 初始 化 寄存 器 时 ，CS 中 的 选择 子 RPL 字段 必须 为 3， 进 而 它 
就 是 从 iretd 指令 返回 后 的 新 的 CPL。 而 我 们 用 于 访问 显存 的 GS 寄存 器 ， 在 新 的 CPL 为 3 的 情况 下 ， 无 
论 为 其 赋 为 何 值 ， 其 选择 子 所 指向 的 段 描 述 符 中 的 DPL 值 必须 等 于 3, 否则 CPU 会 将 GS 置 为 0。 我们 目 
前 使 用 的 显存 段 描述 符 是 全 局 描述 符 表 GDT 中 的 第 3 个 段 描述 符 ， 但 它 的 DPL 为 0， 不 为 3。 您 看 ， 问 















































题 来 了 ， 怎 么 办 呢 ? 方法 总 比 问题 多 ， 这 里 给 出 了 两 个 方案 。 
(1) 为 用 户 进程 创建 一 个 显存 段 描 述 符 ， 其 DPL 为 3， 专 门 给 特权 3 级 的 用 户 进程 使 用 。 
(2) 在 打印 函数 中 动 动手 脚 ， 将 GS 的 值 改 为 指向 目前 DPL 为 0 的 显存 段 描述 符 。 




























































































































































































































































































貌似 第 1 个 方案 更 合理 ,而 且 工 作 量 也 不 大 , 但 别 忘 记 了 ， 打 印字 符 这 种 和 硬件 相关 的 功能 属于 内 核 



































的 范畴 ， 用 户 需要 打印 输出 时 ， 它 应 该 请 求 内 核 的 服务 ， 由 内 核 帮助 完成 ， 这 才 是 我 们 的 理想 模式 ， 绝 对 



































不 能 让 用 户 进程 直接 操作 显卡 ， 否 则 要 我 大 内 核 威 严 何在 









































j 户 进程 得 不 到 限制 可 就 无 法 无 天 了 。 所 以 我 









































们 放弃 第 1 种 做 法 , 干脆 在 初始 化 用 户 进程 寄存 器 时 ， 直 接 将 GS 赋值 为 0。 用 户 进 程 将 来 在 打印 输出 时 ， 




















































































































周 用 陷入 内 核 来 完成 的 ， 到 时 用 户 进 程 的 CPL 会 由 3 变 成 0, 执行 的 是 内 核 的 代码 ， 那 时 
再 将 GS 赋值 为 内 核 使 用 的 显存 段 选 择 子 即 可 。 
所 以 , 我 们 必须 得 把 为 GS 赋值 的 代码 放 在 打印 时 必须 要 调用 的 函数 中 , 这 就 是 咱们 的 put_char 函数 ， 


在 咱们 的 代码 中 ， 它 是 各 种 打印 的 核心 。 
































































































































顺便 说 下 ， 陷 入 内 核 后 的 用 户 进程 ， 由 于 其 GS 已 经 被 中 们 置 为 内 核 视 频段 描述 符 的 选择 子 ， 其 指 摧 


的 DPL 依然 为 0， 故 从 内 核 态 返回 后 ，GS 又 会 被 CPU 置 为 0， 不 过 这 是 后 话 了 。 









































原因 说 完了 ， 大 伙 儿 现在 了 解 在 put_char 函数 中 为 GS 赋值 的 原因 了 ， 不 明白 也 没关系 ， 知 道 第 14 一 


15 行 代码 不 是 多 余 的 即 可 ， 以 后 在 实现 用 户 进程 时 自然 就 明白 了 。 










































































终于 说 完 put_char 了 ， 我 已 经 迫不及待 地 想 试 试 了 ， 咱 们 需要 改进 一 下 相关 文件 。 





print.S 中 的 函数 put_char 对 于 其 他 文件 来 说 属于 外 部 函数 ， 要 是 想 在 其 他 文件 中 用 到 的 话 ， 各 文件 得 

































































将 其 声明 加 进来 。 几 是 用 到 此 函数 的 文件 都 要 加 上 其 声明 , 这 样 比较 麻烦 , 所 以 咱们 还 是 将 其 写成 头 文 件 ， 






































谁 需要 它 就 将 其 包含 进来 就 行 了 。 请 见 代码 6-3。 


#endif 


ONODP 


为 防止 头 文件 被 








代码 6-3 (project/c6/a/lib/kernel/print.h ) 


#ifndef LIB KERNEL PRINT H 
#define LIB KERNEL PRINT H 
#include "stdint.h" 

void put char (uint8 t char asci); 




















E 复 包含 ， 避 免 头 文件 中 的 变量 等 出 现 重 复 定义 的 情况 。 可 以 用 条 件 编译 指令 ##fndef 






































和 #endif 来 封闭 文件 的 内 容 ， 把 要 定义 的 内 容 放 在 它们 之 中 。 
前 2 行 是 以 printh 所 在 的 路 径 定 义 了 这 个 宏 LIB KERNEL PRINT _H, 以 该 宏 来 判断 是 否 重 复 包 含 。 


AAA 






































第 3 行 是 通过 include 指令 包含 了 “stdint.h”。 这 里 是 用 双 引 号 括 住 了 stdinth， 目 的 是 包含 自己 指 完 的 






























































文件 ， 如 果 是 用 尖 括 号 <> 括 住 的 ， 这 是 让 编译 器 到 系统 头 文件 所 在 的 目录 中 找 所 包含 的 文件 ， 这 个 目录 通 





常 是 /usrinclude。 
第 4 行 就 是 一 句 简单 的 声明 ， 给 出 put_char 函数 的 原型 ， 您 看 ， 虽 然 put_char 是 用 汇编 语言 写 的 ， 但 



























































它 被 C 语言 引用 时 ,在 C 语言 中 的 形式 还 是 得 符合 C 语言 语法 ,加 之 咱们 之 前 已 经 讲 过 了 cdecl 调用 约定 ， 


273 





所 以 put_char 的 C 语言 形式 是 void put_char (uint8_t char_asci)， 这 样 put_char 才能 从 栈 中 获取 参数 
char_asci。 这 里 的 char_asci 是 无 符号 8 位 整 型 变量 (其 实 就 是 unsigned char)， 这 与 代码 6-2-1 第 36 行 获 
取 参 数 到 寄存 器 ecx 后 ， 只 用 寄存 器 cl 是 相 吻 合 的 。 
第 5 行 #endif 是 与 条 件 编译 ##fndef 相配 合 的 结束 指令 ， 固 定 用 法 。 
好 啦 ， 下 面 咱们 改进 main.c， 在 其 中 用 put_char 函数 打印 字符 。 

代码 6-4 (project/c6/a/kernel/main.o ) 















































































































































1 #include "Pint .hn 
2 void main(void) { 

3 Put_char('k7) 
4 put_char('e') 
5 put _ char('r') 
6 put_ char('n') 
7 ) 
8 


了 
了 
了 
了 


put char('e'); 
put_ char('1'); 











9 put char('\n'); 
410 pat Char( Tlie)s 
十 出 Put Ghar( 2 ); 
12 put_char ('\b'); 
13 put Char( "3 TY 
14 while(1); 

oe 

由 于 咱们 还 没有 实现 打印 字符 串 的 函数 ， 所 以 用 了 多 个 put_char 函数 来 拼凑 字符 串 。 















































代码 前 8 行 应 该 是 打印 字符 串 kernel， 第 9 行 换行 ， 第 10 一 11 行 打印 的 是 字符 12， 但 字符 2 马上 被 
第 12 行 的 退 格 键 backspace 删除 。 第 13 行 ， 在 字符 1 的 后 面 将 输出 字符 3。 
好 啦 ， 还 是 得 经 过 编译 、 链 接 、 写 入 虚拟 硬盘 三 步 。 
编译 print.S 
nasm -f elf -o lib/kernel/print.o lib/kernel/print.S 回 车 


编译 main.c 































































































gcc -I lib/kernel/ -c -o kernel/main.o kernel/main.c 回 车 
链接 main.o 和 print.o 

ld -Ttext Oxc0001500 -e main -o kernel.bin \ 

> kernel/main.o lib/kernel/print.o 回 车 
注意 ， 上 面 ld 命令 第 一 行 最 后 的 斜 杠 \ 不 属于 命令 本 身 ， 用 于 一 行 写 不 下 全 部 命令 参数 的 情况 。 
写 入 虚拟 硬盘 


dd if=kernel.bin of=/home/work/my workspace/bochs/hd60M.img \ 
bs=512 count=200 seek=9 conv=notrunc 

























































































好 了 ， 终 于 到 了 这 一 刻 ， 这 是 我 们 第 1 个 像 模 像 样 的 打印 函数 ， 和 希望 前 面 漫长 的 努力 没有 和 白费， 我 现 
在 多 少 还 有 点 紧张 呢 。 兄 弟 们 ， 上 机 运行 看 效果 ， 如 图 6-9 所 示 。 

看 ， 输 出 与 我 们 预期 的 是 一 样 的 ， 在 字符 串 kernel 结尾 的 换行 符 起 了 作用 ， 在 下 一 行 ， 原 本 是 输出 
“123”， 但 2 和 '3' 之 间 的 退 格 键 将 字符 2 删除 了 ， 只 留 下 了 “13”。 另 外 ， 由 于 当前 光标 坐标 寄存 器 中 有 残 
余数 值 ， 我 们 并 没有 将 其 清 0， 所 以 并 未 在 屏幕 左上 和 角 开 始 输出 。 
在 上 机 运行 之 后 ， 我 这 里 提醒 下 大 家 链接 文件 时 的 顺序 问题 。 在 上 面 的 链接 阶段 ， 目 标 文件 链接 顺序 
是 main.o 在 前 ，print.o 在 后 。 大 家 知道 ，main.c 文件 中 用 到 了 print.o 中 的 put_char 函数 ， 在 链接 顺序 上 ， 
属于 “调用 在 前 ， 实 现在 后 ”的 顺序 。 如 果 将 print.o 放 在 前 面 ，main.o 放 在 后 面 ， 也 就 是 实现 在 前 ， 调 用 
在 后 ， 此 时 生成 的 可 执行 文件 起 始 虚拟 地 址 并 不 准确 ， 会 有 向 后 顺延 的 现象 ， 并 且 segment 的 数量 也 不 一 


在 
样 。 原 因 是 链接 器 对 符号 表 的 处 理 细节 造成 的 ， 链 接 器 主要 工作 就 是 整合 目标 文件 中 的 符号 ， 为 其 分 配 地 
该 




















































































































































































































































































































































































































址 ， 让 使 用 该 符号 的 文件 可 以 正确 定位 到 它 。 由 于 我 能 力 有 限 ， 只 能 大 概 说 一 下 我 的 理解 ， 链 接 器 最 先 处 
理 的 目标 文件 是 参数 中 从 左边 数 第 一 个 (咱们 这 里 是 main.o), 对 于 里 面 找 不 到 的 符号 (这 里 是 put_char)， 
链接 器 会 将 它 记 录 下 来 ， 以 备 在 后 面 的 目标 文件 
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查找 。 如 果 将 其 


顺序 颠倒 ， 势 必 导 致 在 后 面 的 目标 文件 
































中 才 出 现 找 不 到 符号 的 情况 ， 而 该 符号 的 实现 所 在 的 目标 文件 早已 经 过 去 了 ,这 可 能 使 链接 器 内 部 采用 另 
外 的 处 理 流程 ， 导 致 出 来 的 可 执行 程序 不 太一 样 。 
































































































































CTRL + 3rd button enables mouse |NH leaPs cL ol | 1 1 1 | 





A 图 6-9 put_char 效果 
































所 以 ， 建 议 大 家 最 好 保持 调用 在 前 ， 实 现在 后 的 顺序 来 链接 。 
6.3.3 ”实现 字符 串 打印 


上 一 节 的 内 容 实在 是 太 长 了 ， 不 过 本 节 内 容 就 非常 少 了 ， 在 本 节 将 实现 一 个 字符 串 打 印 函 数 ， 它 实际 
上 就 是 对 上 一 节 单 个 字符 打印 函数 的 封装 。 

我 们 在 C 语言 中 定义 的 字符 串 ，C 编译 器 会 把 字符 串 的 结尾 自动 加 上 \0',， 用 它 作为 字符 串 的 结束 标 
记 ， 有 了 这 个 标记 咱们 才能 确定 字符 串 的 长 度 。 顺 便 说 一 多，AO 的 ASCI 码 为 0， 所 以 很 多 字符 串 函 数 内 
部 都 通过 把 各 个 字符 与 0 比较 来 判断 字符 串 是 否 结束 。 

请 见 代码 6-5。 



































































































































代码 6-5  ( project/c6/b/lib/kernel/print.S ) 
5 [bits 32] 
section .text 














10 ;输入 : 栈 中 参数 为 打印 的 字符 串 
11 ;输出 :无 








13 global But str 
14 put str: 

















































































































15 ;由 于 本 函数 中 只 用 到 了 ebx 和 ecx， 只 备份 这 两 个 寄存 器 

16 push ebx 

人 push ecx 

18 XOr ecx, ecx ; 准备 用 ecx 存储 参数 ， 清 空 
19 mov ebx, [esp + 12] ; 从 栈 中 得 到 待 打 印 的 字符 串 地 址 
20 .goon: 

用 mov cl, [ebx] 

2 cmp cl, 0 ; 如 果 处 理 到 了 字符 串 尾 ， 跳 到 结束 处 返 世 
23 jz .str over 

24 push ecx ; 为 put_char 函数 传递 参数 

25 cecall PUut ehar 

26 add esp, 4 ; 回收 参数 所 占 的 栈 空间 

27 inc ebx ; 使 sbx 指向 下 一 个 字符 

28 jmp .goon 

29 ,Str Overs 

30 Pop eCx 

二 pop ebx 

32 ret 
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取 
符 
传 


定 
直 
数 





存 器 占 8 字 节 ， 再 加 上 栈 中 put_str 函数 的 返回 地 址 
首 地 址 存储 到 ebx， 习 惯 





一 


子 - 


惯 


main.c 中 调用 它 还 得 修改 相关 文件 , 一 个 是 在 print.h 
代码 6-6 


所 


切记 ， 在 完成 之 前 ，while 这 个 死 循 环 千 万 不 要 于 
直接 看 运行 结果 ， 如 图 6-10 
大 家 看 到 了 屏幕 上 的 输出 字符 串 “I am kernel”， 并 日 
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2 





13 行 导 出 put_str 函数 供 其 他 乡 


















































第 18 一 19 行 中 ， 由 于 下 面 要 




















门 见 山 啦 , put_str 函数 是 我 们 的 字符 串 折 
完成 字符 串 中 全 部 字符 的 打印 ， 所 以 代码 并 不 
部 文件 调用 。 

第 14 行 是 put_str 正式 开始 ， 由 于 在 实现 中 只 用 至 
直接 将 这 两 个 寄存 器 入 栈 备份 ， 并 没有 像 put_char 中 那样 偷懒 ， 
寄存 器 ecx 来 传递 字符 ， 所 以 在 此 先 将 其 用 














印 函 数 , 它 的 原理 是 四 
长 ， 咀 们 说 清楚 它 是 分 分 钟 的 事 。 












































待 打 印 的 字符 串 了 ， 大 家 要 注意 , C 编译 器 会 为 
会 在 结尾 后 自动 补 个 结束 字符 \0'， 它 的 ASCII 码 是 0。 乡 
递 的 是 字符 串 所 在 的 内 存 起 始 地 址 , 也 就 是 说 压 入 到 栈 中 的 是 存储 该 字符 串 的 内 存 
是 有 道理 的 ， 如 果 是 将 字符 串 中 各 个 字符 的 ASCII 码 都 压 入 栈 中 ， 














的 ASCII 码 ， 并 




















AAA 
































4 put_char 


| 了 ebx 和 ecx 两 个 寄存 器 ， 所 以 这 里 在 第 16 一 17 行 
























































玉 们 日 











] pushad 一 次 保存 所 有 32 位 通 
异 或 指令 xor 清 0。 接 下 来 要 获 
常量 分 配 一 块 内 存 ， 在 这 块 内 存 中 存储 字符 串 中 各 字 
用 译 器 将 该 字符 串 作 为 参数 时 ， 

















寄存 器 。 











首 地 址 。 


























其 实 想 想 看 这 也 
































于 字符 串 长 度 不 定 ， 





器 














， 有 可 




















[能 会 造成 栈 溢出 呢 ， 而 且 也 不 知道 到 底 有 多 少 个 字符 ， 如 何 世 
接 把 字符 串 中 各 字符 当 作 参数 是 绝对 不 靠 谱 
是 字符 串 内 存 地 址 ， 我 们 需要 对 该 地 址 进行 














收 参 数 所 














车 中 














阿 。 好 啦 ， 匠 
内 存 寻 址 才能 找到 字符 的 ASCII 码 。 前 
占 4 字 节 ， 故 参数 在 栈 ! 





到 正题 ， 















































Wk 


第 19 行将 字符 





























怀 
第 20 一 28 行 分 别 寻 址 每 一 个 字符 ， 























分 别 调 





在 第 21 行 中 ， 通 过 ebx 寻 址 访问 内 存 获取 
在 第 22 行 ， 将 寄存 器 cl 与 0 比较 来 判断 字符 是 

















在 第 23 行 跳 转 到 .str_over 结束 返回 。 否 则 进 









































1 字 节 数据 ， 存 储 到 寄存 器 cl 中 ， 此 时 
是 否 处 理 结束 ， 如 果 比 较 的 结果 为 0， 
入 第 24 行 ， 将 ecx 作为 参数 传递 给 put_char。 尽 管 cl 中 才 是 








] ebx 作为 基 址 寻 址 了 。 
用 put_char 逐个 打印 。 





























符 
使 用 32 位 操作 数 ， 所 以 这 里 干脆 把 ecx 整个 压 栈 了 。 

















名 26 行 匠 





收 参 数 所 占 的 4 字 节 空间 。 























有 27 行 











#ifndef LIB KERNEL PRINT H 
#define _LIB KERNEL PRINT H 
#include "stdint.h" 


void put str(char* message); 
#endif 


~OU 必 WPD 哺 


没什么 好 说 的 ， 就 是 在 第 5 行 加 了 个 put_str 的 声明 ， 前 面 说 过 了 参数 是 地 址 ， 

















以 这 里 的 类 型 是 字符 型 指针 char*。 








代码 6-7 


1 #include "print.n" 

2 void main(void) { 

3 put_ str("I am kernel\n"); 
4 while(1); 

5} 


代码 6-7 的 main 函数 中 ， 把 之 前 连续 多 个 put_char 调 


使 ebx 加 1， 让 其 指向 字符 串 ， 
好 啦 ， 如 我 刚才 所 说 ， 函 数 确 实 不 长 ， 分 分 钟 就 说 完了 ， 似 乎 该 是 检测 成 果 的 时 候 了 ， 别 筷 了 ， 为 了 能 在 
的 增加 put_str 的 函数 声明 ， 另 一 个 是 在 main.c 中 调用 
( project/c6/b/lib/kernel/print.h ) 























VoOtd Put :char(dinte.t char aseLlys 


的 下 一 个 字符 。 


偏 移 栈 项 12 字 节 





] 的 栈 空间 也 不 


占 的 栈 空间 也 是 问题 ， 总 之 ， 
们 的 put_str 中 ， 从 栈 中 获取 到 的 参 
外 在 栈 中 备份 了 两 个 寄 


的 位 置 。 


| cl 便 是 字符 的 ASCII 码 。 





里 完毕 ， 











说 明 处 











的 ASCII 码 ， 但 32 位 保护 模式 下 的 栈 ， 要 么 压 入 16 位 操作 数 ， 要 么 压 入 32 位 操作 数 ， 而 我 比较 习 


























i 


已 。 























于 是 


子 符 串 的 地 址 ， 











( project/c6/b/kernel/main.c ) 























j 去 掉 了 ， 直 接 改 成 用 



































编译 链接 同 之 前 一 样 ， 


























成 





儿 下 就 完成 了 一 个 函数 ， 看 来 前 本 
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否则 CPU 就 “ 跑 的 没 影 了 ”。 





所 示 。 





put_str 实现 打印 。 大 伙 





























， 换 行 符 \n' 使 光标 到 了 下 一 行 。 




















结果 符合 预期 ， 


在 put_char 函数 上 花费 的 时 间 是 值得 的 。 下 一 个 要 实现 的 函数 





et5UsPEND POWer 





























I am kernel 





CTRL + 3rd button enables nouse | | | | | | | | | | | 


4A 图 6-10 ”put_str 运行 效果 














6.3.4 ”实现 整数 打印 


前 两 节 是 完成 了 有 关 字 符 的 打印 ， 这 一 节 中 ,我 们 要 实现 数字 打印 ， 当 然 仅 仅 是 整数 ， 咱 们 的 实现 中 
不 支持 浮 点 ] 于 打印 整数 的 函数 名 是 put int， 它 的 原理 是 将 数字 转换 成 对 应 的 字符 ， 2 
字符 “9’。 这 么 一 说 ， 大 家 的 潜意识 里 觉得 依然 是 封装 put_char， 是 的 没 错 , 不 过 要 麻烦 一 些 ， 多 说 无 益 
ws 了 ， 请 见 代码 6-8。 


代码 6-8 (project/c6/c/lib/kernel/print.S ) 

















































































































| 一 略 
5 section .data 
6 put int buffer dq 0 ; 定义 8 字 节 缓冲 区 用 于 数字 到 字符 的 转换 
.… 略 
155 ;--- 一 -一 -一 一 将 小 端 字 节 序 的 数字 变 成 对 应 的 ASCII 后 ， 倒 置 ---------- 





156 ;输入 : 栈 中 参数 为 待 打 印 的 数字 
157 ;输出 : 在 幕 上 打印 十 六 进 制 数字 ， 并 不 会 打印 前 缀 0x 
;如 打印 十 进 制 15 时 ， 只 会 直接 打印 E， 不 会 是 0xf 











































































































站 汪 生 这 二 二 这 汪汪 二 
159 global put int 

160 put_ int: 

1 pushad 

162 mov ebp, esp 

163 mov eax, [ebp+4*9] ; call 的 返 世 地 址 占 4 字 节 +pushad 的 8 个 4 字 节 
164 mov edx, eax 

165 mov edi, 7 ; 指定 在 put_int_buffer 中 初始 的 偏 移 量 

166 mov ecx, 8 ; 32 位 数字 中 ， 十 六 进 制 数字 的 位 数 是 8 个 

167 mov ebx, put int buffer 

168 

169 ;将 32 位 数字 按照 十 六 制 的 形式 从 低位 到 高 位 逐个 处 理 














































































































;共处 理 8 个 十 六 进 制 数字 
170 .1l6based 4bits: ; 每 4 位 二 进 制 是 十 六 进 制 数 字 的 1 位 
/遍历 个 立 十 六 进 和 | 数字 
171 and edx, 0x0000000F ;解析 十 六 进 制 数 字 的 每 一 位 
; and 与 操作 后 ，edx 只 有 低 4 位 有 效 
1 了 7 和 cmp edx, 9 ; 数字 0~9 和 a~f 需要 分 别处 理 成 对 应 的 字符 
于 了 3 jg .is A2F 
174 add edx, '0! ; ASCII 码 是 8 位 大 小 。add 求 和 操作 后 ，edx 低 8 位 有 效 
175 jmp .store 
176 .is A2F: 
177 sub edx, 10 ; A~F 减 去 10 所 得 到 的 差 ， 再 加 上 字符 A 的 























; ASCII 码 ， 便 是 A~F 对 应 的 ASCII 码 
478 add edx, 'A' 


277 

















180 ;将 每 一 位 数字 转换 成 对 应 的 字符 后 ， 按 照 类 似 “ 大 端 ” 的 顺序 
;存储 到 缓冲 区 put_int _pbuffer 

181 ;高 位 字符 放 在 低地 址 ， 低 位 字符 要 放 在 高 地 址 ， 这 样 和 大 端 字 节 序 
; 类 似 , 只 不 过 咱们 这 里 是 字符 序 


















































好 
182 .store: 
183 ; 此 时 dl 中 应 该 是 数字 对 应 的 字符 的 ASCII 码 
184 mov [ebxtedi], dl 
485 dec edi 
186 shr eax, 4 
L187 mov edx, eax 
188 loop .1l6based 4bits 
189 

















190 ;现在 put int buffer 中 已 全 是 字符 ,打印 之 前 


191 ;把 高 位 连续 的 字符 去 掉 ， 比 如 把 字符 000123 变 成 123 
192 .ready to print: 






































193 inc edi ; 此 时 edi 退 减 为 -1 (0xffffffff)， 加 1 使 其 为 0 
194 .skip prefix 0: 
195 cmp edi,8 若 已 经 比较 第 9 个 字符 了 

















; 表示 待 打印 的 字符 串 为 全 0 
196 je .ful10 


197  ; 找 出 连续 的 0 字符 ，edi 作为 非 0 的 最 高 位 字符 的 偏 移 
198 .go on skip: 







































































199 mov cl, [put int buffertedil] 

200 inc edi 

201 em Cl 0" 

202 je .skip prefix 0 ; 继续 判断 位 字符 是 否 为 字符 0 ( 不 是 数字 0 ) 

203 dec edi ;edi 在 上 面 的 inc 操作 中 指向 了 下 一 个 字符 
; 若 当 前 字符 不 为 '0'，, 要 使 edi 减 1 恢复 指向 当前 字符 

204 jmp .put each num 

205 

2.06° fTULL0:: 

207 mov cl,'0' ; 输入 的 数字 为 全 0 时 ， 则 只 打印 0 

208 .put each num: 

209 push ecx ; 此 时 cl 中 为 可 打印 的 字符 

210 allput. char 

和 BL add esp, 4 

212 inc edi ; 使 eqi 指向 下 一 个 字符 

213 mov cl, [put int buffertedil] ; 获取 下 一 个 字符 到 cl 寄存 器 

214 cmp edi,8 

2215 jl .put each num 

216 popad 

217 ret 








一 眼 望 去 代码 6-8 感觉 还 好 ， 工 作 量 也 不 算 大 ，put int 函数 体 只 有 60 行 左右 。 该 函数 的 功能 是 将 32 
位 整 型 数字 转换 成 字符 后 输出 。 函 数 转换 实现 的 原理 是 按 十 六 进 制 来 处 理 32 位 数字 ， 每 4 位 二 进 制 表示 
1 位 十 六 进 制 ， 将 各 十 六 进 制 数字 转换 成 对 应 的 字符 ， 一 共 8 个 十 六 进 制 数字 要 处 理 。 
在 程序 的 第 5~6 行 ， 用 section 定义 了 一 个 数据 区 ， 里 面 用 伪 指 令 dq 申请 了 8 字 节 的 内 存 
put_ int_buffer， 它 作为 转换 过 程 中 用 的 缓冲 区 ， 实 际 上 它 的 用 途 就 是 用 于 存储 转换 后 的 字符 。 
和 大 家 交待 下 缓冲 区 为 什么 是 8 字 节 大 小 。 咱 们 只 支持 32 位 数字 的 输出 ， 按 每 4 位 二 进 制 数 为 1 位 
十 六 进 制 数 计算 ， 共 8 个 十 六 进 制 数 字 要 处 理 ， 每 个 数字 虽然 只 是 4 位 ， 但 它们 转换 成 对 应 的 字符 后 ， 这 
些 数 字 就 得 变 成 对 应 的 ASCII 码 ，ASCII 码 是 1 字 节 大 小 ， 所 以 每 个 字符 需要 1 字 节 的 空间 ， 这 就 是 需要 
8 字 节 缓冲 区 的 原因 。 说 一 下 伪 指 令 dq 〈 它 是 由 编译 器 提供 的 ， 并 不 是 CPU 支持 的 指令 ， 所 以 称 之 伪 指 
令 )， 它 用 来 定义 操作 数 占 用 的 字 节 数 ，q 是 quad 的 简写 ， 意 为 4， 定 义 4 个 字 ， 也 就 是 8 个 字 节 。 

put_int 在 第 160 行 开 始 ， 第 161 一 164 行 先是 备份 寄存 器 环境 ， 这 里 还 是 用 pushad 指令 备份 全 部 32 位 通 
用 寄存 器 。 这 里 多 说 两 句 ， 与 之 前 不 同 的 是 这 里 借鉴 C 调用 约定 ， 先 把 栈 顶 esp 赋值 给 ebp， 再 通过 ebp 来 获 
取 参 数 。 这 一 方面 是 代码 风格 问题 ， 另 一 方面 这 是 32 位 保护 模式 下 的 改进 ， 即 内 存 寻 址 中 支持 用 esp 作为 基 
址 。 之 前 咱们 通过 esp 直接 从 栈 中 获取 , 通过 那样 的 例子 您 知道 函数 中 “push ebp” “mov ebp，esp””“mov xX， 
[ebp+m] ”用 这 三 步 获取 参数 并 不 是 必须 的 。 不 过 话 又 说 回来 ， 直 接 通过 esp 获取 参数 是 不 太 好 的 习惯 ,难免 有 
压 栈 操作 会 改变 esp， 用 ebp 就 不 同 了 ， 不 显 式 改变 它 永 远 不 会 变 。 所 以 ， 尽 管 32 位 支持 寄 esp 寻 址 ， 但 还 是 
建议 通过 ebp 来 获取 参数 ， 以 后 咱们 也 会 这 样 做 ， 当 然 这 是 细节 问题 ， 无 需 过 多 讨论 。 








































































































































































































































































































































































































































































































278 











































































































































































































在 将 参数 获取 到 寄存 器 eax 后 ， 叉 将 其 送 到 edx 中 ， 这 两 个 寄存 器 在 后 面 要 配合 在 一 起 使 用 。eax 寄 
存 器 是 作为 参数 的 备份 ， 而 edx 寄存 器 是 每 次 参与 数位 转换 的 寄存 器 ， 主 要 是 由 它 做 转换 源 ， 每 当 转 换 完 
1 个 十 六 进 制 数 后 ， 再 由 eax 为 其 更 新 下 一 个 待 转换 的 数字 。 

第 165 行为 edi 赋值 为 7， 它 表示 在 缓冲 区 中 的 偏 移 量 ， 这 里 偏 移 为 7， 表 示 指 向 缓冲 区 中 最 后 一 个 1 
字 节 ， 目 的 是 在 该 地 址 处 存储 数字 最 低 4 位 二 进 制 (也 就 是 十 六 进 制 中 的 最 低 1 位 〉， 对 应 的 字符 。 

第 166 行为 ecx 赋 进 制 表示 1 个 十 六 进 


二 下 
可 
P= 和 























字符 都 存储 在 





这 里 面 。 














下 面 说 说 
在 ASCII 





码 范 围 是 48 一 

















转换 的 原理 。 
表 中 , 相同 类 别 











的 








将 数字 转 


tr Ar 


字 简 




















是 不 是 我 
个 例子 心里 才 
假设 把 数 




















or Ai 


字 简 





假设 把 数 
目 . 上 AAr 字 


十 子 付 卫 ， 
的 ASCII 码 。 


高 估 自 











踏实 。 
字 3 转换 成 


zr 太 全 





pr 多 


字 忆 转换 成 字符 ， 
符 忆 所 在 类 别 的 起 





虽然 我 前 


| 


用 表达 得 不 清楚 ， 














值 为 8， 它 表示 要 处 理 的 数字 的 个 数 ，32 位 数字 中 ， 每 4 位 二 
六 进 制 数 字 的 个 数 是 8， 咀 们 按照 十 六 i 
第 167 行 把 ebx 作为 缓冲 区 的 基 址 ， 该 + 


第 171 行 ， 通 过 and 与 运算 只 保留 数字 的 最 低 十 六 进 
32 位 数字 的 最 低 4 位 开始 处 理 。 接 下 来 要 将 它 转 换 成 对 应 的 
字符 是 i 
57， 大 写 英语 字母 'A'~Z' 的 ASCII 码 范围 是 65$ 一 90。 
换 成 字符 的 原理 是 用 待 转换 上 
所 在 类 别 的 起 始 字符 ASCII 码 。 我 知道 这 样 描述 很 
己 的 表达 能 力 了 ? 哈哈 , 其 实 就 是 相对 于 字符 ASCII 码 再 力 


字符 ， 其 过 程 是 : 
'3' 所 在 类 别 的 起 始 字符 是 0,， 其 ASCII 码 为 48， 再 





其 过 程 是 : 用 王 减 去 它 的 起 始 数字 A (10) 
Ar Ar 


日 子 人 




















AS 进 制 来 处 理 ， 所 以 共 8 个 。 
也 二 






































上 就 是 前 面 








第 169 一 188 行 便 是 put_int 的 核心 ， 将 32 位 数字 按照 十 六 进 制 的 形式 从 低位 到 高 位 逐 





已 经 定义 的 put_int_buffer， 我 们 把 数字 转换 后 的 


个 处 理 。 
































pr AT 


字符 。 


[dd 


连续 编码 的 , 数字 字符 之 | 





制 位 ， 这 是 我 们 最 先 处 理 的 部 分 ， 也 就 是 先 从 


间 也 都 是 连续 的 , 比如 字符 0 一 9 的 ASCII 









































的 数字 减 去 各 自 的 起 始 数字 得 到 偏 移 量 ， 





扁 移 量 加 






































| 
由 象 , 很 费解 , 但 我 隐约 觉得 您 


个 增 量 ， 不 i 






































E 





] 3 减 它 的 起 始 数 字 0 得 到 偏 移 
j 3 加 上 48， 得 









































导 到 的 51 便 是 字符 '3 
得 到 偏 移 量 4， 
4 加 上 65， 得 至 



































是 'A'， 其 ASCII 码 为 65， 





T 
LU 











但 通过 这 两 个 例子 ， 我 想 大 家 一 定 是 没 法 再 清楚 了 。 














精简 一 下 ， 将 数字 转换 成 字符 的 原理 是 : 


e 如 果 是 0~9 之 间 的 数字 ， 用 该 数字 加 上 字 
如 果 是 A~E 之 间 的 数字 ， 
开始 判断 该 数字 是 否 大 于 9， 大 于 9 由 
换 





第 172 行 
的 代码 便 是 按 

















符 '0' 的 ASCII 码 48。 

















该 数字 减 去 10 后 再 加 上 字符 'A' 的 ASCII 码 65 。 























照 以 上 规则 分 别 转 ] 








行 和 第 178 入 


直接 写字 符 0 和 字符 A'， 由 











这 时 候 咱 


们 有 








6 缓冲 














它 在 内 存 中 的 | 





区 put_int_buffer 派 上 用 场 了 








| 属于 A~EF 范围 ， 否 
这 里 为 了 语义 清楚 ， 
编译 器 将 其 转换 成 各 自 的 ASCII 码 。 





六 人 


= 人 | 





























3， 数 字 3 对 / 


1 的 69 便 


应 的 是 字符 '3， 
' 的 ASCII 码 。 
数字 下 对 应 的 


目 . 上 Ar 


征 子 付 卫 ' 





则 属于 0 一 9。 接 下 来 到 第 178 行 
对 于 字符 '0' 和 字符 'A' 的 ASCII 码 ， 在 第 174 








上 友人 





























字符 转换 完成 后 就 存储 到 这 里 。 在 由 数 5 








变 成 











， 子 个 




















顺序 可 不 








的 高 地 址 ， 数 字 
字 节 ) 的 单位 来 处 天 











的 低 








地 址 ,低位 的 字符 放 在 后 



























































能 按照 各 位 数字 本 身 在 
立 在 内 存 的 低地 址 )》， 
的 ， 一 视 同 仁 ， 不 分 高 低 。 所 以 ， 
| 高 地 址 ， 这 才 是 人 习惯 的 


子 们 


》 











内 存 中 的 ) 
为 它们 已 经 不 再 是 数字 了 ， 处 理 它们 的 时 候 ， 都 


























大 























抽 序 了 (x86 架构 是 小 端 字符 序 ， 数 字 中 的 高 位 在 内 


存 
(1 


Ar 


字 和 





是 以 各 

















hn 





































































































们 最 好 按照 正常 顺序 来 存储 ， 高 位 的 字符 放 在 前 面 低 
自然 顺序 。 不 过 这 样 一 来 ， 其 存储 顺序 就 有 些 类 似 大 端 
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子 - 

















节 序 了 ， 只 不 过 咱们 这 里 的 是 “大 端 字符 序 ” 这 个 是 我 自己 乱 起 的 词 ， 意 思 您 懂 了 就 行 。 

在 第 182 行 开始 存储 字符 ，edi 之 前 已 经 被 赋值 为 7， 这 是 从 后 往 前 写字 符 ， 就 是 咱们 的 “大 端 字符 
序 ”。 在 第 184 一 185 行 , 通过 “mov [ebx+edi]， dl” 往 put_int_buffer 中 写 入 转换 好 的 字符 ，dec 指令 使 寄 
存 器 edi 的 值 逐 渐 减 少 ， 使 偏 移 量 由 高 到 低 。 

第 186 行 通过 shr 右 移 指令 把 eax 寄存 器 向 右 移动 4 位， 去掉 已 转换 完成 的 低 4 位， 随后 在 第 187 行 
赋值 给 edx， 再 进行 下 一 轮 的 处 理 。 这 就 是 前 面 所 说 的 eax 和 edx 的 “配合 ”。 





代码 第 192 一 202 行 是 准备 跳 过 原来 数字 
这 样 的 形式 ， 我 们 在 打印 的 时 候 应 该 将 前 面 





















































高 位 的 0。 如果 待 打印 的 数字 
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高 位 为 0, 比如 0x00012345 




















续 的 多 个 0 去 掉 ， 仅 输出 为 0x12345 才 更 人 改 


连 





化 ， 注意 ， 打 
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印 到 屏幕 上 的 字符 不 包括 十 六 进 制 的 0x 前 级 。 

第 193 行 ，edi 作为 缓冲 区 中 的 偏 移 量 ， 经 过 前 面 的 转换 之 后 ，edi 此 时 已 经 为 -1 了 ， 即 0xffffffff， 故 通 
过 inc 指令 使 其 恢复 为 0， 这 也 是 为 指向 缓冲 区 中 最 低地 址 做 准备 。 

第 199 一 202 行 便 是 从 最 高 位 字符 逐个 与 字符 '0' 比 对 ， 直 到 找 出 不 为 0 的 字符 。 寄 存 器 cl 用 来 存储 字 
符 ASCII 码 ， 表 示 当 前 处 理 的 字符 ，edi 作为 字符 指针 ， 用 来 指向 缓冲 区 中 的 字符 地 址 。 

其 中 ， 第 199 行 ， 由 于 缓冲 区 中 的 字符 已 经 是 按照 “大 端 字符 序 ” 存 储 了 ， 所 以 此 时 的 edi 作为 偏 移 

其 值 为 0， 绥 冲 的 偏 移 从 0 起 便 指 向 最 高 位 字符 。 到 这 大 家 体会 到 第 193 行 的 inc edi 指令 使 edi 
























































复 为 0 的 良 苦 用 心 











区 
了。 
































说 一 下 第 203 行 ， 这 上 
时 ，edi 在 外 














有 将 edi 用 dec 指 
用 200 行 通过 inc 指令 




















令 减 1 的 原 








ce 
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第 199 一 202 





























己 经 指向 了 下 一 个 字符 ， 为 了 使 后 画 





2 下 Ap AAA 


行 的 代码 ,发现 当前 字符 


























符 指针 edi 应 该 是 匹配 的 ， 所 以 在 此 将 edi 恢复 成 指向 当前 字符 。 





































































































[的 打印 方便 














， 当 前 字符 cl 和 字 
































如 果 在 最 高 位 找到 字符 '0'"， 程 序 流程 会 到 第 194 行 的 .skip_prefix_0， 在 这 里 会 判断 数字 字符 是 否 为 全 
0， 这 里 的 逻辑 是 偏 移 edi 变 成 8 时 ， 表 示 已 经 找到 了 8 个 0， 所 以 判断 为 全 0。 比 如 数字 为 0x00000000 
这 种 情况 ， 其 转换 的 字符 会 是 '0"0"0"0"0"0"0"0'。 随 后 会 跳 到 .full0 处 ， 也 就 是 第 206~~207 行 ， 在 那里 将 其 
处 理 为 字符 '0'。 

程序 执行 到 此 ,此 时 的 edi 指向 缓冲 区 中 左 起 第 1 个 非 '0' 的 字符 , 接 下 来 的 第 208 一 215 行 会 逐个 打印 
后 面 的 字符 ， 这 样 就 实现 了 打印 字符 串 的 目的 。 

第 216 行 用 popad 指令 恢复 32 位 寄存 器 环境 后 在 第 217 行 结束 返 蕊 


print.h 中 增加 put_int 的 声明 ， 


OOUONPODP 























好 了 ， 代 码 说 完了 ， 似 乎 大 家 也 知道 下 一 步 该 上 机 测试 了 ， 依旧 是 改 头 文件 


#ifndef _ 
#define 
#include 


旺 S 巧 加 于 前 臣 运 且 学 


#endif 





见 代 码 6-9 第 6 行 ，put_int 





是 unsigned int。 


一 段落 了 ， 
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1 #include 
2 void main(void) { 
put_str("I am kernel\n"); 


CD 


下 面 看 main.c， 见 代码 6-10。 


代码 6-10 


THrInt.h™ 


but- Tint(0) 
put_char ('\n') 


put_ char('\n'); 
put_int (0x00021a3f); 
9 put_char ('\n') 
put int (Ox12345678); 
put char ('\n'); 
put int (0x00000000) 7 
while(1); 


4 
S 
6 Dat TNE) 
A 
8 








于 结 


J 丁 打 


编译 链 接 运行 过 程 略 ， 执 行 

















void put int (uint32 七 num); 


见 代码 6-9。 
代码 6-9 


LIB KERNEL PRINT_ 
_LIB KERNEL _ PRINT_ 


H 
H 


void put char (uint8 t char asci); 
void put str(char* message); 





( project/c6/c/lib/kernel/print.h ) 








果 如 


// 以 十 六 i 








只 支持 32 位 整数 输 


制 打印 














出 ， 所 以 其 参数 是 uint32_t， 





( project/c6/c/kernel/main.c ) 


图 6-11 所 示 。 


F printh 和 main.c。 先 在 





它 定 义 在 stdint.h 中 ， 就 








6-11 中 的 运行 结果 ， 我 目测 是 吻合 的 ， 这 是 咱们 的 最 后 一 
以 后 我 们 的 printf 函数 也 要 基于 这 些 函 数 来 实现 。 好 啦 ， 兄 弟 们 下 节 








个 打印 函数 ， 





有 关 打 印 的 部 分 到 此 就 告 

















再 见 。 


















































I am kernel 





IPS: 30.058H | | | | | | [= | | | 


4 图 6-11 ”put_int 远 行 效果 














内 联 汇编 


之 前 和 大 家 介绍 过 了 一 种 汇 
一 起 形成 可 执行 文件 。 

另 一 种 方式 就 是 在 C 代码 中 直接 嵌入 汇编 语言 ， 强 大 的 GCC 无 所 不 能 ， 咱 们 本 节 要 学 习 的 就 是 这 一 
种 ， 它 称 为 内 联 汇编 。 

其 实 还 有 另外 一 种 ， 就 是 那些 技术 大 牛 才能 玩 得 转 的 方式 ， 将 C 代码 编译 为 汇编 代码 后 ， 再 修改 汇编 代码 。 


6.4.1 什么 是 内 联 汇编 


内 联 汇编 称 为 inline assembly，GCC 支持 在 C 代码 中 直接 嵌入 汇编 代码 ， 所 以 称 为 GCC inline assembly。 
大 家 知道 ，C 语言 不 文 持 寄存 器 操作 ， 汇 编 语言 可 以 ， 所 以 自然 就 想到 了 在 C 语言 中 藤 入 内 联 汇编 提升 “ 战 
斗 力 ” 的 方式 ， 通 过 内 联 汇编 ，C 程序 员 可 以 实现 C 语言 无 法 表达 的 功能 ， 这 样 使 开发 能 力 大 为 提升 。 

内 联 汇编 按 格 式 分 为 两 大 类 ， 一 类 是 最 简单 的 基本 内 联 汇编 ， 另 一 类 是 复杂 一 些 的 扩展 内 联 汇编 , 在 
介绍 它们 之 前 ， 其 实 还 有 一 点 点 头疼 的 事 ， 内 联 汇编 中 所 用 的 汇编 语言 ， 其 语法 是 AT&T， 并 不 是 咱们 熟 
悉 的 Intel 汇编 语法 ，GCC 只 支持 它 ， 所 以 咱们 还 得 了 解 下 AT&T。 








ANS 

















前 方法， 就 是 C 代码 和 汇编 代码 分 别 编译 ， 最 后 通过 链接 的 方式 结合 在 















































































































































































































































































































































































































































6.4.2 ”汇编 语言 AT&T 语法 简介 
我 们 在 大 学 所 学 习 的 汇编 语言 大 多 数 都 是 Intel 语法 ， 也 许 这 和 教学 系统 都 是 微软 的 操作 系统 DOS 和 
Windows 有 关 ， 翻 翻 过 去 的 教材 ， 一 律 全 是 DOS 下 汇编 或 Windows 下 汇编 。Linux 内 核 中 的 汇编 代码 一 般 都 
是 AT&T 语法 ， 我 想 ， 随 着 Linux 普及 ， 以 后 在 教学 中 会 越 来 越 多 采取 AT&T 语法 啦 。 
什么 是 AT&T 语法 ? 
AT&T 是 汇编 语言 的 一 种 语法 风格 、 格 式 。 在 某 一 处 理 器 平台 上 ， 无 论 汇编 代码 是 什么 语法 ， 其 编译 
出 来 的 机 器 码 是 一 样 的 ， 所 以 不 要 误 以 为 AT&T 是 一 种 新 的 机 器 语言 。 它 仅仅 是 表达 方式 不 同 , 意思 是 
样 的 ， 这 就 像 咱们 汉语 中 ， 比 如 ,“ 我 今天 与 贺 亚 涛 在 食堂 吃饭 ”, “今天 在 食堂 ， 资 亚 涛 和 我 一 起 吃饭 ” 
表达 的 都 是 同一 个 意思 。 
AT&T 首先 在 UNIX 中 使 用 ， 可 当初 UNIX 并 不 是 在 x86 处 理 器 上 开发 的 ， 最 初 是 在 PDP-11 机 器 上 
开发 的 ， 后 来 又 移植 到 VAX 和 68000 的 处 理 器 上 ， 所 以 AT&T 的 语法 自然 更 接近 于 这 些 处 理 器 的 特性 。 
虽然 UNIX 后 来 又 移植 到 x86 上 了 , 但 还 是 要 尊重 UNIX 圈 内 的 习惯 ， 其 汇编 语法 接近 于 那些 前 辈 处 理 器 
上 的 语法 ， 这 就 是 AT&T 语法 。 
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第 6 章 完善 内 核 
无 论语 法 再 怎么 变 , 汇编 语言 中 指令 关键 字 肯 定 不 能 有 太 大 出 入 ， 名 字 非 常 接近 ， 只 是 在 指令 名 字 的 
最 后 加 上 了 操作 数 大 小 后 级, b 表示 1 字 节 , w 表示 2 字 节 , 1 表示 4 字 节 。 比如 压 栈 指令 , Intel 中 是 push， 
AT&T 中 是 pushl， 最 后 这 个 1 表示 压 入 4 字 节 (long 型 大 小 )。 在 了 解 mtel 汇编 指令 的 情况 下 ， 基 本 上 能 
够 看 懂 AT&T 的 汇编 指令 。 它们 的 主要 差别 是 语法 风格 ,咱们 对 照 着 看 下 这 两 种 风格 的 区 别 吧 ， 见 表 6-9。 
表 6-9 Intel 和 AT&T 汇编 风格 对 比 
区 别 Intel AT&T 说 明 
寄存 器 | 寄存 器 前 无 前 级 寄存 器 前 有 前 级 % 
ee he das ee 人 Intel 的 设计 思想 是 目的 操作 数 = 源 操作 数 ， 所 以 目的 操作 数 为 左 值 
换 让 | 呈 由 业 作 小 在 夺 ,浙江 信守 拱 作 数 在 正 ， 目 的 操作 | Ar 的 设计 思想 是 将 源 操作 数 -> 目的 操作 数 ， 所 以 目的 操作 
数 在 右边 
be 有 关内 存 的 操作 数 前 要 8 令 的 最 后 一 个 字母 表示 在 AT&T 语法 中 ， 内 存 地 址 是 第 一 位 的 ， 所 以 默认 数字 就 是 内 
操作 数 加 数据 类 型 修饰 符 : byte 操作 数 大 小 , b 表示 8 位 ， 存 地 址 ， 操作 数 是 数字 就 等 同 于 操作 数 是 内 存 ， 所 以 左边 的 
指定 表示 8 位 ，word 表示 16 A be var 并 没有 像 Intel 语法 那样 加 上 中 括号 []。 如 果 是 立即 数 则 要 
大 小 | 位 dword 表示 32 位 ， | 只 生生 16 全 家 太 32 | jn 前 级 ， 这 才 表 示 普通 的 数字 
如 mov byte[0x1234], eax 
立即 数 | 无 前 级 ， 如 6 有 前 级 $， 如 $6 
远 跳 转 | jmp far segment:offset ljmp $segment:$offset 
远 调 call far segment:offset lcall $segment:$offset 
远 返 忆 ret farn Iret $n 
以 表 6-9 中 未 列 出 这 两 种 语法 在 内 存 寻 址 方面 的 差异 ， 个 人 觉得 区 别 还 是 很 大 的 ， 下 面 单独 说 说 。 
在 Intel 语法 中 , 立即 数 就 是 普通 的 数字 , 如 果 让 立即 数 成 为 内 存 地 址 , 需要 将 它 用 中 括号 括 起 来 “[ 立 


即 数 ]” 这 档 
而 AT&T 认为 ， 内 存 ] 








lf 才 表 示 以 “立即 数 ”为 地 址 的 内 存 。 
地 址 既然 是 数字 ， 那 数字 





也 应 该 被 当 作 内 存 : 














也 址 ， 所 以 ， 数 字 被 优先 认为 是 内 存 





地 址 ， 也 就 是 说 ， 操 作 数 知 为 数字 ， 则 统统 按 以 该 数字 为 地 址 的 内 存 来 访问 。 这 样 ， 立 即 数 的 地 位 比较 次 


要 了 ， 如 果 想 表示 成 单纯 
无 论 是 哪 种 汇编 语言 


寻 址 、 基 址 变 址 寻 址 。 也 
和 AT&T 的 内 存 寻 址 相 比较 之 后 
而 在 AT&T 中 的 内 存 寻 址 还 是 挺 独特 的 ， 它 的 内 存 寻 址 有 








的 立即 数 ， 需 要 额外 在 前 本 
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格 ， 都 要 有 访问 











口 





J 能 是 习惯 了 的 原 





大 








j 加 个 前 
内 存 的 能 力 ， 这 就 是 内 存 寻 
咱们 之 前 学 习 了 Intel 汇编 语法 中 的 很 多 寻 址 方式 ， 就 内 存 寻 址 来 说 ， 有 直接 寻 址 、 基 址 寻 址 、 变 址 
， 我 个 人 觉得 Intel 语法 真 的 很 直 白 ， 容 易 理 解 ， 尤 其 是 在 


又 
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$。 


址 。 






























































segreg 〈 段 基 址 ): base address(offset_address,index,size) 
该 格式 对 应 的 表达 式 为 : 
segreg 〈 段 基 址 ): base_address+ offset address+ index*size。 

此 表达 式 的 格式 和 Intel 32 位 内 存 寻 址 中 的 基 址 变 址 寻 址 类 似 ，Intel 的 格式 : 


segreg:[basetindex*size+offset] 


不 过 与 Intel 不 同 的 是 AT&T 地 址 表达 式 的 值 是 内 存 地 址 ， 
看 上 去 格式 有 些 怪异 ,但 其 实 这 是 一 种 “通用 
的 方式 ,任意 一 种 内 存 寻 址 方式 , ] 











绍 下 这 些 成 员 项 。 


base_address 是 基地 址 ， 可 以 为 整数 、 变 量 名 ， 可 
offset address 是 偏 移 地 址 ，index 是 索引 值 ， 





















































固定 的 格式 。 














接 被 当 作 内 存 来 读 写 ， 而 不 是 普通 数字 。 














”格式 ， 格 式 中 短 短 的 几 个 成 员 宫 括 了 它 所 有 
其 格式 都 是 这 个 通用 格式 的 子 集 ， 都 是 格式 中 各 种 成 员 的 组 合 。 下 画 














size 是 个 长 度 ， 只 能 是 1、2、4、8 (Intel 语法 中 


下 面 看 看 内 存 寻 址 ， 
直接 寻 址 : 此 寻 址 中 只 有 
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明 






































比如 movl $255，0xc00008F0， 或 者 | 
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bh 些 方 式 ， 
base_address 项 ， 即 








这 两 个 必 


正 可 负 








须 是 那 8 个 通 
也 是 只 能 乘 以 这 4 个 数 )。 

















内 存 寻 址 


| 介 























用 寄存 器 之 























j 格 式 的 一 部 分 。 








注意 ， 这 些 方式 都 是 上 面 通 














后 国 


j 括 号 









































变量 名 : mov $6，var。 


的 内 容 全 不 要 ，base address 便 为 内 存 啦 ， 





























寄存 器 间接 寻 址 : 此 寻 址 中 只 有 offset address 项 ， 即 格式 为 《〈offset address)， 要 记得 ，offset address 只 能 





























是 通用 寄存 器 。 寄 存 器 中 是 地 址 ， 不 要 忘记 格式 中 的 圆 括号 ， 如 mov (%eax), %ebx。 

寄存 器 相对 寻 址 : 此 寻 址 中 有 offset address 项 和 base address 项 ， 即 格式 为 base address 
(Coffset address)。 这 样 得 出 的 内 存 地 址 是 基 址 + 偏 移 地 址 之 和 。 

各 部 分 还 是 要 按照 格式 填写 ， 如 movb -4(%ebx),%al， 功 能 是 将 地 址 〈ebx-4) 所 指向 的 内 存 复制 1 字 








节 到 寄 


变 址 寻 址 ;此 类 寻 址 称 为 变 址 的 原 
以 有 index 的 地 方 就 有 size。 既 然 是 变 址 ， 
E 意 ， 格 式 中 没有 的 部 分 也 要 保留 


可 无 ， 





存 器 al。 



































六 | 














ee 














是 含有 通用 格式 中 的 变量 Index。 因 为 index 是 size 的 倍数 ， 所 
要 有 index 和 size 就 成 了 ，base_address 和 offset_ address 可 有 




















AN 


ANY 








yy 
六 

















号 来 占 位 。 一 共有 4 种 变 址 寻 址 组 合 ， 下 面 各 举 个 例子 。 


六 

















无 base address， 无 offset_address: 

mov] %eax,(,%esi,2) 

能 是 将 eax 的 值 写 入 esi*2 所 指向 的 内 存 。 
无 base address， 有 offset_address: 


mov] %eax,(%ebx,%esi,2) 


功 











功 

















功能 是 将 eax 的 值 写 入 epx+esi*2 所 指向 的 内 存 。 
有 base_address， 无 offset_address: 


Imovl %eax,base_value(,%esi,2) 


能 是 将 eax 的 值 写 入 base_valuetesi*2 所 指向 的 内 存 。 


有 base_address， 有 offset address: 


mov] %eax,base_value(%ebx,%esi,2) 


功能 是 将 eax 的 值 写 入 base valuetebx+esi*2 所 指向 的 内 存 。 























好 啦 ，AT&T 就 简单 介绍 到 这 ， 咱 们 重点 是 内 联 汇编 。 


6.4.3 基本 内 联 汇编 
本 内 联 汇编 是 最 简单 的 内 联 形式 ， 其 格式 为 : 
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asm 


各 





volatilel] 





























("assembly code") 

















关键 字 之 间 可 以 用 空格 或 制 表 符 分 隔 ， 也 可 以 紧凑 挨 在 一 起 不 分 隔 ， 各 部 分 意义 如 下 : 


关键 字 asm 用 于 声明 内 联 汇编 表达 式 ， 这 是 内 联 汇编 固定 的 部 分 ， 不 可 少 。 


asm 和 asm 


因 
不 定 就 
原样 








束 








是 一 样 的 ， 是 由 gcc 定义 的 宏 : #define asm asm。 



































为 gcc 有 个 优化 选项 O， 可 以 指定 优化 级 别 。 当 用 -O 来 编译 时 ，gcc 按照 自己 的 意图 优化 代码 ， 说 















































会 把 自己 所 写 的 代码 修改 了 。 关 键 字 volatile 是 可 选项 ， 它 告诉 gcc:“ 不 要 修改 我 写 的 汇编 代码 ， 


保留 >。volatile 和 volatile 是 一 样 的 ， 是 由 gcc 定义 的 宏 : #define _volatile volatile。 


















































“assembly code” 是 咱们 所 写 的 汇编 代码 ， 它 必须 位 于 圆 括号 中 ， 而 且 必 须 用 双 引 号 引起 来 。 这 是 格 

















式 要 求 ， 只 要 满足 了 这 个 格式 asm [volatile] (“”)，assembly code 甚至 可 以 为 空 。 

下 面 说 下 assembly code 的 规则 。 

(1) 指令 必须 用 双 引 号 引起 来 ， 无 论 双 引 号 中 是 一 条 指令 或 多 条 指令 。 

(2) 一 对 双 引 号 不 能 跨行 ， 如 果 跨 行 需 要 在 结尾 用 反 斜 杠 \ 转 义 。 

(3) 指令 之 间 用 分 号 ';'、 换 行 符 \n' 或 换行 符 加 制 表 符 \n"\t' 分 隔 。 

提醒 一 下 ， 即 使 是 指令 分 布 在 多 个 双 引 号 中 ，gcc 最 终 也 要 把 它们 合并 到 一 起 来 处 理 ， 合 并 之 后 ， 指 
令 间 必须 要 有 分 隔 符 。 所 以 ， 当 指令 在 多 个 双 引 号 中 时 ， 除 最 后 一 个 双 引 号 外 ， 其 余 双 引号 中 的 代码 最 后 






































































































































定 要 有 分 阳 符 ， 这 和 其 他 编程 语言 中 表示 代码 结束 的 分 隔 符 是 一 样 的 ， 如 : 
asm(“movl $9,%eax;””"pushl Seax”) 正确 





asm(“movl1 $9,%eax””pushl gSeax”) 萌 误 


大 家 注意 ， 在 内 联 汇 编 中 ， 咀 们 要 注意 操作 数 的 顺序 啦 ， 现 在 是 和 Intel 反 着 的 。 
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给 大 家 举 个 例子 ， 见 文件 inlineASM.c。 
























































1 char* str="hello,world\n"; 

2 int count = 0; 

3 void main()f{ 

4 asm("pusha; \ 

号 mov1 $4,%eax; \ 

6 movl $1,%ebx; \ 

7 movl str,SsSecx;\ 

8 movl $12,S%edx;\ 

9 int $0x80; \ 

10 mov gSeax, Count;\ 

二 popa 

12 "); 

3 

代码 inlineASM.c 演示 用 汇编 代码 直接 调用 “系统 调用 ”write 来 打印 字符 串 ， 该 系统 调用 执行 后 会 返 
回 打印 的 字符 数 。 


























第 1 一 2 行 定义 了 两 个 全 局 变量 ， 待 打印 的 字符 串 是 strY，count 用 来 存储 返回 值 。 

第 4 一 12 行 是 内 联 汇编 ， 这 是 咱们 之 前 说 过 的 C 语言 中 路 过 运行 库 直 接 调用 系统 调用 的 实例 。 这 完 
全 是 AT&T 风格 的 汇编 语句 : 寄存 器 前 面 加 前 级 %， 立 即 数 前 面 加 前 级 $， 操 作 数 由 左 到 右 的 顺序 。 似 乎 
看 上 去 很 简单 。 

第 4 行将 8 个 通用 寄存 器 压 栈 ，AT&T 中 的 汇编 指令 是 pusha (Intel 中 的 是 pushad )。 

第 5 行 传 入 第 4 号 系统 调用 ， 这 就 是 write 的 调用 号 。 

第 6 一 8 行 是 为 write 系统 调用 传 入 参数 ,前 面 说 系统 调用 的 时 候 有 讲 过 参数 传递 所 用 到 的 寄存 器 , 不 
再 袭 述 。 

























































































































































































第 9 行 用 int 0x80 执行 系统 调用 , 在 AT&T 中 立即 数 的 地 位 比较 低 , 要 加 $ 前 绥 才 表示 数字 为 立即 数 (常数 )。 
第 10 行 是 获取 write 的 返回 值 ， 返 回 值 都 是 存储 在 eax 寄存 器 中 ， 所 以 将 其 复制 到 变量 count 中 。 


好 啦 ， 编 译 运 行 看 结果 ， 如 图 6-12 所 示 。 re eer rr 
[work@localhost book]$ ./inlineASM.bin 
































大 家 注意 到 没有 , inlineASM.c 中 的 变量 count 和 str 定义 ”、 革 于 bt 

为 全 局 变量 。 对 的 ， 在 基本 内 联 汇编 中 ， 若 要 引用 C 变量 ， 4 图 6-12 ”内 联 汇编 运行 结果 
只 能 将 它 定 义 为 全 局 变量 。 如 果 定 义 为 局 部 变量 ,链接 时 会 找 不 到 这 两 个 符号 ， 这 就 是 基本 内 联 汇编 的 
限 性 ， 简 单 的 东西 往往 功能 不 够 强大 ， 所 以 咱们 还 得 学 下 扩展 内 联 汇 编 形 式 ， 下 一 节 走 起 。 

6.4.4 扩展 内 联 汇编 

由 于 基本 内 联 汇编 功能 太 薄 弱 了 ， 所 以 才 对 它 进 行 了 扩展 以 使 其 功能 强大 。 不 过 ， 易 用 性 往往 与 功能 
强 弱 是 成 正比 的 ， 如 您 所 料 ， 扩 展 内 联 汇编 确实 有 点 难 ， 但 在 求知 欲 的 驱使 下 ， 就 让 咱们 痛 并 快乐 着 吧 。 

gcc 本 身 是 个 C 编译 器 ， 要 让 其 支持 汇编 语言 ， 必 然 牵 扯 到 以 下 问题 。 

。 在 内 联 汇编 代码 插入 点 之 前 的 C 代码 ， 其 编译 后 也 要 被 分 配 寄 存 器 等 资源 ， 插 入 的 汇编 代码 也 要 
使 用 寄存 器 ， 这 是 否 会 造成 资源 冲突 ? 

。 汇编 语言 如 何 访问 C 代码 中 的 变量 ? 

您 看 , 内 联 汇编 真 不 是 简单 地 写 两 句 汇编 代码 就 完事 了 , 所 以 , 很 多 人 宁可 单独 写 纯 汇编 文件 再 链接 ， 
也 不 愿意 写 内 联 汇编 。 

我 们 从 头 分 析 ， 假 设 目 前 没有 扩展 内 联 汇编 。 

当 汇 编 代码 谍 入 到 C 代码 中 ， 如 果 汇 编 代 码 想 把 C 代码 中 的 变量 作为 操作 数 加 载 到 寄存 器 ， 如 何 找 
到 可 用 的 寄存 器 ， 这 可 是 个 大 问题 ， 程 序 员 并 不 知道 哪个 寄存 器 已 经 被 分 配 了 ， 哪 些 寄存 器 是 空闲 的 。 即 
使 知道 了 寄存 器 的 分 配 情况 也 还 不 够 ， 有 些 底层 操作 ， 对 寄存 器 的 要 求 是 固定 的 〈 比 如 in/out 指令 ， 就 得 
使 用 al 作为 数据 寄存 器 )， 万 一 那个 固定 的 寄存 器 已 经 被 占用 了 ， 咱 们 在 使 用 前 还 得 把 它 备 份 。 
也许 您 觉得 ， 这 些 问 题 不 难 啊 ， 我 不 管 之 前 用 了 哪些 寄存 器 ， 我 在 内 联 汇编 中 用 哪些 寄存 器 时 就 先 将 
其 入 栈 备 份 ， 用 完了 再 恢复 器。 听 上 去 不 错 , 但 由 用 户 来 保证 数据 完整 性 简直 就 是 灾难 ， 人 的 精力 是 有 限 
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的 ， 谁 知道 会 不 会 漏 掉 哪 个 寄 








存 器 呢 ， 而 且 





































































































在 出 了 问题 后 也 不 容易 查 日 


E 栈 操 
































来 。 





有 大 量 的 月 








说 ， 运行 [ 
























































































































































































































































作 , 访问 内 存 本 身 就 比较 慢 ， 不 如 在 编译 阶段 由 编译 器 优化 ， 直 接 分 配给 寄存 器 或 用 寄存 器 缓存 ， 这 样 程序 
运行 才 更 快 。 所 以 ， 这 类 事情 还 是 交 给 编译 器 自己 做 这 事 才 放心 。 

既然 编译 器 对 咱们 不 放心 ， 那 么 现在 的 问题 变 成 了 如 何 将 C 代码 中 的 变量 变 成 汇编 代码 中 的 操作 数 ， 
1 于 编译 器 无 法 预测 用 户 的 需求 ， 这 些 只 得 让 用 户 控制 ， 故 编译 器 采取 的 做 法 是 它 提供 一 个 模板 ， 让 用 户 
竺 模板 中 提出 要 求 ， 其 余 工作 由 它 负责 实现 。 这 些 用 户 提 出 的 要 求 ， 就 是 后 面 所 说 的 约束 。 

因此 ， 内 联 汇编 的 格式 也 变 得 让 人 生 旦 了 ， 感 觉 既 不 像 C 语言 ， 也 不 像 汇编 语言 ， 似 乎 是 一 种 中 间 
产物 ， 不 信 您 看 。 
| asm [volatile] (“vassembly code”:output : input : clobber/modify) 

和 前 面 的 基本 内 联 汇 编 相 比 ， 扩 展 内 联 汇编 在 圆 括号 中 变 成 了 4 部 分 ， 多 了 output、input 和 
clobber/modify 三 项 。 其 中 的 每 一 部 分 都 可 以 省 略 ， 甚 至 包括 assembly code。 省 略 的 部 分 要 保留 冒号 分 隔 

















Es 


























符 来 占 位 ， 如 果 省 略 的 是 后 国 
不 需要 保留 input 后 面 的 

















口 








匣 
































的 一 个 或 多 个 连续 的 部 分 ， 分 























assembly code: 还 是 | 
汇编 代码 的 运行 是 需要 输 
在 C 代码 中 内 网 汇 编 的 目 


放 其 输出 结果 的 空间 。 这 样 一 




















供 加 工 的 源 材 料 (input)， 机 器 运行 后 ， 
机 器 的 输出 结果 。input 和 output 正 











关键 ， 我 们 之 前 的 讨论 就 通 
output:output 用 来 指定 


过 











] 户 写 入 的 


| 编 


















































站 隔 符 也 不 





保留 ， 比 如 省 略 了 clobber/modify， 


























L 编 指令 ， 和 基本 内 联 汇 编 一 样 。 








y 
了 





0 





入 参数 的 ， 
的 是 让 汇编 

来 ， 内 联 汇编 代码 类 

将 生产 


其 运行 之 后 也 可 




















以 机 器 ， 


























= 
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这 两 项 解决 。 









































运行 结果 存储 到 c 变量 中 ， 就 





个 | 


能 


其 中 的 引号 和 圆 括号 不 能 











input: input 用 








此 指定 。input 中 每 个 操作 数 的 格式 为 : 
其 中 的 引号 和 圆 括 号 不 能 


E 





来 指定 C 中 数据 如 何 输入 给 











] 此 项 指定 输 


“操作 数 修饰 符 约束 名 ” 





帮助 C 完成 某 些 功能 ， 所 以 C 代码 就 要 为 


8 来 的 成 果 放 到 人 能 够 人 
C 为 汇编 提供 输入 参数 和 存储 其 输出 的 部 分 ， 这 是 


代码 的 数据 如 何 输出 给 C 代码 使 用 。 
的 位 置 。output 中 每 个 操 











出 结果 。 























其 提供 参数 和 用 于 存 
C 代码 类 似 人 。 机 器 要 运行 ， 人 就 要 为 机 器 提 
着 的 地 方 output)， 人 才能 获取 


[ 编 与 c 交互 的 



























































内 嵌 的 汇编 指令 运行 结束 后 ， 如 果 想 将 
乍 数 的 格式 为 : 























(C 变量 名 ) 











少 ， 














操作 数 修饰 符 通 常 为 等 号 ='。 多 个 操作 数 之 


间 用 去 号 ，' 分 隔 。 

















中 
入 /Do 





[ 编 


























“[ 操 作 数 修饰 符 ] 约束 名 ”(C 变 
操作 数 修饰 符 为 可 选项 。 
独 强 调 一 下 ， 以 上 的 outputO0 和 inputO 括 号 中 的 是 C 代码 中 的 变量 ，output (c 变量 ) 和 input (c 变 








少 ， 

















里 





) 吧 





t 像 C 语言 





存 器 或 内 存 数 据 的 破坏 ， 这 检 





Ph 的 函数 ， 将 C 变量 〈 值 或 变量 地 址 ) 转换 成 ; 
clobber/modify: 汇编 代码 执行 后 会 破坏 一 











此 





内 存 或 寄存 器 资源 ， 通 过 此 项 通知 多 








要 想 让 汇编 使 用 C 中 的 变量 作为 参数 ， 就 要 在 











有 


里 


名 ) 
多 个 操作 数 之 间 























j 逗 号， 分隔 。 








[ 编 代码 的 操作 数 。 











有 译 右 ， 可 能 造成 寄 

















f gcc 就 知道 哪些 寄存 器 或 内 存 需要 提前 保护 起 来 ， 后 画 





I 会 展开 细 说 。 














assembly code 中 引用 的 所 有 操作 数 其 实 是 经 过 gcc 转换 后 的 复 本 ,“ 原 件 都 是 在 output 和 input 括号 





三 | 


中 的 c 变量 ， 
上 十 


立即 数 ) 映射 为 汇编 中 所 使 用 


后 面 通过 各 种 例 















































， 在 扩展 内 联 汇编 中 称 为 “ 约 
的 操作 数 ， 实 际 就 是 描述 C 














子 您 就 明白 了 。 
片 和 


末 ， 

















它 所 起 的 作用 就 是 把 C 代码 中 的 操作 数 《〈 变 量 、 




















的 操作 数 如 何 变 成 汇编 操作 数 。 这 些 约束 的 作 























用 域 是 input 和 output 部 分 ，[ 


人 








。 寄存 器 约束 
寄存 器 约束 就 是 要 求 gcc 
存 器 约束 有 : 
表示 寄存 器 eax/ax/al 
b: 表示 寄存 器 ebx/bx/bl 
c: 表示 寄存 器 ecx/cx/cl 
d 


: 表示 寄存 器 edx/dx/dl 














a: 
































使 


] 看 看 这 些 约束 是 怎么 体现 的 ， 约 束 分 为 


哪个 寄存 器 ， 将 input 或 output ! 








I 大 类 。 


























变量 约束 在 某 个 寄存 器 中 。 常 见 的 寄 
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第 6 章 完善 内 核 

D: 表示 寄存 器 edi/di 

S: 表示 寄存 器 esi/si 

q: 表示 任意 这 4 个 通用 寄存 器 之 一 : eax/ebx/ecx/edx 

r: 表示 任意 这 6 个 通用 寄存 器 之 一 : eax/ebx/ecx/edx/esi/edi 

g: 表示 可 以 存放 到 任意 地 点 (寄存 器 和 内 存 )。 相 当 于 除了 同 gq 一 样 外 ， 还 可 以 让 gcc 安排 在 内 存 中 

A: 把 eax 和 edx 组 合成 64 位 整数 

f: 表示 浮 点 寄存 器 

t: 表示 第 1 个 浮 点 寄存 器 

u: 表示 第 2 个 浮 点 寄存 器 

下 面 咱们 先 和 暂停 一 下 ， 体 验 一 下 基本 内 联 汇编 和 扩展 内 联 汇编 的 区 别 ， 用 加 法 指令 addl 在 两 种 方式 
下 做 个 简单 的 加 法 运算 。 

先 看 下 基本 内 联 汇编 ， 见 文件 base_asm.c。 

1 #include<stdio.hn> 

2 int in a = 1, in b = 2, out sum; 

3 void main() { 

4 asm(" pusha; \ 

5 movl in a, Seax; \ 

6 movl in b, S$Sebx; \ 

7 addl Sebx, Seax; be 

8 movl geax, out_ sum; \ 

9 popa"); 

10 printf("sum is %Sd\n",out sum); 
: 

加 法 指令 的 两 个 输入 操作 数 是 in_a 和 in_b， 输 出 和 存储 在 变量 out_sum 中 。 以 上 代码 我 相信 大 家 能 
独立 看 懂 ， 大 家 注意 ， 在 第 $ 一 6 行 输入 操作 数 in_a 和 in_b 是 分 别 手动 movl 到 寄存 器 eax 和 ebx 的。 加 
法 的 和 是 在 第 8 行 movl 到 变量 out_sum 中 的 。 

在 基本 内 联 汇 编 中 的 寄存 器 用 单个 % 做 前 级 ， 在 扩展 内 联 汇编 中 ， 单 个 % 有 了 新 的 用 途 ， 用 来 表示 占 
位 符 ( 一 会 儿 细 讲 )， 所 以 在 扩展 内 联 汇编 中 的 寄存 器 前 面 用 两 个 % 做 前 级 。 

再 看 下 用 扩展 内 联 汇 编 是 怎么 做 的 ， 见 文件 reg_constraint.c。 

1 #include<stdio.h> 

2 void main() { 

3 int in a = 1, in b = 2, out_ sum; 

4 asm("addl %%ebx, %S%eax":"=a"(out sum):"a"(in a),"b"(in b));} 

5 printf("sum is Sd\n",out sum); 

6 1} 

大 伙 儿 注意 ， 扩 展 内 联 汇编 中 寄存 器 前 级 是 两 个 %。 





























同样 是 为 加 法 指令 提供 参数 ，in_a 和 in_b 是 在 input 部 分 中 
用 寄存 器 eax， 




























































































输入 的 ， 
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约束 名 a 为 c 变量 in a 指定 了 




















约束 名 b 为 c 变量 in_b 指定 了 用 寄存 器 ebx。addl 指令 的 结果 存放 到 了 寄存 器 eax 中 ， 


























































































































































































































在 output 中 用 约束 名 a 指定 了 把 寄存 器 eax 的 值 存储 到 c 变量 out_sum 中 。output 中 的 '=' 号 是 操作 数 类 型 
修饰 符 ， 表 示 只 写 ， 其 实 就 是 out_sum=eax 的 意思 。 

不 知 大 家 有 没有 疑惑 ，output 和 input 中 用 的 约束 都 是 同一 个 ， 这 是 否 会 存在 顺序 混乱 、 数 据 才 盖 ? 其 实 
只 要 清楚 操作 数 〈 约 束 对 应 的 寄存 器 或 内 存 ) 被 赋值 的 顺序 就 明白 了 ， 肯 定 永远 是 输入 (input) 中 的 汇编 操作 
数 优 先 被 赋值 ， 汇 编 代 码 经 过 运行 ， 最 后 才 是 为 输出 〈output) 中 的 汇编 操作 数 赋值 。 拿 第 4 行 来 说 ，output 
和 input 中 的 约束 都 有 a， 也 就 是 都 用 寄存 器 eax 来 导入 导出 数值 。 肯 定 是 eax 先 在 input 部 分 中 被 赋值 为 变量 
in a， 此 时 eax 作为 输入 参数 第 一 次 被 赋值 ， 在 加 法 指令 addl 运行 后 直接 把 结果 放 到 寄存 器 eax 中 ， 此 时 eax 
作为 输出 结果 第 二 次 被 赋值 ， 这 样 eax 直接 就 是 最 终 的 输出 啦 。 之 后 再 处 理 out_ put， 由 于 eax 已 经 是 汇编 中 
用 于 输出 的 操作 数 了 ， 编 译 器 背后 通过 mov 操作 把 eax 的 值 传 给 out sum， 这 一 点 在 后 面 很 多 例子 中 会 看 到 。 









































另外 ， 在 input ! 
时 容纳 多 个 变量 值 ， 这 样 纺 
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的 时 候 也 会 报错 。 
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不 可 能 存在 多 个 c 变量 的 约束 为 同一 个 寄存 器 的 情况 ， 您 懂 的 ， 一 个 寄存 器 无 法 同 





通过 对 比 ， 有 没有 觉得 扩展 内 联 汇编 “ 炫 ” 一 些 啦 ? 它 其 实 就 是 个 模板 , 咱们 把 参数 往 里 面 套 就 行 了 ， 
内 部 运作 交 给 gcc 处 理 。 继 续 看 其 他 约束 啦 。 

。 内 存 约束 

内 存 约束 是 要 求 gcc 直接 将 位 于 input 和 output 中 的 C 变量 的 内 存 地 址 作为 内 联 汇 编 代码 的 操作 数 ， 
不 需要 寄存 器 做 中 转 ， 直 接 进 行内 存 读 写 ， 也 就 是 汇编 代码 的 操作 数 是 C 变量 的 指针 。 

m: 表示 操作 数 可 以 使 用 任意 一 种 内 存 形式 。 

o: 操作 数 为 内 存 变 量 ， 但 访问 它 是 通过 偏 移 量 的 形式 访问 ， 即 包含 offset_address 的 格式 。 

下 面 的 文件 mem.c 用 约束 m 为 例 。 



















































































































































































文件 mem.c 
1 #include<stdio.h> 
2 void main() { 
3 站 i 已 诗作 各 这 站 7 BB 和 :22.3 
Brintf ("vin Db: is. Sd\n"; in bb) 
asm("movb %b0, $l;"::"a"(in a),"m" (in b)); 
printf("in b now is Sd\n", in b); 


~] OO 心 


} 


mem.c 的 作用 是 变量 in_b 用 in a 的 值 奉 换 。in_b 最 终 变 成 1。 
第 5 行 是 内 联 汇编 ， 把 in_a 施加 寄存 器 约束 a， 告 诉 gcc 把 变量 in_a 放 到 寄存 器 eax 中 ， 对 in_b 施 
内存 约束 m， 告 诉 gcc 把 变量 in_b 的 指针 作为 内 联 代 码 的 操作 数 。 

为 演示 内 存 约束 ， 咱 们 在 第 5 行 用 了 个 新 的 符号 “9%1”， 它 是 序号 占 位 符 ， 一 会 儿 咱 们 会 细 说 ， 
在 这 里 大 家 认为 它 代表 in_b 的 内 存 地 址 (指针) 就行 了 。 
顺便 说 下 ， 第 5 行 对 寄存 器 eax 的 引用 : %b0， 这 是 用 的 32 位 数据 的 低 8 位 ， 在 这 里 就 是 指 al 寄存 器 
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如 果 不 显 式 加 字符 b， 编 译 器 也 会 按照 低 8 位 来 处 理 ， 但 它 会 发 由 警告 。 eee 
Warning: using '%al instead of '%eax' due to b' suffix inb now is 1 
程序 运行 结果 如 图 6-13 所 示 。 A 图 6-13 内存 约束 演示 















































咱们 顺便 再 检验 下 C 变量 被 处 理 为 指针 的 情况 ， 看 看 mem.c 被 转换 成 的 汇编 代码 是 什么 。 还 是 要 用 
gcc 的 -S 参数 帮忙 : 编译 到 汇编 语言 ， 不 进行 汇编 和 链接 。 































































































键入 命令 gcc -$ -o /tmp/mem.S ./mem.c 回 车 , 生成 的 汇编 代码 输出 在 /tmp/mem.S, 下 面 见 代码 mem.S 。 
代码 mem.S 
.. 略 
10 main 
正 pushl sebp ;堆栈 框架 
2 movil Sesp, sebPp 
LE3 andl $-16, Sesp 
14 subl $32, Sesp ; 预 留 局 部 变量 空间 
15 movil $1, 28 (sesp) ; 变量 in_a 在 栈 中 位 置 
16 mov1 $2, 24 (S$esp) ; 变量 in_b 在 栈 中 位 置 
22 vl 28 (Sesp), %Seax 
; 内 联 汇编 的 ue 将 in_a 赋值 给 eax 
23 #APP 
24 # 5 "./mem.c" 1 
25 movb %al, 24(%esp); ; 内 联 汇编 , 直接 将 al 写 入 in_b 的 内 存 
26 # 0 ww 受 
27 #NO_APP 
… 略 


























这 里 只 摘录 了 mem.S 和 内 联 汇编 相关 的 部 分 

第 11 一 14 ee & 的 部 分 ， 我 们 知道 局 部 变量 是 在 栈 中 保存 的 ， 堆 栈 框架 主要 做 的 就 是 为 
局 部 变量 在 栈 中 分 配 空间 。 
第 15 0 量 in a 存储 到 栈 中 距 栈 顶 向 上 28 字 节 的 位 置 ， 并 赋值 为 1。 

第 16 行 是 将 变量 in_b 存储 到 栈 中 距 栈 顶 向 上 24 字 节 的 位 置 ， 并 赋值 为 2。 大 伙 先 记 住 in_b 等 于 24 
(9%esp)， 还 记得 这 个 格式 吧 ， 这 是 AT&T 内 存 寻 址 方式 之 一 : 寄存 器 相对 寻 址 。 
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第 23 一 27 行 是 咱们 所 写 的 内 联 汇 编 代 码 ，#APP 和 #NO_APP 之 间 的 东 东 都 是 gcc 加 进去 的 。 
第 25 行 ， 直 接 将 al 寄存 器 movb 到 in_b 的 内 存 空间 《〈 栈 中 )。 这 验证 了 内 存 约束 确实 是 把 C 变量 的 
指针 作为 内 联 汇编 代码 的 操作 数 。 

另外 提醒 一 下 ， 内 存 约束 也 不 是 乱用 的 ， 至 少 在 assembly code 中 的 指令 得 允许 操作 数 是 内 存 ， 比 如 
asm("movl %0, %1;"::"m"(in_a),"m"(in_b)) 就 会 出 问题 。movl 指令 不 允许 “内 存 ” 到 “内 存 ” 的 复制 ， 编 译 
阶段 就 会 报错 。 
| Error: too many memory references for ‘mov' 

。 立即 数 约束 
立即 数 即 常数 ， 此 约束 要 求 gcc 在 传 值 的 时 候 不 通过 内 存 和 寄存 器 ， 直 接 作为 立即 数 传 给 汇编 代码 。 
1 于 立即 数 不 是 变量 ， 只 能 作为 右 值 ， 所 以 只 能 放 在 input 中 。 
i: 表示 操作 数 为 整数 立即 数 
F: 表示 操作 数 为 浮 点 数 立 即 数 
I: 表示 操作 数 为 0 一 31 之 间 的 立即 数 
J: 表示 操作 数 为 0 一 63 之 间 的 立即 数 
N: 表示 操作 数 为 0 一 255 之 间 的 立即 数 
O: 表示 操作 数 为 0 一 32 之 间 的 立即 数 
X: 表示 操作 数 为 任何 类 型 立即 数 
为 节约 篇 幅 ， 后 面 将 立即 数 约束 同 其 他 约束 一 起 演示 ， 这 里 没有 单独 样 例 。 
。 通用 约束 
0 一 9: 此 约束 只 用 在 input 部 分 ， 但 表示 可 与 output 和 input 中 第 n 个 操作 数 用 相同 的 寄存 器 或 内 存 。 
为 节约 篇 幅 ， 后 面 会 安排 此 约束 的 例子 。 
有 关 约 束 束 说 到 这 里 ， 不 过 我 怕 没 有 将 约束 表达 清楚 ， 容 小 弟 我 再 嗓 嗪 十 块 钱 的 。 

由 于 我 们 是 在 C 语言 中 插入 汇编 代码 ， 所 以 约束 的 作用 是 让 C 代码 的 操作 数 变 成 汇编 代码 能 使 用 的 
操作 数 ， 所 有 的 约束 形式 其 实 都 是 给 汇编 用 的 。 故 ， 约 束 是 C 语言 中 的 操作 数 〈 变 量 或 立即 数 ) 与 汇编 
代码 中 的 操作 数 之 间 的 映射 ， 它 告诉 gcc， 同 一 个 操作 数 在 两 种 环境 下 如 何 变换 身份 ， 如 何 对 接 沟通 。 编 
译 过 程 中 C 代码 是 要 先 变 成 汇编 代码 的 ， 内 联 汇编 中 的 约束 就 相当 于 gcc 让 咱们 指定 C 中 数据 的 编译 形 
式 。 在 内 联 汇编 中 assembly code 中 用 到 的 操作 数 ， 都 是 位 于 output 和 input 中 C 操作 数 的 副本 ， 多 数 通过 
赋值 的 方式 传 给 汇编 代码 ,或 者 顶 多 是 通过 指针 的 形式 ， 当 操作 数 的 副本 在 汇编 中 人 处理 完成 后 ， 又 重新 赋 
值 给 C 操作 数 。 也 可 以 这 么 说 , C 操作 数 通 过 约束 后 , 在 汇编 中 的 操作 数 是 约束 所 指定 的 那个 操作 数 载体 ， 
即 内 存 或 寄存 器 ， 如 果 是 寄存 器 约束 ， 汇 编 中 操作 的 并 不 是 C 变量 本 身 ， 而 是 C 变量 通过 值 传 递 到 汇编 
的 副本 。 举 个 例子 ， 比 如 : 


int na Ty Tb, S23 
asm("movl %%eax, %S%$ebx"::"a"(in a),"b"(in b)); 













































































































































































































































































































































































































































































































































































































































































































































































































































































声明 了 两 个 C 变量 in a 和 in_b, 在 汇编 代码 中 ,表面 上 看 是 把 变量 in_a 复制 到 了 变量 in_b 中 。 但 我 
们 知道 movl 指令 不 能 是 从 内 存 到 内 存 的 复制 ， 所 以 ， 您 一 定 知道 或 者 早已 经 知道 了 ，morvl 的 操作 数 是 C 
变量 in_a 和 in_b 通过 约束 指定 的 操作 数 载 体 ; 寄存 器 eax 和 ebx。 

内 存 约束 的 讨论 就 到 此 为 止 ， 咱 们 该 说 点 别 的 啦 。 

假设 ， 我 们 用 a 指定 寄存 器 为 eax， 我 们 在 汇编 代码 中 可 以 用 eax 作为 操作 数 。 但 有 时 我 们 对 寄存 器 
的 要 求 并 不 严格 ， 使 用 哪个 都 可 以 ， 所 以 我 们 可 以 用 r 来 告诉 gcc 蔡 我 们 自由 安排 。 于 是 问题 来 了 ， 由 于 
r 表示 可 以 用 6 个 寄存 器 之 一 ， 我 们 并 不 知道 gcc 为 操作 数 分 配 了 哪个 寄存 器 。 或 者 ， 我 们 对 操作 数 用 了 
内 存 约 束 ， 操 作 数 没有 名 称 可 以 引用 ， 这 时 候 我 们 在 汇编 代码 中 该 如 何 引 用 操作 数 呢 ? 

为 方便 对 操作 数 的 引用 ， 扩 展 内 联 汇编 提供 了 占 位 符 ， 它 的 作用 是 代表 约束 指定 的 操作 数 〈 寄 存 器 、 
内 存 、 立 即 数 )， 我 们 更 多 的 是 在 内 联 汇编 中 使 用 占 位 符 来 引用 操作 数 。 

占 位 符 分 为 序号 占 位 符 和 名 称 占 位 符 两 种 。 
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序号 占 位 符 是 对 在 output 和 input 中 的 操作 数 ， 按 照 它们 从 左 到 右 出 现 的 次 序 从 0 开始 编号 ， 一 直到 
9， 也 就 是 说 最 多 文 持 10 个 序号 占 位 符 。 

操作 数 用 在 assembly code 中 ， 引 用 它 的 格式 是 %0 一 9。 
在 操作 数 自身 的 序号 前 面 加 1 个 百 分 号 '%' 便 是 对 相应 操作 数 的 引用 。 一 定 要 切记 ， 占 位 符 指 代 约束 
所 对 应 的 操作 数 ， 也 就 是 在 汇编 中 的 操作 数 ， 并 不 是 圆 括号 中 的 C 变量 。 

咱们 还 是 拿 前 面 文件 reg_constraint.c 的 第 4 行 举例 , 该 行 指令 的 功能 是 将 ebx 与 eax 相 加 后 存储 到 eax。 
代码 如 下 : 










































































































































































| asm("addl %%ebx, %S%eax":"=a"(out sum):"a"(in a),"b"(in b)); 
A 
等 价 于 

| asm("addl $2, $1":"=a"(out sum):"a"(in a),"b"(in b)); 
其 中 : 





"=a"(out_sum) 序 号 为 0，%0 对 应 的 是 eax。 

"a"(in_a) 序 号 为 1，%1 对 应 的 是 eax。 

"b"(in_b) 序 号 为 2，%2 对 应 的 是 ebx。 

由 于 扩展 内 联 汇 编 中 的 占 位 符 要 有 前 级 %， 为 了 区 别 占 位 符 和 寄存 器 ， 只 好 在 寄存 器 前 用 两 个 % 做 前 
级 啦 ， 这 就 是 本 节 前 面 解释 在 扩展 内 联 汇编 中 寄存 器 前 面 要 有 两 个 % 做 前 级 的 原因 。 

占 位 符 所 表示 的 操作 数 默 认 情 况 下 为 32 位 数据 。 指 令 的 操作 数 大 小 并 不 一 致 ， 有 的 指令 操作 数 大 小 
是 32 位 ， 有 的 是 16 位 ， 有 的 是 8 位 。 当 为 这 些 指令 提供 操作 数 时 ， 编 译 器 会 自动 取 32 位 数据 的 低 16 位 
给 需要 16 位 操作 数 的 指令 ， 取 32 位 的 低 8 位 给 需要 8 位 操作 数 的 指令 。 由 于 32 位 数据 中 ,高 16 位 没 法 
直接 使 用 ， 所 以 对 于 16 位 操作 数 只 能 取 32 位 中 的 低 16 位 。 但 对 于 8 位 操作 数 就 不 一 样 了 ， 尽 管 默认 情 
况 下 会 用 低 8 位 (0~7 位 ) 作为 字 节 指令 的 操作 数 ， 但 32 位 数据 中 能 直接 使 用 的 字 节 不 只 是 低 8 位 ， 还 
有 第 8 一 15 位 ， 所 以 ， 对 于 字 节 指令 ，gcc 为 我 们 提供 了 改变 默认 操作 数 的 机 会 ， 我 们 可 以 自由 选择 是 
0~7 位 ， 还 是 8 一 15 位 。 这 么 说 有 点 抽象 ， 拿 32 位 的 寄存 器 eax 举例 ， 其 常用 的 部 分 是 eax、ax、al (高 
16 位 没 法 直接 用 )。 有 些 指令 的 操作 数 是 字 ， 所 以 用 ax 做 操作 数 即 可 。 有 些 指令 操作 数 是 字 节 ， 用 al 或 
ah 都 可 以 ， 默 认 情 况 下 会 将 al 当 作 操作 数 。 这 时 候 我 们 可 以 在 % 和 序号 之 间 插 入 字符 各 来 表示 操作 数 为 
ah 〈 第 8 一 15 位 )， 或 者 插入 字符 'b' 来 表示 操作 数 为 al (第 0~7 位)。 

不 知道 大 伙 儿 有 没有 稍 感 意外 ， 怎 么 又 冒 出 个 字符 br' 和 字符 'b'? 其 实 它 们 并 不 孤独 ， 它 们 的 “同类 ” 
很 多 呢 ， 这 是 属于 机 器 模式 中 的 内 容 ，gcc 允许 在 更 细 的 粒度 上 指定 数据 宽度 或 数据 的 某 部 分 ， 有 关机 器 
模式 的 内 容 还 是 不 少 的， 咱们 在 后 面 单独 说 吧 。 

下 面 先 给 大 家 演示 序号 占 位 符 操作 数 情况 ， 见 文件 reg4.c。 


文件 reg4.c 























































































































































































































































































































































































































































































































1 #include<stdio.h> 
2 void main() { 
3 int in a = 0x12345678, in b = 0; 


4 

asm("movw $1, %0;":"=m" (in b):"a"(in a)); 
6 printf("word in b is Ox%x\n", in b); 
7 
8 








in b=0; // 将 in_b 恢复 为 0, 避免 上 次 赋值 造成 混乱 











9 asm("movb $1, %0;":"=m" (in b):"a"(in a)); 
10 printf("low byte in b is Ox%x\n", in b); 

11 in b=0; // 将 in_b 恢复 为 0, 避免 上 次 赋值 造成 混乱 
12 

人 3 asm("movb %$hl, $0;":"=m" (in b):"a"(in a)); 
14 printf("high byte in b is Ox%x\n", in b); 
5: 桔 








第 5 行 是 movw 指令 ， 往 in_b 中 传 入 一 个 字 ， 默 认 会 传 入 低 字 ， 低 16 位 : 0x5678。 
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第 6 章 完善 内 核 
第 9 行 是 movb 指令 ， 往 in_b 中 传 入 一 个 字 节 ， 默 认 会 传 入 低 字 节 ， 低 8 位 : 0x78。 
第 13 行 同样 是 movb 指令 , 但 这 次 我 们 在 占 位 符 中 用 了 ', 所 以 in_b 中 应 该 是 in a 的 第 7 一 15 位 : 0x56。 
运行 结果 如 图 0-14 所 示 。 [work@localhost inline_ASM]$ ./reg4.bin 

于 序号 占 位 符 只 支持 10 个 操作 数 ， 虽 然 大 多 数 情况 下 都 够 用 了， [eg 

但 gcc 还 是 提供 了 一 种 不 受 个 数 限制 的 占 位 符 一 一 名 称 占 位 符 。 i ia ioc rm 
e 名 称 占 位 符 4 图 6-14 序号 占 位 符 运行 结果 
名 称 占 位 符 与 序号 占 位 符 不 同 ， 序 号 占 位 符 靠 本 身 出 现在 output 和 input 中 的 位 置 就 能 被 编译 器 辨识 







































































出 来 。 而 名 称 占 位 序 需要 在 output 和 input 中 把 操作 数 显 式 地 起 个 名 字 ， 它 用 这 样 的 格式 来 标识 操作 数 : 
[名 称 ] ”约束 名 ”(C 变量 ) 
这 样 ， 该 约束 对 应 的 汇编 操作 数 便 有 了 名 字 ， 在 assembly code 中 引用 操作 数 时 ， 采 用 %[ 名 称 ] 的 形式 

就 可 以 了 。 

这 次 我 们 用 8 位 除法 举例 ， 见 文件 reg5.c。 
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文件 reg5.c 
1 #include<stdio.n> 
2 void main() { 
3 int in a = 18, in b = 3, out = 0; 


4 asm("divb %S[divisor];movb %%al,$S[result]" \ 
5 : [result] "=m" (out) 

6 :"a"(in a), [divisor]j"m" (in b) \ 
7 ); 

8 printf("result is Sd\n",out); 

9 











我 们 的 目的 是 用 18 除 以 3， 最 后 打印 结果 是 6。 

在 第 6 行 ， 被 除数 in_a 通过 寄存 器 约束 a 存 入 寄存 器 eax， 除 数 in_b 通过 内 存 约束 m 被 gcc 将 自己 
的 内 存 地 址 传 给 汇编 做 操作 数 ， 咱 们 不 用 关心 此 内 存 地 址 是 哪里 。 为 了 引用 除数 所 在 的 内 存 ， 我 们 用 名 称 
占 位 符 标 识 它 ， 名 字 是 divisor。 这 样 汇 编 代 码 中 ， 第 4 行 除法 指令 divb 可 以 通过 %[divisor] 引 用 除数 所 在 
的 内 存 ， 进 行 除法 运算 。divb 是 8 位 除法 指令 ， 商 存放 在 寄存 器 al 中 ， 人 余数 存放 在 寄存 器 ah 中 。 所 以 第 
4 行 中 用 movb 指令 将 寄存 器 al 的 值 写 入 用 于 存储 结果 的 c 变量 out 的 地 址 中 。 运 行 结果 如 图 6-15 所 示 。 


2 
无 论 是 哪 种 占 位 符 , 它 都 是 指 代 C 变量 经 过 约束 后 、 由 gcc 分 配 的 对 ”和 于 人 
应 于 汇编 代码 中 的 操作 数 ， 和 C 变量 本 身 无 关 。 这 个 操作 数 就 是 通过 约 Rn 
束 名 所 指定 的 寄存 器 、 内 存 、 立 即 数 等 ， 最 终 编 译 器 要 将 占 位 符 转 换 成 这 三 种 操作 数 类 型 之 一 。 
在 约束 中 还 有 操作 数 类 型 修饰 符 ， 用 来 修饰 所 约束 的 操作 数 : 内存、 寄存器， 分别 在 ouput 和 input 
中 有 以 下 几 种 。 
在 output 中 有 以 下 3 种 。 
=: 表 示 操 作 数 是 只 写 , 相当 于 为 output 括号 中 的 C 变量 赋值 , 如 =a(c_var), 此 修饰 符 相 当 于 c_var=eax。 
+: 表示 操作 数 是 可 读 写 的 ， 告 诉 gcc 所 约束 的 寄存 器 或 内 存 先 被 读 入 ， 再 被 写 入 。 
信 : 表示 此 output 中 的 操作 数 要 独占 所 约束 (分 配 ) 的 寄存 器 ， 只 供 output 使 用 ， 任 何 input 中 所 分 
配 的 寄存 器 不 能 与 此 相同 。 注 意 ， 当 表达 式 中 有 多 个 修饰 符 时 ， 信 要 与 约束 名 挨 着 ， 不 能 分 隔 。 
在 input 中 : 
%: 该 操作 数 可 以 和 下 一 个 输入 操作 数 互 换 。 
一 般 情 况 下 ，input 中 的 C 变量 是 只 读 的 ，output 中 的 C 变量 是 只 写 的 。 
修饰 符 '=' 只 用 在 output 中 , 表示 C 变量 是 只 写 的 , 功能 相当 于 output 中 的 C 变量 = 约束 的 汇编 操作 数 ， 
如 ”=a”(c_var)， 相 当 于 c_var=eax 的 值 。 前 面 我 们 有 了 很 多 例子 ， 不 再 单独 演示 。 
修饰 符 '+' 也 只 用 在 output 中 , 但 它 具 备 读 、 写 的 属性 , 也 就 是 它 既 可 作为 输入 , 同时 也 可 以 作为 输出 
所 以 省 去 了 在 input 中 声明 约束 。 下 面 通过 实例 演示 ， 见 文件 reg6.c。 
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文件 reg6.ce 

1 #include <stdio.n> 
2 void main() { 

3 int in a = 1, inb = 2; 

4 asm("addl %%ebx, Sg%eax;":"ta" (in a):"b"(in b)); 
5 printf("in a is Sd\n", in a); 

6 1 

运行 结果 如 图 6-16 所 示 。 





另 一 个 +"' 常 用 的 场合 是 在 “rep+ 字 符 串 操作 指令 +cld 或 


jz Ar 吕 


std” 指 令 组 合 中 ， 原 因 是 在 字符 虽 
变 址 ， 保 存 数据 所 在 的 源 地 址 ， 在 
esi 要 作为 数据 源 地 址 ， 





















































操作 指令 
> Ar 口 


字符 中 








PF，esi 作为 源 
操作 指令 执行 前 ， 
所 以 当 作 参数 被 读 入 ， 成 了 输入 对 象 ， 在 























[work@localhost inline_ASM]$ ./reg6.bin 


ina is 3 
[work@localhost ;inline_ASM]S 目 


6-16 








冬 | 








修饰 符 + 演 示 


操作 指令 执行 后 ，esi 也 要 被 


A 





i A HH 


字符 昌 























更 新 为 下 一 个 数据 源 的 地 址 ， 此 时 esi 又 被 写 入 ， 成 了 输出 对 象 ， 所 以 esi 是 先 被 读 入 后 被 号 入 ， 非 常 
适合 用 + 来 修饰 。edi 作为 目的 变 址 ， 保 存 数 据 写 入 的 目的 地 址 。 在 字符 串 操作 指令 执行 前 ，edi 要 作 
为 数据 写 入 的 目的 地 址 ， 所 以 当 作 参 数 被 读 入 ， 成 了 输入 对 象 ， 在 字符 串 操作 指令 执行 后 ，edi 也 要 
被 更 新 为 下 一 个 数据 所 写 入 的 目的 地 址 ， 此 时 edi 又 被 号 入 ， 成 了 输出 对 象 ， 所 以 edi 也 是 先 被 读 入 ， 








后 被 写 入 ， 非 常 适合 用 '+' 来 修饰 。 


注意 ， 常 见 的 字符 





























和 edi 并 不 是 被 以 上 三 组 指令 同时 使 











ax 或 eax， 故 
到 edi。 以 上 字符 串 指令 


大 小 有 所 增 减 ， 至 于 是 增加 ， 还 是 减少 ， 要 取 雇 于 标志 寄存 器 中 的 方向 位 DF, 若 DF 为 0，esi 和 edi 都 自 




















只 涉及 到 esi。stos[bwd] 是 将 寄存 器 al、ax 或 eax 中 的 值 写 入 内 存 : 
每 执行 一 次 ， 所 涉及 到 的 源 变 址 寄存 器 esi 或 目的 变 址 寄存 器 edi 都 要 根 和 








操作 指令 有 movs[bwd]、ins[bwd] 和 outs[bwd]、lods[bwd] 和 stos[bwd]。 但 是 ，esi 
]， 只 有 movs[bwd] 才 同时 使 用 esi 和 edi， 它 是 把 esi 所 指向 的 地 址 
处 的 数据 复制 到 edi 所 指向 的 内 存 地 址 处 ,ins[bwd] 是 从 端口 
outs[fbwd] 是 把 内 存 中 的 源 数据 写 入 端口 ， 故 只 涉及 到 esi。lods[bwd] 是 提 



































读 入 数据 到 内 存 的 目的 地 址 , 故 只 涉及 到 edi。 
严 内 存 中 的 源 数据 加 载 到 寄存 器 al、 
的 目的 地 址 ， 故 只 涉及 





























时 操作 数 








































































































































































































































































































































































































增 ， 地 址 值 越 来 越 大 ， 否 则 DF 为 1，esi 和 edi 都 自 减 ， 地 址 值 越 来 越 小 。 这 些 字符 串 操 作 指令 在 读 写 数 
据 时 ，esi 和 edi 作为 它们 的 输入 操作 数 ， 执 行 完 成 后 ， 根 据 DF 位 的 情况 自 增 或 自 减 ， 这 时 又 作为 输出 。 
以 后 在 用 内 联 汇 编写 IO 端口 函数 时 会 用 到 ， 此 处 不 再 单独 举例 。 

修饰 符 '&' 用 来 表示 此 寄存 器 只 能 分 配给 output 中 的 某 个 C 变量 使 用 ,不 能 再 分 给 input 中 某 变 量 了 。 函数 
在 执行 完成 时 ， 返 回 值 会 存储 在 寄存 器 eax 中 。 通 常 我 们 会 将 返回 值 获取 到 C 变量 中 再 人 处理。 如 果 是 让 gcc 
自由 分 配 寄存 器 ，gcc 有 可 能 把 eax 分 配 出 去 男 做 他 用 ， 有 可 能 的 一 种 情况 是 先 调用 函数 ， 函 数 返 回 后 又 执行 
了 其 他 操作 ， 这 个 操作 中 用 到 了 gcc 分 配 的 eax 寄存 器 ， 于 是 函数 的 返回 值 便 被 破坏 ， 见 文件 reg7.c。 

文件 reg7.c 

1 #include <stdio.n> 

2 void main() { 

3 int ret cnt = 0, test = 0; 

4 char* fmt = "hello,world\n"; // 共 12 个 字符 

5 asm(" pushl %1; \ 

6 call printf; \ 

7 addl $4, %$esp; \ 

8 movl $6, %2"™ \ 

9 :"=a" (ret_cnt) \ 

10 sm (Fmt)} rr (test) \ 

11 ); 

12 printf("the number of bytes written is $d\n", ret cnt); 

13 } 

本 文件 的 功能 是 打印 字符 串 hello，world 回 车 ， 然 后 再 打印 出 printf 的 返回 值 ， 正 常情 况 下 printf 会 
返回 打印 的 字符 数 , ”hello，worldm” 共 12 个 字符 。 

第 4 行 定 义 了 字符 串 ”hello，worldvn” 的 指针 fmt， 这 是 给 printf 的 参数 ， 变 量 test 是 演示 用 的 ， 用 
它 来 干扰 返回 值 ， 没 实际 意义 。 

第 10 行 通过 内 存 约束 m 把 字符 串 指 针 fmt 传 给 了 汇编 代码 ,把 变量 test 用 寄存 器 约束 r+ 声明 ,由 gcc 
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第 6 章 完善 内 核 
分 配 寄存 器 。 























output 部 分 中 
程序 运行 结果 如 
程序 打印 出 了 两 行 , 第 一 行 是 正确 











在 第 7 行 


| 














第 5~6 行 调 朋 
屏幕 会 打印 h 





























着 的 





印 返 蕊 








the number of bytes written is 12。 


这 说 明 在 文件 reg7.c 的 第 8 行 ，%2 被 gcc 分 配 为 寄存 器 eax 了 。 














最 好 的 证 明 就 是 看 看 reg7.c 翻译 为 汇编 后 的 样子 ， 还 是 用 


文件 reg7.S。 


1 


#APP 


# 0 mn 2 


略 
6 
igh 
18 
19 
20 
2 
22 
23 
24 #NO_APP 
25 


… 略 


后 ， 





大 家 直接 看 #APP 和 #NO_APP 之 帮 
把 立即 数 6 movl 到 了 寄存 器 eax， 
这 时 候 修饰 符 '&' 就 派 上 | 











movl 





# 5 "reg7.c" 1 
pushl 20 (%esp); 


Seax, 





movl $0, 24(%esp) 
movil $0, 28 (Sesp) 
movl $.LC0, 20 (Sesp) 
movil 28 (Sesp), %eax 


24 (Sesp) 








的 , 但 第 二 行 我 们 


call printf; addl $4, 




















第 9 行 加 个 '&'， 修 改 后 的 文件 为 reg8.c。 
































有 printf。 将 第 4 行 定义 的 字符 串 指针 fmt 
ello，world 换行 。 在 此 ，eax 寄存 器 中 值 是 printf 的 返 世 
收 参 数 所 占 的 栈 空间 。 第 8 行 把 立即 数 6 传 入 了 gcc 为 变量 test 分 配 的 寄存 器 。 
的 c 变量 ret_cnt 获得 了 寄存 器 的 值 。 
图 6-17 所 示 。 














Ne 

















过 











文件 reg7.S 


// 变量 ret_cnt 
// 变量 test 


司 的 部 分 , 这 部 分 是 我 
这 破坏 了 printf 的 返 
场 了 ， 只 要 为 test 约束 的 寄存 器 不 要 和 ret_cnt 相同 就 行 ， 可 以 在 reg7.c 的 








原本 想 
值 ， 应 该 是 12, 而 不 是 6， 并 未 按照 我 们 的 预期 打印 


到 前 面 介绍 的 gcc-S 命令 ， 部 分 


Sesp;movl $6, 


过 压 栈 














值 ， 应 该 为 12。 








和 专 参 给 printf 函数 ， 在 第 6 行 执行 会 











在 第 9 行 ， 


[work@localhost inline_ASM]$ gcc -9 reg?.bin reg?.c 
[work@localhost inline_ASM]$ ./reg?.bin 


hello,world 





the number of bytes written is 6 





A 图 











Seax 


6-17 ”修饰 符 & 演 示 


a 


[L 编 代码 见 





门 的 内 联 汇编 代码 所 在 , 第 22 行 , 在 call printf 








TT 








值 。 







































































文件 reg8.c 

1 #include <stdio.h> 
2 void main() { 
3 int ret cnt = 0, test = 0; 
4 char* fmt = "hello,world\n"; // 共 12 个 字符 
5 asm(" pushl %1; \ 
6 Gall printf;s 六 
7 addl $4,%%esp; \ 
8 movl $6, %2" NN 
9 :"=&a" (ret _ cnt) \ 
0 mm" (fme) ev (testy NN 
1 ); 
2 printf("the number of bytes written is %d\n", ret cnt); 
3 下 
其 与 reg7 的 区 别 就 是 第 9 行 多 加 了 个 ' 必 。 编 译 运行 ， 结 果 如 图 6-18 所 示 。 
下 用 实例 演示 修饰 符 '%' 的 法 ， 顺便 再 把 前 面 立 即 数 约 [work@localhost inline_ASM]$ gcc -o reg8.bin reg8.c 
a RE [work@localhost inline_ASM]$ ./reg8.bin 
通用 约束 都 揉 到 一 起 演示 。 hello,world 

a . i the number of bytes written is 12 
修饰 符 '%' 表 示 input 中 的 输入 可 以 和 下 一 个 input 操作 数 。” 人 人 守候 












































互 换 ， 通 常用 在 计算 结果 与 操作 数 顺序 无 关 的 指令 中 ， 比 如 加 
法 和 乘法 ， 这 里 咱们 用 加 法 指令 举例 ， 见 文件 reg9.c。 


1 #include<stdio.n> 
2 void main() 
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文件 reg9.c 

















6-18 ”修饰 符 & 演 示 b 














6.4 内 联 汇编 
3 int ina = 1, sum = 0; 
4 asm("addl $1, S07 "maa (sum) "gLI" (2)7 "0 (in a)})3 
5 printf("sum is %d\n ", sum) ; 
5 
文件 reg9.c 演示 了 修饰 符 '%'、 立 即 数 约束 、 通 用 约束 的 用 法 ， 纯 粹 演示 ， 并 无 实际 意义 。 














第 4 行 input 部 分 中 的 "%I" (2)， 表 示 传 了 一 个 立即 数 2， 并 用 了 立即 数 约 束 I， 这 会 让 gcc 将 数字 2 变 成 


汇编 语言 中 的 立即 数 $2。 在 这 个 输入 中 ， 还 用 到 了 修饰 符 '%'， 
所 约束 的 操作 数 对 换 位 置 。 下 一 个 输入 是 "0”(in_a)， 前 面 用 
in a 的 操作 数 《〈 寄 存 器 或 内 存 ) 同 序号 0 对 应 的 汇编 操作 数 一 样 ， 也 就 是 ， 位 于 output 和 input 中 序号 为 0 


的 操作 数 〈 寄 存 器 或 内 存 ) 是 什么 ， 就 把 我 安排 成 什么 。 序 号 0 





- 旦 . 
里 








的 输入 ， 其 所 约束 























这 表示 约束 工 对 应 的 操作 数 可 以 和 下 一 个 输入 
了 通用 约束 '0， 这 表示 ， 要 求 gcc 把 分 配给 C 变 





















































是 "=a" (sum)， 约 束 a 将 寄 





存 器 eax 分 配给 变量 sgm， 所 以 in a 也 被 分 配 为 eax， 这 有 点 类 似 修饰 符 '+' 同 时 可 读 可 写 。 
光 看 我 这 么 说 似乎 还 不 够 ， 咱 们 眼见 为 识 ， 看 看 reg9.c 生成 的 汇编 代码 是 什么 ， 见 文件 reg9.S 。 




































































文件 reg9.S 

洛 
pe movl $1, 24(%esp) // in a 

14 movl $0, 28 (sesp) // sum 

5 movl 24 (Sesp), %eax // in_a 写 入 寄存 器 eax 

16 #APP 

17# 4 "reg9.c" 1 

18 addl $2, seax; // $2 对 应 input 中 的 "%I" (2) 

19#0 mn 2 

20 #NO_APP 

21 movl Seax, 28 (Sesp) // 由 于 "=a" (sum) 决定 将 eax 存 入 sum 

第 13 行 栈 中 24 (9%esp) 的 位 置 是 变量 in_a。 

第 14 行 栈 中 28 (%esp) 的 位 置 是 变量 sum。 

第 15 行 是 把 变量 in_a 写 入 寄存 器 eax， 这 与 文件 reg9.c 第 4 行 中 的 "=ar(sum) 和 "0"Gin 可 是 吻合 的 ， 即 

in a 二 Sum 所 用 的 寄存 器 是 一 样 的 ， 都 是 CaXo [work@localhost inline_ASM]$ gcc -o reg9.bin reg9.c 

A ] 一 名 和 和 a 、 3 [work@localhost inline_ASM]$ ./ .bi 

第 21 行将 第 18 行 的 计算 结果 写 入 到 sum 变量 中 。 EE 区 















































好 啦 ， 该 说 的 都 说 啦 ， 运 行 结 果 如 图 6-19 所 示 。 

















[work@localhost ;inline_ASM]S 目 
4 图 6-19 ”修饰 符 % 和 约束 


的 





















































在 最 后 ， 我 们 说 下 扩展 内 联 汇 编 中 的 
clobber/modify 部 分 ， 这 部 分 用 于 通知 gcc， 我 们 修改 了 哪些 寄存 器 或 内 存 。 

由 于 我 们 在 C 程序 中 藤 入 了 汇编 代码 ， 这 必然 会 造成 一 些 资源 的 破坏 ， 本 来 咏 ， 人 家 C 代码 翻译 后 
也 要 用 到 寄存 器 , 突然 来 了 一 堆 抢 寄存 器 用 的 汇编 指令 , 这 肯定 会 使 gcc 重新 为 C 代码 安排 寄存 器 等 资源 。 
为 了 解决 资源 冲突 ， 我 们 得 让 gcc 知道 ， 我 们 改变 了 哪些 寄存 器 或 内 存 ， 这 样 gcc 才能 合理 安排 。 

如 果 在 output 和 input 中 通过 寄存 器 约束 指定 了 寄存 器 ，gcc 必然 会 知道 这 些 寄存 器 会 被 修改 ， 所 以 ， 









































需要 在 clobber/modify 中 通知 的 寄存 器 肯定 不 是 在 output 和 input 中 出 现 过 的 。 


也 许 您 会 认为 ， 牵 扯 到 








告诉 编译 器 吗 ? 编译 器 不 会 自 
把 握 知道 哪些 资源 会 被 修改 。 在 “ 明 处 ”的 指令 确 








已 扫 

















器 被 +1 了 ， 这 种 明显 的 改变 gcc 当然 能 扫 


一 个 函数 ， 该 函数 内 部 会 修改 一 些 资源 , 或 者 该 区 








侈 改 寄存 器 或 内 存 的 部 分 ， 只 差 assembly code 没 说 了 ， 这 部 分 还 需要 咱们 明确 
汇编 指令 ? 用 到 了 哪些 寄存 器 它 还 不 知道 吗 ? 是 的 ，gcc 还 

















真 不 是 很 有 
实 可 以 检测 到 所 修改 的 资源 ， 比 如 incl %9%eax，eax 寄存 































































































出 来 。 可 “ 瞳 处 ”的 指令 就 无 法 保证 了 ， 比 如 在 汇编 中 调用 了 
数 中 又 调用 了 其 他 函数 ， 这 保 不 准 在 哪 一 层 调用 有 修改 资 











源 的 代码 , 简直 无 法 跟踪 。 所 以 必须 要 人 为 显 式 地 告诉 gcc 我们 动 了 哪些 资源 , 这 个 资源 就 是 寄存 器 和 内 存 。 





怎样 通知 gcc 我 们 修改 了 哪些 寄存 器 ? 








这 个 很 简单 ， 只 要 在 clobber/modify 部 分 明确 写 出 来 就 行 了 ， 记 得 要 用 双 引 号 把 寄存 器 名 称 引 起 来 ， 
' 分 隔 ， 这 里 的 寄存 器 不 用 再 加 两 个 '% 啦 ， 只 写 名 称 即 可 ， 如 : 


多 个 寄存 器 之 | 


| asm("mov1 


司 用 到 号 


S$%eax, 





$0;movl %S%eax, ssebx":"=m" (ret_value): 














: "bx") 








大 家 看 ， 虽 然 修改 的 是 寄存 器 ebx， 但 只 要 在 clobber/modify 声明 bx 就 可 以 了 ， 甚 至 可 以 声明 al。 原 





因 是 即使 寄存 器 只 变动 


部 分 ， 它 的 整体 也 会 全 跟着 受 影响 ， 所 以 在 clobber/modify : 














声明 寄存 器 时 » 可 
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以 用 低 8 位 名 称 、 低 


存 器 也 是 一 样 的 ， 不 


如 果 我 们 的 内 联 
如 果 我 们 修改 J 
如 果 我 们 在 output 中 使 用 了 内 存 约束 ，gcc 自然 会 得 到 
门 就 需要 用 ”memory” 告 诉 gcc 啦 。 

举 个 例子 , 还 记得 之 前 咱们 所 说 的 复 
| esi 和 edi 的 不 断 变 化 使 源 数 所 


output 中 ， 我 1 





通过 指名 





16 位 名 称 或 全 32 位 名 称 ， 如 ”al”/”ax”/”eax” 都 是 指 eax 寄存 器 ， 








再 举例 。 





[ 编 代码 修改 了 标志 寄存 器 eflags ! 














内 存 ， 我 们 需要 在 clobber/modify 中 ” 

































































的 标志 位 ， 同 样 需 要 好 
memory” 声 


那 块 内 存 被 修改 。 但 
































中 被 复制 到 新 
































出 大 块 数据 的 三 剑客 指令 吗 ? 
的 地 ， 后 来 数据 被 复 








如 果 被 修改 的 内 容 并 未 在 
































E clobber/modify 中 用 ”cc” 声 明 。 








指令 movsd 配合 cld 和 rep， 

















判 到 了 哪 旦 








gcc 可 就 不 知道 了 ， 引 E 
另外 一 个 用 ”memory” 声 明 的 原 
内 存 相对 寄存 器 来 说 还 是 比较 慢 上 


























得 主动 用 ”memory” 坦 白 才 行 




















行 中 才 会 出 现 变量 的 值 被 改变 ， 也 就 是 出 现 了 内 存 变 化 的 情况 。 您 想 ， 如 果 程 序 在 编译 阶段 衣 






































行为 的 话 ， 那 还 运行 程序 干吗 ， 直 





























的 ， gcc 为 了 提速 ， 编 译 中 有 时 会 把 内 存 中 的 数 所 


就 是 清除 寄存 器 缓存 。 


已 ， 修 改 了 哪些 内 存 ， 











缓存 到 寄存 器 ， 



















































































了 ， 编 译 器 编译 程序 时 ， 将 变量 的 值 绥 


















































中 的 缓存 还 是 旧 数 据 ， 运 行 结果 肯定 训 





tC 错 了 。 于 是 ，gcc 也 为 我 们 提供 了 选项 ， 





后 的 处 理 都 是 直接 读 取 寄存 器 。 编 译 过 程 中 编译 器 无 法 检测 到 内 存 的 变化 , 只 有 编译 出 来 的 程序 在 实际 运 


















































能 检测 程序 


接 在 该 程序 的 编译 阶段 输出 程序 运行 结果 不 就 完了 吗 ^ ^。 于 是 问题 来 
存 到 寄存 器 。 程 序 在 运行 时 ， 当 变量 所 在 的 内 存 有 变化 时 ， 寄 存 器 
j 来 设置 是 否 将 变量 缓存 
































到 寄存 器 中 ， 这 个 选项 就 是 C 语言 中 的 关键 字 volatile， 它 表示 该 变量 是 不 稳定 的 ， 容 易 被 改变 ， 这 样 gcc 





就 不 会 将 其 缓存 到 寄存 器 。 注 意 啦 ， 这 个 关键 字 并 不 是 内 联 汇编 asm 后 面 的 可 选项 [volatile]， 
一 样 的 ， 但 汇编 中 的 volatile 是 定义 的 宏 #qdefine _volatile _ volatile， 在 乡 










































































有 译 前 的 预 处 得 











阶段， 汇编 中 的 


volatile 最 终 会 变 成 ”volatile _ ， 这 和 C 语言 中 的 volatile 不 冲突 。 用 C 语言 中 的 volatile 定义 的 变量 ， 编 
































只 要 编译 器 知道 变量 所 在 的 内 存 有 变化 ， 它 就 会 放弃 寄存 器 缓存 ， 到 内 存 中 取 数 据 。 















































利用 这 个 原 理 


， 不 管 变量 的 值 是 否 会 


会 被 编译 器 缓存 到 


希望 读 取 到 内 存 中 最 新 的 数据 时 ， 我 人 














知 编译 器 变量 所 在 
名 hh 











译 器 就 不 会 将 该 变量 的 值 缓 存 到 寄存 器 中 ， 每 次 访问 该 变量 时 都 会 老 老 实 实 地 从 内 存 中 获取 。 也 就 是 说 ， 













































































中 用 volatile 去 4 


6.4.5 扩展 内 联 汇编 之 机 器 模式 简介 











所 定义 的 变量 ， 但 








下 面 介 绍 下 GCC 中 的 机 器 模式 。 











我 知道 ， 如 果 从 未 接触 过 机 器 模式 这 方 
它 的 概念 。 所 以 ， 咱 们 循序 渐进 




























































































在 前 面 介 绍 序号 占 位 符 的 时 候 ， 嘎 




















引用 了 字符 h 和 字符 b， 它 们 分 别 ) 









































掉 内 容 ， 无 论 我 再 怎样 挥舞 文字 ， 都 无 法 轻易 地 让 大 伙 儿 明 






































ah 和 al。 不 过 这 次 我 不 想 指定 ah 或 al 啦 ， 如 果 我 想 指定 ax 或 eax， 人 怎么 做 ? 为 了 回答 这 个 问题 ， 咱 们 再 
举 个 例子 ， 见 文件 mach mode warn.c。 








1 #include<stdio.hn> 
2 void main() { 


慢 慢 引出 它 的 来 历 ， 通 过 实例 慢 慢 看 。 


寄存 器 中 ， 当 我 们 需要 绕 过 寄存 器 缓存 ， 也 就 是 
门 就 可 以 在 内 联 汇编 中 的 clobber/modify 部 分 用 ” 
的 内 存 数 据 变 啦 ， 这 样 它 就 会 从 内 存 再 读 取 一 次 新 数据 啦 。 当 然 我 们 也 可 以 在 C 代码 
多 了 就 有 些 麻 烦 了， 所 以 还 是 用 ”memory” 来 声明 更 加 方便 。 


memory” 声 明 ， 通 





























们 已 经 引出 了 机 器 模式 的 内 容 : 为 了 指定 寄存 器 ! 








的 某 部 分 ， 咱 们 


















































文件 mach_mode warn.c 


3 int in a = 0x1234, in b = 0; 

4 asm("movw $1, %0":"=m" (in b):"a"(in a)); 
5 printf("in b now is Ox%x\n", in b); 

6 
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这 段 代 码 很 简单 ， 目 的 是 把 in_a 的 低 16 位 复制 到 in_b 中 。 
第 4 行 中 ， 变 量 in a 的 约束 是 a， 这 表示 





















































j 来 指定 寄存 器 的 第 8 一 15 位 和 低 8 位 ， 这 只 是 机 器 模式 的 用 途 之 
比如 寄存 器 约束 a 表示 寄存 器 a、ax、eax， 可 以 在 序号 占 位 符 中 增加 前 级 字符 h 和 b 来 引用 寄存 器 
































gcc 把 in_a 的 值 分 配给 寄存 器 al、ax 或 eax。 这 很 模糊 ， 

















































































































































































































































































































到 底 gcc 把 in_a 的 值 分 配给 谁 了 呢 ? 之 后 的 movw 指令 也 很 模糊 ， 我 们 只 能 这 样 理 解 : movw 指令 将 al、ax 
或 eax 中 的 2 个 字 节 复制 到 in_b 所 在 的 内 存 中 (当然 al 中 不 可 能 有 2 个 字 节 的 数据 )。 有 没有 疑问 ，movw 是 
移动 2 个 字 节 的 数据 ， 那 movw 的 源 操 作 数 到 底 是 不 是 ax? 编译 一 下 就 知道 了 。 编 译 过 程 如 图 6-20 所 示 。 

[work@localhost inline_ASM]$ gcc -9 mach_mode_warn.bin mach_mode_warn.c 

mach_mode_warn.c: Assembler messages: 

mach_mode_warn.c:4: Warning: using ‘%ax' instead of ‘%eax' due to suffix 

[work@localhost inLine_ASM]$ 人 

到 6-20 机 器 模式 举例 

编译 器 发 出 了 和 警告， 大意 是 由 于 w 前 级 ， 用 寄存 器 ax 代替 eax。 

大 家 应 该 注意 到 了 图 右 下 部 分 的 框框 ， 里面 有 个 字符 w， 实 际 代码 中 我 们 并 没有 添加 w， 这 说 明 默 认 
情况 下 ，gcc 用 占 位 符 引 用 操作 数 的 时 候 ， 根 据 指令 操作 数 大 小 的 不 同 ， 添 加 了 适当 的 前 级 。 验 证 一 下 这 
个 想法 ， 将 上 面 第 4 行 的 代码 中 的 %1， 修 改 为 %w1， 结 果 为 文件 mach _mode.c。 

文件 mach_mode.c 

1 #include<stdio.h> 

2 void main() { 

车 int in a = 0x1234, in b = 0; 

4 asm("movw %Swl, $0":"=m" (in b):"a" (in a)); 

号 printf("in b now is 0xgsxNn"，， in b); 

6 } 

这 次 的 编译 过 程 未 报 任何 错误 ， 运 行 结果 如 图 6-21 所 示 。 

显然 结果 是 正确 的 。 这 里 的 字符 w 是 怎么 回 事 呢 ? 这 是 我 们 新 接触 的 另 一 个 控制 字符 ， 听 兄弟 我 慢 
惕 1 省 [work@localhost inline_ASM]$ ./mach_mode.bin 
慢 道 来 吧 。 a in_b now is ox1234 . 

w 和 h、b 一 样 ， 都 是 操作 码 ， 用 来 指 代 某 种 机 器 模式 类 型 。 Loni sealhost nine 















































民 i Re 
咱们 看 看 源 文件 中 的 解释 吧 ， 看 官方 的 说 明 更 权威 ， 以 下 内 容 和 
村 文件 gcc-4.9.0/gcc/config/ 1386/i386.c。 
文件 i386.c 
行 号 操作 码 描 述 
14741 /* Meaning of CODE: 
14742 L,W,B,Q,S,T -- print the opcode suffix for specified size of operand. 
14743 C -- print opcode suffix for set/cmov insn. 
14744 c -- like C, but print reversed condition 
14745 F,f -- likewise, but for floating-point. 
14746 O -— if HAVE AS IX86 CMOV_ SUN_ SYNTAX, expand to "Ww.", "1." or "gq.", 
14747 otherwise nothing 
14748 R -- print embeded rounding and sae. 
14749 r -—- print only sae. 
14750 z -- print the opcode suffix for the size of the current operand. 
14751 2 -- likewise, with special suffixes for x87 instructions. 
14752 * -— print a star (in certain assembler syntax) 
14753 A -- print an absolute memory reference. 
14754 E -- print address with DImode register names if TARGET 64BIT. 
14755 w -- print the operand as if it's a "word" (HIimode) even if it isn't. 
14756 s -—- print a shift double count, followed by the assemblers argument 
14757 delimiter. 
14758 b -- print the QImode name of the register for the indicated operand . 
14759 $b0 would print %al if operands[0] is reg 0. 
14760 w -— likewise, print the HImode name of the register. 
14761 k -—- likewise, print the SImode name of the register. 
14762 q -- likewise, print the DImode name of the register. 
14763 x -— likewise, Print the V4SFmode name of the register. 
14764 t -—- likewise, print the V8SFmode name of the register. 
14765 g -- likewise, print the VléSFmode name of the register. 
14766 h -- print the QImode name for a "high" register, either ah, bh, ch or dh. 
14767 y -- print "st(0)" instead of "st" as a register. 
14768 d -- print duplicated register operand for AVX instruction. 
14769 D -- print condition for SSE cmp instruction. 
14770 P == iE PIC; Brint an @PLIL suffix;, 
14771 p -- print raw Symbol name. 
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第 6 章 完善 内 核 
14772 X -- don't print any sort of PIC '‘'@' suffix for a symbol. 
14773 & -- print some in-use local-dynamic symbol name. 





在 文件 1386.c 的 第 14755 行 ， 这 就 是 操作 码 w 的 意义 ， 它 表示 : 即使 操作 数 不 是 一 个 字 (2 字 节 ) 那 
样 的 大 小 ， 也 要 像 一 个 字 那 样 把 它 打印 出 来 。 简 而 言 之 就 是 不 管 操 作 数 多 少 个 字 节 ， 只 打印 2 字 节 。 

其 中 值得 一 提 的 是 对 于 操作 码 w 的 解释 中 包含 了 "word" (HImode)， 意 思 是 说 这 个 陌生 的 词 “HImode” 
等 同 于 word， 即 2 字 节 。 在 其 他 的 操作 码 说 明 中 ， 也 有 SImode 或 QImode 等 ， 这 些 都 是 什么 呢 ? 

以 上 以 mode 结尾 的 这 些 词 实际 上 就 是 具体 的 机 器 模式 名 称 。 

什么 是 机 器 模式 ?咱们 还 是 看 官方 文件 是 怎么 解释 的 ,在 GCC 源 文件 gcc/machmode.def 中 有 这 样 一 句 说 到 ; 

A machine mode specifies a size and format of dataat the machine level. 

机 器 模式 用 来 在 机 器 层面 上 指定 数据 的 大 小 及 格式 。 

用 我 自己 的 理解 是 GCC 支持 内 联 汇编 ， 由 于 各 种 约束 均 不 能 确切 地 表达 具体 的 操作 数 对 象 ， 所 以 引 
用 了 机 器 模式 ， 用 来 从 更 细 的 粒度 上 描述 数据 对 象 的 大 小 及 其 指定 部 分 。 

这 些 模 式 定义 在 哪里 ? 我 能 看 到 吗 ? 
在 文件 gcc/machmode.def 中 有 这 样 一 句 话 : This file defines only those modes which are of use on almost 
allmachines. Other modes can be defined in the target-specificmode definition file, config/ ARCH/ARCH-modes.def。 

GCC 根据 不 同 的 硬件 平台 ， 将 机 器 模式 定义 在 多 个 文件 中 ， 其 中 所 有 平台 都 通用 的 机 器 模式 定义 在 
gcc/machmode.def 文件 中 ， 其 他 与 具体 平台 相关 的 机 器 模式 定义 在 自己 的 平台 路 径 下 ， 它 们 在 config/ 平 台 
名 称 /平台 名 称 -modes.def 文件 中 ， 如 config/i386/i386-modes.def。 

机 器 模式 是 用 枚 举 类 型 enum machine_mode 来 定义 的 ， 而 实际 上 ， 以 上 所 说 的 所 有 .def 文件 中 并 没有 
现成 的 机 器 模式 定义 。 原 因 是 这 样 的 ， 各 平台 下 的 .def 文件 需要 和 machmode.def 一 起 通过 后 端 工具 
genmodes 处 理 之 后 才能 生成 完整 的 机 器 模式 数据 ， 由 于 小 弟 我 对 这 方面 了 解 不 多 ， 也 只 能 晴 晓 点 水 解释 
到 此 ， 有 关 此 方面 的 内 容 ， 有 兴趣 的 同学 请 自行 研究 。 

不 过 ， 为 满足 大 伙 儿 的 好 奇 心 ， 我 还 是 找 了 个 机 器 模式 定义 的 样 例 给 大 伙 儿 ， 图 6-22 所 示 内 容 来 自 
文件 gcc-4.9.0/gcc/testsuite/gcc.dg/vectpr48765.c。 


10 enum machine_mode 

1 

12 VOIDmode, QImode, HImode, PSImode, SImode, PDImode, Dimode, TImode, OImode, 

13 QFmode, HFmode, TQFmode, SFmode, DFmode, XFmode, TFmode, SCmode, DCmode, 
14 XCmode, TCmode, CQlmode, CHImode, CSImode, CDImode, CTImode, COImode, 

15 BLKmode, CCmode, CCEVENmode, MAX_MACHINE_MODE 

16}; 
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4 图 6-22 ”机 器 模式 枚 举 定义 
机 器 模式 名 称 的 结构 大 臻 是 这 样 的 ， 数据 大 小 + 数据 类 型 Htmode， 比 如 QImode， 表 示 QuarterInteger， 
即 四 分 之 一 整 型 。QFmode 表示 QuarterFloating， 即 四 分 之 一 浮 点 型 。 
咱们 只 用 到 了 和 整数 相关 的 机 器 模式 ， 所 以 摘 几 个 看 看 它们 的 意义 ， 见 表 6-10。 






















































































































































































表 6-10 整 型 机 器 模式 
机 器 模式 名 称 描 述 
BImode Bit， 即 比特 模式， 表示 单个 比特 
QImode QuarterInteger， 即 四 分 之 一 整 型 模式 ， 表 示 1 个 字 节 的 整数 
HImode HalfImteger， 即 半 整 型 模式 ， 表 示 2 个 字 节 的 整数 
SImode Single Integer， 即 单 整 型 模式 ， 表 示 4 个 字 节 的 整数 
PSImode Partial Single Integer， 即 部 分 单 整 型 模式 ， 表 示 4 字 节 整 型 数 ， 但 只 使 用 了 部 分 字 节 
DImode Double Integer， 即 双 倍 整 型 模式 ， 表 示 8 字 节 的 整数 
PDImode Partial Double Integer， 即 部 分 双 倍 整 型 模式 ， 表 示 8 字 节 的 整 型 数 ， 但 只 使 用 了 部 分 字 节 
TImode Tetra Integer， 即 四 倍 整 型 模式 ， 表 示 16 字 节 的 整数 
OImode Octa Integer， 即 八 倍 整 型 模式 ， 表 示 32 字 节 的 整数 
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了 解 了 机 器 模式 后 ， 咱 们 再 返回 去 看 文件 86.c 中 的 操作 码 。 实 际 上 操作 码 就 是 指定 操作 数 为 寄存 器 
中 的 哪个 部 分 。 咱 们 这 里 不 用 关注 太 多 ， 初 步 了 解 h、b、w、k 这 几 个 操作 码 就 够 了 ， 以 后 有 需要 时 再 说 。 

寄存 器 按 是 否 可 单独 使 用 ， 可 分 成 几 个 部 分 ， 拿 eax 举例 。 

是 Wi 4 字 节 : al 

。 高 部 分 的 一 字 节 : ah 

@ Se 节 部 分 : ax 

。 四 字 节 部 分 : eax 

h -输出 寄存 器 高 位 部 分 中 的 那 一 字 节 对 应 的 寄存 器 名 称 ， 如 ah、bh、ch、dh。 

b -输出 寄存 器 中 低 部 分 1 字 节 对 应 的 名 称 ， 如 al、bl、cl、dl。 

w -输出 寄存 器 中 大 小 为 2 个 字 节 对 应 的 部 分 ， 如 ax、bx、cx、dx。 

k -输出 寄存 器 的 四 字 节 部 分 ， 如 eax、ebx、ecx、edx。 

对 目前 咱们 的 应 以 上 几 个 操作 码 够 用 了 ， 机 器 模式 这 块 到 这 就 结束 了 。 
在 机 器 模式 介绍 完 后 ， 个 人 觉得 有 关内 联 汇编 这 块 已 经 说 得 不 少 了 ,足够 应 付 今后 的 应 用 了 ， 本 节 到 
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她 知道 这 是 我 最 喜欢 的 生活 。 每 
。 当 我 们 抱 着 最 爱 吃 的 各 种 饼干 、 



























































就 在 我 写本 书 的 时 候 ， 我 女 朋 友 王 小 兔 问 我 要 不 要 跟 她 一 起 去 超市 ， 
次 和 她 一 起 选 超 市 都 是 一 种 享受 , 让 我 更 加 热爱 生活 , 这 使 我 觉得 很 地 福 
巧 元 力 ， 骑 着 单车 从 超市 回来 之 后 ， 我 又 开始 打开 电脑 ， 继 续 写 书 了 。 

在 我 处 理 完 逛 超市 这 一 “优先 级 更 高 ”的 事情 后 ， 还 能 回 
呢 。 这 就 是 “中 断 ” 在 生活 中 的 实例 之 一 。 

这 一 他， 我 们 将 讲述 中 断 。 





多 中 断 是 什么 ， 为 什么 要 有 中 断 
























































来 继续 写 书 ， 这 说 明 这 伯 





F 事 我 的 脑子 里 记 着 
























































































































































































































































































































































































































































中 断 是 什么 ? 这 里 所 说 的 是 发 生 在 计算 机 世界 里 的 中 断 。 
于 CPU 获知 了 计算 机 中 发 生 的 某 些 事 ，CPU 暂停 正在 执行 的 程序 ， 转 而 去 执行 处 理 该 事件 的 程序 ， 

当 这 段 程序 执行 完毕 后 ，CPU 继续 执行 刚才 的 程序 。 整 个 过 程 称 为 中 断 处 理 ， 也 称 为 中 断 。 

以 上 只 是 从 宏观 上 描述 中 断 从 发 生 、 处 理 到 结束 的 过 程 ， 这 对 已 经 懂 了 的 同学 帮助 不 大 ， 对 于 不 介 的 
同学 ， 仅 仅 是 获得 了 浅 表 的 认识 。 是 的 ， 我 这 样 描述 中 断 还 远 远 不 够 。 

通俗 地 说 , 中 断 的 意思 是 打 断 正在 做 的 事 , 本 节 开 头 的 和 逛 超市 属于 中 断 中 最 美好 的 一 种 , 不 过 你 懂 的 ， 
大 部 分 的 中 断 并 不 是 那么 美 。 

咱们 平时 工作 中 , 经 常 被 各 种 邮件 、 会 议 以 及 各 种 通信 工具 打 断 ,基本 上 “正经 事 ”都 在 时 间 碎 片 中 完成 。 
如 果 戳 中 了 您 的 泪 点 也 不 要 急 着 共鸣 ， 哈 哈 ， 因 为 还 可 以 再 难过 一 点 ， 有 时 候 这 种 中 断 还 是 嵌 套 的 。 比 如 正在 
忙 着 干 活 ， 同 一 个 部 门 的 PM 同学 过 来 说 赶紧 开会 ， 于 是 被 “ 强 拉 硬 搜 ” 进 会 议 室 ， 开 会 过 程 中 ， 突 然 男 一 个 
PM 辣 进 来 说 ， 找 你 半天 了 ， 赶 紧 跟 我 先 去 开 男 外 一 个 会 ， 于 是 再 次 被 “ 喀 无 人 性 ”地 拖 进 男 外 一 个 会 议 室 。 

这 种 “中 断 ” 似乎 非常 影响 咀 们 的 工作 效率 ， 至 少 在 一 些 同学 的 上 腿 里 ， 这 种 中 断 是 效率 极 低 的 。 至 
于 效率 高 ， 还 是 低 ， 这 取决 于 您 看 问题 的 角度 了 ， 其 实 它 只 是 影响 了 大 家 眼 里 做 “正经 事 ” 的 效率 ， 这 些 
“正经 事 ” 大 多 数 是 自己 要 完成 的 工作 ， 而 打上 断 我 们 的 各 种 事情 ， 表 面 上 看 是 别人 的 工作 ， 但 其 实 里 面 或 
多 或 少 都 有 自己 的 工作 ， 要 不 干吗 不 找 别 人 开会 ， 淡 定 淡定 。 虽 然 自己 手中 的 工作 被 滞后 了 ， 但 由 于 及 时 





参与 了 会 议 ，PM 





有 很 大 提升 。 不 过 话说 












































同学 的 了 
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涯 沦落 人 啊 。 这 上 





向 或 斗 在 一 线 的 运 维 工 程 师 说 一 声 ， 兄 弟 们 辛苦 了 。 









































[ 作 又 能 继续 向 下 进行 了 ， 整 个 部 门 的 业务 都 同步 发 
来 ， 这 种 过 多 的 “中 断 ”， 对 您 这 个 人 的 利用 率 还 是 蛮 高 的 ， 我 只 能 说 ， 同 是 天 








展 ， 这 样 就 使 整体 的 效率 都 
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里 



























































通过 上 面 的 例子 ， 我 们 了 解 到 ， 个 人 抽出 一 些 时 间 ， 可 以 使 整体 的 工作 效率 提升 ， 也 就 是 说 ， 中 断 
然 是 打 断 的 意思 ， 但 它 恰 恰 却 是 提升 整个 系统 利用 率 最 有 效 的 方式 ， 没 有 2 
并 发 运行 。 这 里 解释 下 并 发 和 并 行 的 区 别 : 并 发 指 的 是 单位 时 间 内 的 累积 工作 和 
这 是 指 一 秒 内 累积 的 请 求 量 总 和 为 100 个 请 求 ， 属 于 并 发 。 并 行 是 指 真 正 同 时 进行 的 工人 


100 个 请 求 量 是 指 他 
个 开会 的 例子 就 是 把 整个 间 
人 否认， 一会儿 做 这 个 一 会 儿 做 天 
举例 





不 再 拿 生 沪 








方式 、 轮 流 调度 到 


， 因 为 有 了 中 断 ， 系 统 才能 


















































EE， 比 如 每 秒 并 发 数 是 100， 






























































量 ， 比 如 并 行 


EE 


























2 

















Pp 门 当 作 一 个 系统 ， 自 己 当成 了 CPU， 
个 ，CPU 确实 好 累 ， 悄 悄 地 表达 对 CPU 


们 说 说 具体 的 计算 机 吧 。 我 们 平时 使 
























































了 ,hn 





E 意 瞬间 都 有 100 个 请 求 在 发 生 ， 所 以 单 核 CPU 谈 并 发 ， 多 核 CPU 谈 并 行 。 刚 说 的 这 
虽然 整体 工作 效率 得 到 提升 了 ， 但 不 可 

















的 感激 。 
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CPU 上 运行 。 不 过 话 又 说 








的 计算 机 都 只 有 一 个 CPU， 即 使 是 
其 CPU 数量 也 不 是 无 限 多 的 ， 我 见 过 的 最 多 是 24 个 核心 。 如 果 只 有 一 个 CPU 的 话 ， 任 何 程序 都 必须 以 
来 了 ， 即 使 是 有 多 个 CPU， 如 果 任 务 在 执行 期 间 要 求 保 订 


服务 器 ， 
行 的 
:严格 的 
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依然 
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然 只 会 占用 
多 个 CPU 上 挪 来 
不 夸 引 
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是 “processor id”( 可 
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还 能 


是 0 一 核心 数 -1， 也 












































个 CPU, 任 
去 ， 
也 说 ， 如 果 系 统 中 只 有 这 
果 您 对 进程 任意 瞬间 在 哪个 核 ， 














晶 上 品 


F 上 运行， 只 是 相 




















司 任务 都 只 大 
说 一 会 儿 该 人 


一 个 核心 ] 

















F 芒 瞬 上 前 
也 就 是 

















民 据 CPU 的 负载 情 
E 务 在 这 个 CPU 上 运行 , 一 会 儿 可 能 





个 进程 无 法 拆 分 成 多 个 并 行 的 部 分 (其 实 这 是 大 部 分 程序 的 情况 ， 很 普 裔 )， 这 种 情况 下 该 进程 






























































部， 1 




















周 度 器 会 将 该 任务 


就 跑 到 另 一 个 CPU 上 运行 了 ， 

















个 任务 的 话 ， 任 意 





时 间 只 有 














心 上 运 行 感 兴 
以 通过 man proc 查看 这 方面 的 帮助 )， 它 表示 



































就 是 进程 在 习 
方式 查看 该 字段 ， 比 较 方便 。 如 果 还 嫌 麻 烦 的 话 还 可 以 
进程 名 。 然 而 ， 在 CPU 外 的 设备 是 独立 于 CPU 的 ， 它 与 CPU 是 同步 运行 




















:进程 
一 瞬间 是 在 哪个 CPU 上 执行 ， 利 用 


j ps 命令 查看 ， 元 
























































个 CPU 在 忙 ， 




















其 他 几 个 核心 还 是 空闲 


的 。 如 














awkK、 


的 话 ， 在 Linux 中 文件 “/proc/ 进 程 pid/stat” 第 一 行 的 第 39 
本 次 执行 








J 时 最 





后 所 在 的 CPU 编号 ， 编 


个 字段 






































perl 等 工 


都 可 以 直接 用 命令 行 的 







































































参数 是 : ps -eo pid，args，Ppsrlgrep 目标 
的 ， 所 以 ，CPU 抽出 一 点 时 间 来 处 理 























断 ， 外 部 设备 就 可 以 同 CPU 并 行 工作 了 ， 整 个 计算 机 系统 可 以 大 幅度 地 提升 效率 。 
正 是 因为 有 了 中 断 ， 我 们 才 可 以 “同时 ”享受 计算 机 的 多 种 服务 。 
比如 ， 现 在 的 电影 体积 特别 大 ， 为 节省 空间 ， 我 们 通常 是 把 电影 压缩 转换 成 另外 一 种 格式 ， 这 个 转换 
i 。 如 果 在 转换 过 程 中 做 不 了 其 他 的 事情 ， 用 户 是 万 万 不 能 答应 的 ， 所 以 一 边 转换 电影 ， 我 们 
边 裔 键盘 聊天 ， 一 边 用 鼠标 点 击 网 页 。 
现在 清楚 了 ， 运 用 中 断 能 够 显著 提升 并 发 ， 从 而 大 幅 提 升 效 率 。 


















































操作 系统 是 中 断 驱动 的 


理 





pA 


“没有 中 断 ， 
解 这 句 话 呢 ? 





操作 系统 几乎 什么 都 做 不 了 ， 操 作 系 统 是 中 靳 双 




















我 个 人 是 这 样 8 














里 解 的 ， 仅 供 














参考 


首先 ， 操 作 系统 是 














K 动 的 ”。 这 
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ra 
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并 不 是 咱 信 


寻 太 精 膀 了 。 其 
就 像 咱们 之 前 








已 也 许 会 把 最 后 一 条 
操作 码 、 
ee 最 后 加 个 死 循 环 代 码 ， 而 是 











， 即 未 定义 ] 
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作 » 
的 » 


实 这 一 点 也 不 奇怪 ， 如 果 操 作 系 统 不 是 死 循环 


和 的 代码 中 ， 尾 没 有 jmp $ 或 while (1)，CPU 就 成 脱 纯 里 











的 话 ， 简 直 





是 我 大 学 老 ) 


个 死 循环 。 不知 是 哪 位 大 神 说 的 ， 
不 敢 想 像 CPU 会 








如 果 代 码 结 
令 后 面 的 数据 解码 成 某 种 指令 ， 也 许 会 
无 效 操 作 码 (Undefined，Invalid Opcode )。 


类 似 这 样 的 形式 。 














指 






































while ( 


操作 革 统 人 四 
} 





是 为 了 等 候 菜 些 事 ' 


其 实 ， 这 个 死 循 环 本 身 做 不 了 什么 大 





和 马 一 相 
因为 不 识别 该 指令 解码 失败 而 
当然 ， 我 们 所 说 操作 系统 的 “ 死 循 环 ” 


告诉 我 的 。 怎 么 


总 之 这 句 话说 
执行 到 哪里 去 ， 
再 也 回 不 来 了 。 
上 出 UD 异 





























情 发 生 。 您 看 ， 我 说 的 是 等 候 ， 也 裔 














所 以 它 是 被 事件 

















这 一 点 也 没有 错 。 








[9 中 断 分 类 















































































































































事 ， 仅 仅 是 保证 操作 系统 能 够 周而复始 地 运行 下 去 ， 而 运行 的 目 
是 操作 系统 是 被 如 
K 动 的 ， 而 这 个 事件 是 以 中 断 的 形式 通知 操作 系统 的 ， 所 以 说 ， 操 作 系统 是 中 断 纪 








] 


工作 的 ， 有 事 怪 








青 发 生 它 才 会 工 
区 动 
























































大 家 已 经 了 解 ， 中 断 就 是 发 生 了 某 种 事件 需要 通知 CPU 处 理 。 所 以 ， 不 管 哪里 ， 只 
该 让 CPU 知道 。 卸 断 按 事件 来 源 分 类 ， 来 自 CPU 外 部 的 中 断 就 称 为 外 部 中 断 ， 
称 为 内 部 中 断 。 其 实 还 可 以 再 细 分 ， 外 部 中 断 按 是 否 导致 害 机 来 划分 
两 种 ， 而 内 部 中 断 按 中 断 是 否 正常 来 划分 ， 可 分 为 软 中 断 和 异常 。 

花 点 时 间 了 解 下 基础 的 东西 还 是 很 有 帮助 的 ， 以 下 咱们 逐一 介绍 下 这 几 种 中 断 类 型 。 
7.3.1 外 部 中 断 

外 部 中 断 是 指 来 自 CPU 外 部 的 中 断 ， 而 外 部 的 中 断 源 必须 是 茶 个 硬件 ， 所 以 外 部 






































来 自 CPU 内 首 
， 可 分 为 可 屏蔽 中 断 和 不 可 屏蔽 中 


要 有 事 发 生 就 应 
了 的 中 断 
wi 



































断 又 称 为 硬件 中 





299 
































和 
断 。 比 如 说 网 卡 收 到 了 来 自 网 络 的 数据 包 ， 这 时 候 网 卡 就 会 主动 通知 CPU，CPU 得 到 通知 后 便 将 数据 拷 
贝 到 内 核 缓冲 区 。 

为 了 让 CPU 获得 每 个 外 部 设备 的 中 断 信号 , 最 好 的 方式 是 在 CPU 中 为 每 一 个 外 设 准备 一 个 引 脚 接收 中 断 

















县 


CPU 为 大 家 ] 




















作为 中 断 信 号 的 公共 线路 ， 所 有 来 自 外 设 


























但 这 是 不 可 能 的 ， 计 算 机 中 挂 了 很 多 外 部 设备 ， 而 且 
都 不 够 用 ， 况 且 ， 我 们 还 
案 是 CPU 提供 统一 的 接 






































提供 了 两 条 信号 线 。 外 部 硬件 的 中 断 是 通过 两 根 
INTR (INTeRrupt) 和 NMI (Non Maskable Interrupt)。 它 们 的 示意 如 图 


大 家 看 图 7-1 中 ，CPU 中 有 两 条 接收 中 断 的 信号 线 : INTR 





和 NMI。 也 就 是 说 所 有 的 外 部 设备 的 中 断 信息 者 E 
明 ， 以 下 所 讨论 的 内 容 都 是 基于 自 


二 二 


据 


ml\ 


郑重 











啦 ， 讨 论 开始 ^ 人 ^。 






































在 CPU 上 运行 的 程序 都 是 号 










































































根 信号 线 。 
EE 核 CPU 的 ， 好 


行 的 ， 所 有 任务 ， 包 括 中 断 








，CPU 


理论 上 外 设 数量 是 没有 上 限 的， 无 论 CPU 中 
CPU 的 体积 太 大 呢 ， 再 整 点 引 脚 上 去 











佳 备 多 少 引 











岂 不 是 更 大 了 。 所 以 一 种 可 行 的 方 








的 中 断 











< 一 一 灾难 性 错误 























言 号 都 共享 公共 线路 连接 到 CPU。 
言 号 线 通知 CPU 的 ， 这 两 根 信 号 线 就 是 


7-1 所 示 。 


INTR 
| 
NMI 








外 部 设 


备 























处 理 程序 都 是 一 个 接 一 个 在 CPU 上 运行 的 ， 所 有 任务 都 共享 RS 

同一 个 CPU，CPU 在 各 个 任务 间 不 断 切换 才 实现 了 并 发 。 既 

然 是 串 行 的 ， 也 就 是 说 每 次 CPU 只 能 处 理 一 个 任务 ， 何 必 整 两 根 中 断 信号 线 ? 大 家 有 没有 觉得 其 中 一 根 
是 多 余 的 ? 是 这 样 的 ， 任 何 任务 都 有 轻重 缓急 ， 有 的 中 疡 发 不 发 两 可 ， 甚 至 都 不 叫 个 事 ， 有 的 中 断 发 出 了 
就 是 捧 上 大 事 了 。CPU 为 了 区 分 这 两 种 中 断 类 型 ， 通 过 不 同 的 引 脚 加 以 区 分 ， 同 一 种 类 型 的 中 断 共用 同 























根 信 号 线 进 


















































去 的 必要 了 。 所 以 CPU 更 喜欢 来 

咱们 先 聊 聊 可 屏蔽 中 断 。 

可 屏蔽 中 断 是 通过 INTR 引 脚 进入 CPU 的 ， 外 部 设备 如 人 硬盘、 网 1 
可 屏蔽 的 意思 是 此 外 部 设备 发 出 的 中 断 ，CPU 可 以 不 理会 ， 


寄存 器 的 正 位 将 所 有 这 些 外 部 设备 













































































中 断代 理 也 可 以 单独 屏蔽 某 个 设备 的 中 断 ， 这 是 后 话 
对 于 这 类 可 屏蔽 中 断 ，CPU 可 以 选择 不 用 理 

















分 为 上 


既然 都 说 到 这 了 ， 上 
操作 系统 是 中 断 驱动 的 ， 中 断 发 4 
这 样 便 能 响应 更 多 设备 的 ! 
断 处 班 


短 越 好 ， 








应 效率 而 只 执行 部 分 ! 
中 需要 立即 执行 的 
下 只 完成 中 断 应 答 或 硬 












































半 部 和 下 半 部 分 开 处 理 。 
自 们 扩 


的 中 





而 只 要 从 NMI 引 


入 CPU， 这 样 CPU 就 不 需要 在 每 次 收 到 中 断 时 再 
只 要 从 INTR 引 脚 收 到 的 中 断 都 是 不 影响 系统 运行 的 ， 可 以 随时 处 理 
看 见 ， 因 为 它 不 影响 CPU 运行 。 





























NE 


铸 


i 是 





那 种 类 型 了 。 

















芭 收 到 的 中 断 ， 那 基本 





新 屏 珊 。 男 外 ， 这 些 

















和 全 右 

















D>» 


后 




















田 会 有 






































展 一 下 ， 上 = 


断 。 但 是 中 


人 














会 ， 











全 








人 











和 部 和 
后 会 执行 相应 的 中 断 处 至 








下 = 












































中 去 完成 。 








1] 于 : 





呆 











的 。 当 - 
在 开 中 断 的 








上 半 部 执行 
情况 下 执行 























es 








的 中 断 处 理 





程序 的 


完成 后 就 把 中 册 
的 ， 如 果 有 新 


程序 。 于 是 ， 把 中 
分 〈 分 分 钟 不 能 耽误 的 部 分 ) 划分 到 上 半 部 ， 这 部 
和 复位 等 重要 紧迫 的 工作 。 而 中 断 处 到 
处 理 程序 的 上 半 部 是 刻不容缓 要 








新 处 到 
汤 人 处理 


部 是 什么 ? 





， 即 使 在 至 


E 程 















































序 ， 我 们 希望 CPU : 
































程序 分 为 J 














三 | 
分 是 要 




















执行 的 ， 所以- 
































当时 机 》 后 


还 是 拿 











网 卡 举例 子 ， 





半 部 ， 


等 待 线 程 i 
上 CPU 完成 其 下 半 痢 
网 络 中 的 数据 通过 








「 打 天 





由 度 机 制 为 旧 ! 





F 了， 下 半音 
的 中 断 发 4 





原 





也 
来 这 个 旧 中 


属于 中 靳 处 天 


























断 














新 处 理 程序 择 

















的 执行 。 











缓冲 区 容量 不 大 ( 比 起 内 存 来 说 是 非常 本 





拿 走 ， 否 则 








、 














网 线 到 达 


的 ), 即使 很 大 也 有 














于 网 卡 缓冲 








区 : 





























立即 发 ， 
300 














断 通知 CPU: “ 数 提 





无 空余 空间 


， 后 续 到 来 的 数据 
到 了 ， 赶 紧 取 走 ” 这 话说 得 无 比 坚 定 ， 丝 台 没 有 座 

















网 卡 后 ， 首 








先 会 被 存储 到 


日 期 ( 束 











XX 


网 卡 E 


程序 还 是 需要 完整 执行 的 ， 不 能 光 为 了 提高 中 断 响 
F 半 部 和 下 半 部 两 部 分 ， 把 中 断 处 
限时 执行 的 ， 所 以 通 
程序 中 那些 不 紧急 的 部 分 则 被 失 
F 半 部 是 在 关中 
程序 ， 所 以 中 
的 下 半 部 就 会 被 
是 指 调度 算法 认为 的 某 个 恰 





打 
打 











， 甚 至 CPU 可 以 不 处 理 ， 假 装 没 
上 全 是 硬 伤 ，CPU 都 没有 运行 下 
自 INTR 的 消息 , 苦 点 累 点 都 没关系 ， 相对 NMI 来 说 ,至 少 它 全 是 好 消息 。 


























FE 等 发 出 的 中 断 都 是 可 屏蔽 中 断 。 
因为 它 不 会 让 系统 宕 机 ， 所 
设备 都 是 接 在 某 个 中 断代 理 设备 的 ， 通 过 该 
详细 介绍 。 
E 会 后 ， 也 可 以 像 Linux 那样 ， 把 中 断 





以 可 以 通过 eflags 





























断 响 应 的 时 间 越 




















里 程 月 
常情 况 


党 
下 半 部 
Cy 

器 




















1 和 











迟到 























不 被 打扰 的 情况 下 执 
处 理 程序 下 半 部 则 是 
换 下 CPU， 先 执行 新 






































己 的 缓冲 区 中 ， 这 个 























只 能 


写 满 的 习 


丢掉 。 鉴 于 这 个 刻不容缓 的 理由 ， 网 卡 会 

















天, 所 以 晤 








[的 








数据 必须 立即 被 CPU 





























里 








的 意思 ，CPU 立即 放 
























































































































































































































































下 手 里 的 工作 (其 实 并 不 是 真 地 立即 放下 ,怎么 也 得 把 当前 正在 执行 的 指令 执行 完 ， 指令 的 执行 必须 是 原 
子 操作 一 气 呵 成 ， 哪 有 执行 一 半 指 令 的 道理 )， 马 上 执行 网 卡 的 中 断 处 理 程序 ， 将 网 卡 缓冲 区 中 的 数据 找 
贝 到 内 核 缓冲 区 中 ， 至 此 ， 救 火 工作 算是 完成 了 ， 这 就 是 所 说 的 上 半 部 。CPU 拿 到 网 络 数据 后 ， 处 理 数 
据 的 工作 就 不 那么 紧急 了 ， 它 将 在 下 半 部 中 完成 ， 这 部 分 将 在 适当 的 时 机 被 启动 。 

即使 像 上 面 所 说 的 那么 紧急 的 中 断 ，CPU 也 是 可 以 置之不理 的 ， 因 为 它 不 会 让 CPU 宕 机 。 下 面 说 点 
让 CPU 宕 机 的 中 断 一 一 不 可 屏蔽 中 断 。 

不 可 屏蔽 中 断 是 通过 NMI 引 脚 进入 CPU 的 ， 它 表示 系统 中 发 生 了 致命 的 错误 ， 它 等 同 于 宣布 : 计算 
机 的 运行 到 此 结束 了 。 

哪些 错误 会 如 此 致命 呢 ? 

7-1 中 列 出 了 三 种 第 见 原 因 ， 每 一 种 都 足 侨 将 计算 机 击 倒 ， 比 如 说 内 存 读 写 错误 ， 内 存 是 CPU 的 

















足 时 ，CPU 可 以 宣布 收 挫 儿 了 ， 今 天 就 到 这 了 ， 再 
断 为 什么 称 为 不 可 屏蔽 ? 
问题 太 大 了 ， 











不 可 屏蔽 








因为 该 中 断 表示 出 的 





舞台 ， 各 种 程序 都 需要 被 载 入 内 存 后 才能 






































没 法 运行 了 , 难道 




















断 。 所 以 ， 这 里 的 不 
四 


包 脑 还 要 死 打 一 会 




















要 宕 机 了 ， 屏 




















向 不 了 ， 





因为 根本 不 











将 宕 机 ”1 
倒是 可 以 先 息事宁人 屏蔽 它 ， 
铃 自欺欺人 的 下 场 ， 

















呢 ? 问题 已 经 出 了 ，: 








可 屏 

















台 忆 
月 





























但 真心 处 至 















































符 表 (: 








上 断 只 是 通知 CPU 而 
CPU 收 到 中 断后 ,得 知道 发 生 了 什么 事 ; 
断 问 量 表 是 实 模 式 下 的 中 断 处 理 程序 数组 ， 



































中 会 细 说 ) 来 实现 














断 描述 符 表 ， 


不 了 ， 马 上 要 宕 机 了 ， 还 能 假装 
所 以 eflags 寄存 器 中 的 正 位 对 其 无 效 也 是 没 办 法 
已， 不 是 说 通知 收 不 到 问题 就 没有 发 生 ， 宕 机 是 不 可 避免 
青 才 能 执行 相应 的 处 天 

















在 保护 模式 下 已 经 被 中 断 描述 符 表 人 代替， 在 后 











的 ， 首 





先 为 每 一 种 ! 





断 分 配 一 个 ! 























量 表 或 : 
引 脚 被 传 入 CPU， 

















中 断 向 量 表 或 中 断 描述 符 表 中 检索 对 应 的 中 断 处 
































可 屏蔽 中 断 并 











而 不 可 屏蔽 中 断 3 


不 会 导致 致命 问题 , 它 的 数量 
起 的 致命 错误 原因 有 很 多 ， 每 一 种 都 是 硬 伤 ， 出 现 了 基本 上 可 以 认为 























多 数 属于 物理 上 的 问题 ， 只 能 找 硬件 








的 索引 下 标 ， 


























j 来 索引 中 断 项 
中 断 向 量 号 是 中 断 向 量 表 或 中 出 








恨 装 没 看 见 ， 比 如 断 
说 :“ 没 事 没事 , Pm ok，don't worry” 吗 ? 不 可 屏蔽 中 断 可 以 表 
权 不 是 说 “不 可 以 、 不 建议 






































障 蔽 ”， 而 是 真 地 处 理 不 了 啦 ， 要 能 处 到 

















机 会 运行 。 所 以 当 CPU 发 现 读 写 内存 这 个 刚性 需求 都 无 法 满 
继续 下 去 也 没什么 意思 ， 因 为 什么 都 做 不 了 。 


了 ， 机 器 都 
E 解 成 “ 即 
的 话 


什么 事 都 没 发 生 吗 ? 您 懂 的 ， 掩 耳 盗 





的 事 ， 

















办 法 。 这 是 通过 : 


的 。 

















断 











向 量 表 或 中 断 描述 


即使 正 位 对 它 有 效 又 能 怎么 样 






























































里 和 











呈 廊 并 去 执行 。 








是 有 


























程 师 解决 了 。 



































多 
7.3.2 ”内 部 中 断 


内 部 中 断 可 分 为 软 ! 
软 中 断 ， 就 是 由 软件 主动 发 起 的 中 断 ， 因 为 它 来 


行 中 主动 发 起 的 ， 


以 下 是 可 以 发 起 中 断 的 指令 。 
“int 8 位 立即 数 ”。 这 是 我 们 以 后 常 ) 


























程 师 来 说 都 意义 不 大 , 就 没 必要 再 
所 以 不 可 屏蔽 中 断 的 中 出 
部 中 断 介绍 到 此 结束 ， 现 在 介绍 下 内 部 中 断 。 























细 分 呆 大 

















向 量 号 为 2。 

















所 以 它 是 主观 


断 和 异常 。 


, 统统 为 导致 宕 机 的 各 利 


限 的 ,所 以 每 一 种 中 出 

















所 以 ， 既 然 























断 向 量 号 ， 中 断 向 量 号 就 是 一 个 整数 ， 它 就 是 中 断 
。 中 断 发 起 时 ， 相 应 的 中 断 向 量 号 通过 NMI 或 INTR 
有 描述 符 表 里 中 断 项 的 下 标 ，CPU 根据 此 中 断 向 量 号 在 





面 章节 


ey 




















| 软件 解决 不 了 ， 而 且 每 种 原 
































FEF 的 ， 并 不 是 客观 ] 





























种 中 断 ， 这 与 处 理 器 所 支持 的 中 断 数 是 相 吻合 的 。 























旧 令 蔡 换 ， 从 而 子 进 程 调用 了 int3 指令 触发 中 断 。 
点 本 质 上 是 指令 的 地 址 ， 调 试 器 〈 父 进程 ) 将 被 调试 进程 〈 子 进程 ) 断 点 起 始 地 址 的 第 1 个 字 节 备份 好 之 后 ， 





“int3” 这 可 不 是 int 空格 3， 它 们 之 间 无 间隙 。int3 是 
以 后 在 中 断 和 异常 表 中 大 家 会 看 到 。 我 们 用 gdb 或 bochs 
子 进 程 用 于 运行 被 调试 的 程序 。 调 试 器 中 经 常 要 设置 断 点 , 其 原理 








的 某 种 内 部 错误 。 
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i 源 都 可 以 获得 一 个 中 断 向 量 号 。 
软件 解决 不 了 ， 
对 于 软件 


分 配 一 个 中 断 向 量 号 就 足够 了 ， 


自 于 软件 ， 所 以 称 之 为 软 中 断 。 









































j 的 指令 ， 我 们 要 通过 它 进行 系统 调 


周 试 断 点 指令 ，] 








就 是 父 进程 修改 了 子 进程 的 指令 ,将 





j 此 指令 实现 调试 的 原 到 





Xe 


















































其 所 触发 的 中 断 向 
周 试 程序 时 ， 实 际 上 就 是 调试 器 fork 了 一 个 子 进 程 ， 


]，8 位 立即 数 可 表示 





于 该 中 断 是 软件 运 
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县. 忆 目 


星 气 征 3， 






































j int3 
是 int3 指令 的 机 器 码 是 0xcc， 断 
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在 原 地 将 该 指令 的 第 1 字 节 修改 为 0xcc。 这 样 指令 执行 到 断 点 处 时 ， 会 去 执行 机 器 码 为 0xcc 的 int3 指令 ,该 
指令 会 触发 3 号 中 断 ， 从 而 会 去 执行 3 号 中 断 对 应 的 中 断 处 理 程序 ,由 于 中 断 处 理 程序 在 运行 时 也 要 用 到 寄存 
器 ， 为 了 保存 所 调试 进程 的 现场 ， 该 中 断 处 理 程序 必须 先 将 当前 的 寄存 器 和 相关 内 存单 元 压 栈 保存 〈 提 醒 ， 当 
前 寄存 器 和 相关 内 存 都 属于 那个 被 调试 的 进程 )， 用 户 在 查看 寄存 器 和 变量 时 就 是 从 栈 中 获取 的 。 当 恢复 执行 
所 调试 的 进程 时 ， 中 断 处 理 程序 需要 将 之 前 备份 的 1 字 节 还 原 至 断 点 处 ， 然 后 恢复 各 寄存 器 和 内 存单 元 的 值 ， 
修改 返回 地 址 为 断 点 地 址 ， 用 iret 指令 退出 中 断 ， 返 回 到 用 户 进程 继续 执行 。 

。 into。 这 是 中 断 溢出 指令 ， 它 所 触发 的 中 断 向 量 号 是 4。 不 过 ， 能 否 引 发 4 号 中 断 是 要 看 eflags 标 
志 寄 存 器 中 的 OF 位 是 否 为 1， 如 果 是 1 才 会 引发 中 断 ， 否 则 该 指令 悄悄 地 什么 都 不 做 ， 低 调 得 很 。 

。 bound。 这 是 检查 数组 索引 越界 指令 ， 它 可 以 触发 $ 号 中 断 ， 用 于 检查 数组 的 索引 下 标 是 否 在 上 下 
边界 之 内 。 该 指令 格式 是 “bound 16/32 位 寄存 器 ， 16/32 位 内 存 ” 目的 操作 数 是 用 寄存 器 来 存储 的 ， 其 
内 容 是 待 检测 的 数组 下 标 值 。 源 操作 数 是 内 存 ， 其 内 容 是 数组 下 标的 下 边界 和 上 边界 。 当 执行 bound 指令 
时 ， 若 下 标 处 于 数组 索引 的 范围 之 外 ， 则 会 触发 5 号 中 断 。 

。 ud2。 未 定义 指令 ， 这 会 触发 第 6 号 中 断 。 该 指令 表示 指令 无 效 ，CPU 无 法 识别 。 主 动 使 用 它 发 
起 中 断 ， 常 用 于 软件 测试 中 ， 无 实际 用 途 。 
值得 注意 的 是 以 上 几 种 软 中 断 指 令 , 除 第 一 种 的 “int 8 位 立即 数 ” 之 外 , 其 他 的 几 种 又 可 以 称 为 异常 。 
因为 它们 既 具 备 软 中 断 的 “主动 ”行为 ， 又 具备 异常 的 “错误 ”结果 。 

下 面 说 说 异常 ， 异 常 是 另 一 种 内 部 中 断 ， 是 指令 执行 期 间 CPU 内 部 产生 的 错误 引起 的 。 

由 于 是 运行 时 错误 ， 所 以 它 不 受 标志 寄存 器 eflags 中 的 正 位 影响 ， 无 法 向 用 户 隐瞒 (因为 运行 不 下 
去 了 ， 错 误 兜 不 住 了 )。 

对 于 中 断 是 否 无 视 eflags 中 的 正 位， 可 以 这 么 理解 
上 
























































































































































































































































































































































































































































(1) 首先 ， 只 要 是 导致 运行 错误 的 中 断 类 型 都 会 无 视 正 位 ， 不 受 正 位 的 管束 ， 如 NMI、 异 常 。 

(2) 其 次 ， 由 于 intn 型 的 软 中 断 用 于 实现 系统 调用 功能 ， 不 能 因为 正 位 为 0 就 不 顾 用 户 请 求 ， 所 以 
为 了 用 户 功 能 正常 ， 软 中 断 必须 也 无 视 正 位 。 

总 结 : 只 要 中 断 关 系 到 “正常 ”运行 ， 就 不 受 下 位 影响 。 

另外 ， 这 里 所 说 的 运行 错误 ， 是 说 指令 语法 方面 的 错误 。 
举 个 例子 ， 比 如 说 在 执行 DIV 和 IDIV 除法 指令 时 ， 处 理 器 发 现 分 母 为 0( 除 0， 通 常 是 程序 忘记 为 
分 母 赋值 或 传 给 分 母 的 参数 有 误导 致 的 )， 除 法 中 分 母 是 不 能 为 0 的 ， 这 不 符合 除法 要 求 ， 将 引发 0 号 异 
常 〈《 叫 中 断 也 行 )。 
还 有 ， 当 处 理 器 无 法 识别 某 个 机 器 码 时 ， 就 会 发 起 6 号 中 断 〈( 异 常 )， 这 和 主动 用 ud2 指令 发 起 的 ! 
断 是 一 样 的 。 不 过 大 部 分 6 号 中 断 可 不 是 程序 主动 发 起 的 ， 真 地 是 CPU 不 认得 cs:ip 所 指向 的 指令 了 。 比 
如 我 们 在 程序 尾 用 到 了 很 多 的 死 循 环 指令 jmp $ 和 while(1)， 把 它们 去 掉 后 ， 很 可 能 CPU 就 把 内 存 中 的 垃 
圾 当成 了 指令 来 解码 ， 如 果 碰 巧 能 解码 为 某 个 指令 ，CPU 还 能 往 前 走 一 步 ， 否 则 解码 失败 时 就 会 抛 出 无 
效 操作 码 6 号 异常 。 
并 不 是 所 有 的 异常 都 很 致命 ， 按 照 轻重 程度 ， 可 以 分 为 以 下 三 种 。 
(1) Fault, 也 称 为 故障 。 这 种 错误 是 可 以 被 修复 的 一 种 类 型 , 属于 最 轻 的 一 种 异常 , 它 给 软件 一 次 “ 改 
过 自 新 ”的 机 会 。 当 发 生 此 类 异常 时 CPU 将 机 器 状态 恢复 到 异常 之 前 的 状态 ,之 后 调用 中 断 处 理 程 序 时 ， 
CPU 将 返回 地 址 依然 指向 导致 fault 异常 的 那 条 指令 。 通 常 中 断 处 理 程序 中 会 将 此 问题 修复 ， 待 中 断 处 理 
程序 返回 后 便 能 重 试 。 最 典型 的 例子 就 是 操作 系统 课程 中 所 说 的 缺 页 异常 page fault, 话说 Linux 的 虚拟 内 
存 就 是 基于 page fault 的 ， 这 充分 说 明 这 种 异常 是 极 易 被 修复 的 ， 甚 至 是 有 益 的 。 

(2) Trap， 也 称 为 陷阱 ， 这 一 名 称 很 形象 地 说 明 软 件 掉 进 了 CPU 设 下 的 陷阱 ， 导 致 停 了 下 来 。 此 异 
常 通常 用 在 调试 中 ， 比 如 int3 指令 便 引 发 此 类 异常 ， 为 了 让 中 断 处 理 程序 返回 后 能 够 继续 向 下 执行 ，CPU 
将 中 断 处 理 程序 的 返回 地 址 指向 导致 异常 指令 的 下 一 个 指令 地 址 。 

(3) Abort， 也 称 为 终止 ， 从 名 字 上 看 ， 这 是 最 严重 的 异常 类 型 ， 出 现 ， 由 于 错误 无 法 修复 ， 程 
序 将 无 法 继续 运行 ， 操 作 系 统 为 了 自 保 ， 只 能 将 此 程序 从 进程 表 中 去 掉 。 导 致 此 异常 的 错误 通常 是 硬件 错 
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误 ， 或 者 某 些 系统 数据 结构 出 错 。 
某 些 异常 会 有 单独 的 错误 码 ， 即 error code， 进 入 中 断 时 CPU 会 把 它们 压 在 栈 中 ， 这 是 在 压 入 eip 之 
后 做 的 ， 以 后 会 说 到 ， 目 前 先 了 解 下 就 行 。 
刚才 说 得 那么 热 六 ， 说 了 好 多 几 种 异常 ， 几 种 中 断 ， 咱 们 下 面 看 看 它们 的 庐山 真面目 ， 真 的 是 真面目 
啊 ， 原 汁 原味 纯 英文 ， 见 表 7-1。 
表 7-1 异常 与 中 断 
Vector No. | Mnemonic Description Source Type Error code(YIN) 
0 #DE Divide Error DIV and IDIV instructions. Fault N 
1 #DB Debug Any code or data reference. Fault/Trap | N 
2 / NMI Interrupt Non-maskable external interrupt. Interrupt N 
3 #BP Breakpoint INT3 instruction. Trap N 
4 #OF Overflow INTO instruction. Trap N 
S #BR BOUND Range Exceeded BOUND instruction. Fault N 
6 #UD valid Opoode Wnpefned UD2 instruction or reserved opcode.1 | Fault N 
Opcode) 
7 #NM Device Not Available (No Floating-point or WAIT/FWAIT Fault N 
Math Coprocessor) instruction. 
Any instruction that can generate an 
> Dh Bouble Fault exception, an NMI, or an INTR. 9 Y(0) 
9 #MF CoProcessor Sepinent Floating-point instruction.2 Fault N 
Overrun (reserved) 
10 #TS Invalid TSS Task switch or TSS access. Fault Y 
11 #NP Segment Not Present Loading Seenl CEISIeTS:Or Fault Y 
accessing system segments. 
12 #SS Stack Segment Fault ee operotiods And Sreglster Fault Y. 
13 #GP General Protection Any memory reference and other poit 
protection checks. 
14 #PF Page Fault Any memory reference. Fault Y 
15 Reserved 
16 NAME Floating-Point Error (Math Floating-point or WAIT/FWAIT Fault N 
Fault) instruction. 
17 #AC Alignment Check Any data reference in memory.3 Fault Y(0) 
18 #MC Machine Check Sorcodes Gr any ) andisouoe are Abort N 
model dependent.4 
19 #XM SIMD Floatmgs Pomnt SIMD Floating-Point Instruction5 Fault N 
Exception 
20~31 Reserved 
External interrupt from INTR pin or 
3222255 Maskable Interrupts INT n instruction Interrupt 
表 中 Error code 字段 中 ， 如 果 值 为 Y， 表 示 相 应 中 断 会 由 CPU 压 入 错误 码 。 
之 前 说 到 的 中 断 向 量 是 什么 ?其 实 就 是 表 7-1 中 第 一 列 的 Vector No.， 即 中 断 向 量 号 。 您 也 看 到 了 ， 




















































































































































































































































































































它 就 是 个 整数 ， 范 围 是 0 一 255。 

中 断 机 制 的 本 质 是 来 了 一 个 中 断 信 号 后 ， 调 用 相应 的 中 断 处 理 程序 。 所 以 ，CPU 不 管 有 多 少 种 类 型 
的 中 断 ， 为 了 统一 中 断 管理 ， 把 来 自 外 部 设备 、 内 部 指令 的 各 种 中 断 类 型 统统 归结 为 一 种 管理 方式 ， 即 为 
每 个 中 断 信号 分 配 一 个 整数 ， 用 此 整数 作为 中 断 的 ID， 而 这 个 整数 就 是 所 谓 的 中 断 向 量 ， 然 后 用 此 ID 作 
为 中 断 描 述 符 表 中 的 索引 ， 这 样 就 能 找到 对 应 的 表 项 ， 进 而 从 中 找到 对 应 的 中 断 处 理 程序 。 

中 断 向 量 的 作用 和 选择 子 类 似 , 它们 都 用 来 在 描述 符 表 中 索引 一 个 描述 符 , 只 不 过 选择 子 用 于 在 GDT 
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或 LDT 中 检索 段 描述 符 ， 而 中 断 向 量 专用 于 中 断 描述 符 表 ， 其 中 没有 RPL 字段 ， 以 后 说 到 中 断 描述 符 表 
时 大 伙 就 清楚 了 。 
常 和 不 可 屏蔽 中 断 的 中 断 向 量 号 是 由 CPU 自动 提供 的 ， 而 来 自 外 部 设备 的 可 屏蔽 中 断 号 是 由 中 断 
代理 提供 的 (咱们 这 里 的 中 断代 理 是 8259A)， 软 中 断 是 由 软件 提供 的 。 
内 部 中 断 到 这 儿 就 结束 了 ， 前面 花 了 一 定 篇 幅 介 绍 了 外 部 中 断 ， 咀 们 今后 要 使 用 的 就 是 外 部 中 断 中 的 

可 屏蔽 中 断 ， 以 后 大 家 就 知道 了 。 


中 断 描述 符 表 


中 断 描述 符 表 〈Interrupt Descriptor Table，IDT) 是 保护 模式 下 用 于 存储 中 断 处 理 程序 入 口 的 表 ， 当 
CPU 接收 一 个 中 断 时 ， 需 要 用 中 断 向 量 在 此 表 中 检索 对 应 的 描述 符 ， 在 该 描述 符 中 找到 中 断 处 理 程序 的 
起 始 地 址 ， 然 后 执行 中 断 处 理 程序 。 
一 直 以 来 ,我们 都 是 讨论 保护 模式 下 的 中 断 ， 值 得 一 提 的 是 中 断 可 不 是 只 在 保护 模式 下 才 有 ， 在 实 相 
操作 系统 自古 以 来 就 是 中 断 驱 动 的 ， 实 模式 下 要 是 没有 中 断 也 就 没有 操作 系统 了 。 上 
过 实 模式 下 用 于 存储 中 断 处 理 程序 入 口 的 表 叫 中 断 向 量 表 〈Interrupt Vector Table，IVT)。 好 啦 ， 我 这 
、 名 而 已 ， 咱 们 还 是 要 把 精力 放 到 中 断 描述 符 表 上 。 
中 断 描 述 符 表 中 有 什么 呢 ? 
有 人 肯定 会 觉得 我 是 个 逗 比 ， 中 断 描 述 符 表 中 的 当然 都 是 中 断 描 述 符 啦 ， 让 大 家 感到 意外 的 是 表 中 不 
仅仅 有 中 断 描 述 符 ， 还 可 以 有 任务 门 描述 符 和 陷阱 门 描述 符 。 由 于 表 中 所 有 描述 符 都 是 记录 一 段 程序 的 起 
始 地 址 ， 相 当 于 通 向 某 段 程序 的 “大 门 ” 所 以 ， 中 断 描述 符 表 中 的 描述 符 有 自己 的 名 称 门 。 
IDT 中 只 有 这 种 称 为 门 的 描述 符 。 之 前 在 介绍 特权 级 时 介绍 了 门 ， 这 里 给 大 伙 复 习 一 下 。 
， 顾 名 思 义 ， 是 通 往 某 处 的 入 口 。 在 计算 机 中 ， 用 门 来 表示 一 段 程序 的 入 口 。 拿 它 和 有 段 描述 符 对 比 
一 下 就 容易 理解 了 ， 段 描述 符 中 描述 的 是 一 片 内 存 区 域 ， 而 门 描述 符 中 描述 的 是 一 段 代 码 。 
所 有 的 描述 符 大 小 都 是 8 字 节 ， 而 门 其 实 就 是 描述 符 ， 想 通过 门 进入 里 面 的 世界 是 有 条 件 的 ， 就 像 娶 
媳妇 “过 门 ” 一 样 ， 两 个 家 庭 得 “门当户对 ” 这 就 是 咱们 人 类 社会 中 所 说 的 门槛 。 这 和 之 前 咱们 看 到 的 
段 描述 符 功 能 类 似 ， 在 门 描述 符 中 添加 了 各 种 属性 ， 这 就 是 进门 的 条 件 。 当 处 理 器 把 这 些 条 件 检 查 通 过 后 
就 不 再 限制 程序 了 。 
之 前 在 说 段 描述 符 的 时 候 ， 记 得 曾经 和 大 家 说 过 ， 描 述 符 高 4 字 节 的 第 8 一 12 位 是 固定 的 意义 ， 
用 来 表述 描述 符 的 类 型 。CPU 通过 这 些 位 便 知 道 该 结构 是 哪 种 描述 符 。 帮 大 伙 儿 回忆 一 下 ， 第 8 一 11 
位 是 type 字段 , 用 来 描述 一 个 描述 符 的 类 型 , 第 12 位 是 S 位 , 用 来 表示 系统 段 或 非 系统 段 (数据 段 )。 
S 为 0 时 表示 系统 段 ，S 为 1 时 表示 数据 段 。type 字段 是 要 和 S 字段 配合 在 一 起 才能 确定 段 描 述 符 以 
确切 类 型 。 
咱们 这 里 的 各 种 门 都 属于 系统 段 ，S 都 等 于 0， 所 以 它们 主要 的 区 别 就 是 type 位 不 同 。 在 第 5 章 中 已 
经 介绍 过 四 种 门 描述 符 了 ,不 过 那 只 涉及 到 有 关 特 权 级 方面 的 内 容 ， 为 方便 大 家 ,我 把 这 四 种 门 描述 符 再 
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次 贴 到 此 处 ， 下 面 再 对 它们 详细 介绍 下 。 

31 161514 131211 个: 这 0 高 

未 使 用 P| DPL 2 J - 未 使 用 从 

VV. 

31 1615 0 低 

TSS 选择 子 未 使 用 32 

位 

任务 门 描述 符 格式 





4 图 7-2 任务 门 描述 符 
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31 161514 131211 87654 0 局 



































































































































中 断 处 理 程序 在 目标 段 内 的 偏 移 量 的 p| ppi, | SEE ,| 未 使 用 32 
31~16 位 olpl1l1ilo 位 
31 1615 0 低 
中 上 断 处 理 程序 目标 代码 段 撕 述 竺 选择 子 。 | 和 岂 处 再 程序 在 目标 代 自 内 的 仿 移 量 的 3 
- 位 
D 位 为 0 表示 16 位 模式 ee 
D 位 为 1 表示 32 位 模式 中 断 门 描述 符 格式 
4 图 7-3 ”中断 门 描述 符 

31 161514 1312 11 87654 0 高 
中 断 处 程序 在 村 内 的 信和 的 p| ppi, | SE | on | 32 
a" DA 0| D| 1| 1| 1 位 
中 断 处 理 程序 在 目标 代码 段 内 的 偏 移 量 的 低 
中 断 处 理 程序 目标 代码 段 描述 符 选 择 子 位 32 
位 


D 位 为 0 表示 16 位 模式 
D 位 为 1 表示 32 位 模式 陷阱 门 描述 符 格式 


4 图 7-4 陷阱 门 描述 符 


























31 161514 131211 87654 0 高 
























































一 [与 
被 调用 例 程 在 目标 代码 段 内 的 偏 移 量 的 |p| upl [S| TYPE 0 oo| 下 | 32 
31~16 位 0lplilolo 位 
31 1615 0 低 
被 调用 例 程 所 在 代码 段 的 描述 符 选 择 子 。 | 杖 本 用 例 各 在 目标 代 而 段 内 的 信 移 量 的 | 32 
位 
D 位 为 0 表示 16 位 模式 ce 
D 位 为 1 表示 32 位 模式 调用 门 描述 符 格式 














4 图 7-5 调用 门 描述 符 

门 描 述 符 中 的 各 属性 位 与 段 描 述 符 中 的 属性 意义 相同 ,大 伙 可 以 参考 全 局 描述 符 表 部 分 的 介绍 。 下 面 
简要 说 下 这 几 种 门 描述 符 ， 这 里 咱们 只 讨论 32 位 保护 模式 。 

1. 任务 门 

任务 门 和 任务 状态 段 (Task Status Segment，TSS) 是 Intel 处 理 器 在 硬件 一 级 提供 的 任务 切换 机 制 ， 所 以 任 
务 门 需要 和 TSS 配合 在 一 起 使 用 ， 在 任务 门 中 记录 的 是 TSS 选择 子 ， 偏 移 量 未 使 用 。 任 务 门 可 以 存在 于 全 局 描 
述 符 表 GDT、 局 部 描述 符 表 LDT、 中 断 描述 符 表 IDT 中 。 描 述 符 中 任务 门 的 type 值 为 二 进 制 0101， 其 结构 如 
图 7-2 所 示 。 顺 便 说 一 句 大 多 数 操作 系统 (包括 Linux) 都 未 用 TSS 实现 任务 切换 ， 咱 们 这 里 也 不 讨论 啦 。 

2. 中 断 门 
中 断 门 包含 了 中 断 处理 程 序 所 在 段 的 段 选择 子 和 段 内 偏 移 地 址 。 当 通过 此 方式 进入 中 断后 ， 标 志 寄 存 
器 eflags 中 的 下 位 自动 置 0， 也 就 是 在 进入 中 断后 ， 自 动 把 中 断 关 闭 ， 避 免 中 断 艇 套 。Linux 就 是 利用 中 
断 门 实现 的 系统 调用 ， 就 是 那个 著名 的 int 0x80。 中 断 门 只 允许 存在 于 IDT 中 。 描 述 符 中 中 断 门 的 type 值 
为 二 进 制 1110， 其 结构 如 图 7-3 所 示 。 

3. 陷阱 门 

陷阱 门 和 中 断 门 非常 相似 ， 区 别 是 由 陷阱 门 进 入 中 断后 ， 标 志 寄 存 器 eflags 中 的 下 位 不 会 自动 置 0。 
陷阱 门 只 允许 存在 于 IDT 中 。 描 述 符 中 陷阱 门 的 type 值 为 二 进 制 1111。 其 结构 如 图 7-4 所 示 。 

4. 调用 门 

调用 门 是 提供 给 用 户 进程 进入 特权 0 级 的 方式 ， 其 DPL 为 3。 调 用 门 中 记录 例 程 的 地 址 ， 它 不 能 
int 指令 调用 ， 只 能 用 call 和 jmp 指令 。 调 用 门 可 以 安装 在 GDT 和 LDT 中 。 措 述 符 中 调用 门 的 type 值 为 
二 进 制 1100。 其 结构 如 图 7-5 所 示 。 
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除 调用 门 外 ， 另 外 的 任务 门 、 中 断 门 、 陷 阱 门 都 可 以 存在 于 中 断 描 述 符 表 中 。 

现代 操作 系统 为 了 简化 开发 、 提 升 性 能 和 移植 性 等 原因 ， 很 少 用 到 调用 门 和 任务 门 。 所 以 本 书 中 对 它 
们 的 讨论 也 少 之 又 少 ， 我 们 会 把 精力 放 在 中 断 门 ， 像 Linux 那样 ， 用 它 来 实现 系统 调用 。 

一 个 中 断 源 就 会 产生 一 个 中 断 向 量 ， 每 个 中 断 向 量 都 对 应 中 断 描述 符 表 中 的 一 个 门 描述 符 ,， 任 何 中断 
源 都 通过 中 断 向 量 对 应 到 中 断 描述 符 表 中 的 门 描 述 符 ,通过 该 门 描 述 符 束 找到 了 对 应 的 中 断 处 理 程序 。 可 见 ， 
中 断 发 生 后 , 采取 什么 样 的 动作 是 由 中 断 处 理 程序 决定 的 , 但 该 程序 是 在 中 断 描 述 符 表 中 找到 的 ,该 表决 定 
了 中 断 信 号 落 到 哪个 程序 上 ， 中 断 向 量 相 当 于 子弹 ， 门 描述 符 相 当 于 鞭子， 中 断 描述 符 表 相 当 于 狙击 手 ， 人 
家 指 哪 就 打 哪 ， 门 描述 符 位 置 错 了 子弹 就 打 错 地 方 了 ， 下 面 我 们 来 看 看 这 个 威武 霸气 中 断 描述 符 表 。 
还 记得 很 久 很 久 以 前 说 过 的 低 端 1MB 内 存 布局 吗 ? 位 于 地 址 0 一 0x3 企 的 是 中 断 向 量 表 IVT， 它 是 实 
模式 下 用 于 存储 中 断 处 理 程序 入 口 的 表 。 由 于 实 模式 下 功能 有 限 ， 运 行 机 制 比 较 “ 死 板 ” 所 以 它 的 位 置 
是 固定 的 ， 必 须 位 于 最 低 端 。 大 家 看 到 了 ， 已 知 0 一 0x3 任 共 1024 个 字 节 ， 又 知 IVT 可 容纳 256 个 中 断 向 
量 ， 所 以 每 个 中 断 向 量 用 4 字 节 描述 。 

对 比 中 断 向 量 表 ， 中 断 描 述 符 表 有 两 个 区 别 。 

(1) 中 断 描述 符 表 地 址 不 限制 ， 在 哪里 都 可 以 。 

(2) 中断 描 述 符 表 中 的 每 个 描述 符 用 8 字 节 描述 。 

也 许 您 心里 有 疑问 ， 中 断 描 述 符 表 中 可 容纳 多 少 个 中 断 向 量 呢 ?咱们 看 看 硬件 是 怎样 支持 的 吧 。 

既然 IDT 的 位 置 不 固定 ， 当 中 断 发 生 时 ，CPU 是 如 何 找到 它 的 呢 ? 
在 CPU 内 部 有 个 中 断 描述 符 表 寄存 器 〈Interrupt Descriptor Table Register，IDTR)， 该 寄存 器 分 为 两 
部 分 : 第 0 一 15 位 是 表 界 限 , 即 IDT 大 小 减 1, 第 16 一 47 位 是 IDT 的 基地 址 , 这 和 咱们 之 前 介绍 的 GDTR 
是 一 样 的 原理 。 好 啦 ， 你 懂 啦 ， 咱 们 的 中 断 描 述 符 表 地 址 肯定 要 加 载 到 这 个 寄存 器 中 ， 只 有 寄存 器 IDTR 
指向 了 IDT, 当 CPU 接收 到 中 断 向 量 号 时 才能 找到 中 断 向 量 处 理 程序 , 这 样 中 断 系统 才能 正常 运作 。IDTR 
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结构 如 图 7-6 所 示 。 47 1615 0 
16 位 的 表 界 限 ， 表示 最 大 范 所 是 Oxffff, EB] 64KB。 可 容纳 的 32 位 的 表 基 址 16 位 的 表 界 限 
; 术 备 个 着 县 gf 个 。 特 别 注意 的 是 人 条 各 
人 人 由 靳 描述 符 表 宕 在 蝇 IDTR 
个 段 描 述 符 是 不 可 用 的 ， 但 IDT 却 无 此 限制 ， 第 0 个 门 描述 符 也 
























































4 图 7-6 1DTR 结构 









































是 可 用 的 , 中 断 向 量 号 为 0 的 中 断 是 除法 错 。 但 处 理 器 只 支持 256 
个 中 断 ， 即 0 一 234， 中 断 描述 符 中 其 余 的 描述 符 不 可 用 。 在 门 描述 符 中 有 个 P 位 ， 所 以 ， 咱 们 将 来 在 构 
建 IPT 时 ， 记 得 把 P 位 置 0， 这 样 就 表示 门 描述 符 中 的 中 断 处 理 程 序 不 在 内 存 中 。 

同 加 载 GDTR 一 样 ， 加 载 IDTR 也 有 个 专门 的 指令 一 一 lidt， 其 用 法 是 : 

lidt 48 位 内 存 数 据 
在 这 48 位 内 存 数据 中 ， 前 16 位 是 IDT 表 界 限 ， 后 32 位 是 IDT 线性 基地 址 。 


7.4.1 中 断 处 理 过 程 及 保护 


在 了 解 中 断 描 述 符 表 之 后 ， 咱 们 说 一 下 从 中 断 发 生 到 中 断 处 理 的 过 程 ， 过 程 中 涉及 到 特权 级 检查 ， 也 
就 是 本 节 所 说 的 保护 。 完 整 的 中 断 过 程 分 为 CPU 外 和 CPU 内 两 部 分 。 

CPU 外 : 外 部 设备 的 中 断 由 中 断代 理 芯片 接收 ， 处 理 后 将 该 中 断 的 中 断 向 量 号 发 送 到 CPU。 

CPU 内 : CPU 执行 该 中 断 向 量 号 对 应 的 中 断 处 理 程序 。 

CPU 外 这 部 分 的 处 理 过 程 ， 在 后 面 咱们 讲述 中 断代 理 芯 片 Intel 8259A 时 大 家 就 会 了 解 ， 这 部 分 内 容 
属于 硬件 范畴 ， 我 们 这 里 只 讨论 处 理 器 内 的 过 程 ， 这 是 软件 能 控制 的 部 分 ， 开 始 啦 。 
(1) 处 理 器 根据 中 断 癌 量 号 定位 中 断 门 描述 符 。 
中 断 向 量 号 是 中 断 描 述 符 的 索引 ， 当 处 理 器 收 到 一 个 外 部 中 断 向 量 号 后 ， 它 用 此 向 量 号 在 中 断 描述 符 
表 中 查询 对 应 的 中 断 描 述 符 , 然后 再 去 执行 该 中 断 描 述 符 中 的 中 断 处 理 程序 .由 于 中 断 描述 符 是 8 个 字 节 ， 
所 以 处 理 器 用 中 断 向 量 号 乘 以 8 后 ， 再 与 IDTR 中 的 中 断 描 述 符 表 地 址 相 加 ， 所 求 的 地 址 之 和 便 是 该 中 断 
向 量 号 对 应 的 中 断 描 述 符 。 
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《2) 处 理 器 进行 特权 级 检查 。 

由 于 中 断 是 通过 中 断 向 量 号 通知 到 处 理 器 的 ， 中断 向 量 号 只 是 个 整数 ， 其 中 并 没有 RPL， 所 以 在 对 
中 断 引起 的 特权 级 转移 做 特权 级 检查 中 ， 并 不 涉及 到 RPL。 中 断 门 的 特权 检查 同调 用 门类 似 ， 对 于 软件 3 
动 发 起 的 软 中 断 ， 当 前 特权 级 CPL 必须 在 门 描述 符 DPL 和 门 中 目标 代码 段 DPL 之 间 。 这 是 为 了 防止 位 了 
3 特权 级 下 的 用 户 程序 主动 调用 某 些 只 为 内 核 服务 的 例 程 。 

(a) 如 果 是 由 软 中 断 intn、int3 和 into 引发 的 中 断 ， 这 些 是 用 户 进程 中 主动 发 起 的 中 断 ， 由 用 户 代 码 
控制 ， 处 理 器 要 检查 当前 特权 级 CPL 和 门 描述 符 DPL， 这 是 检查 进门 的 特权 下 限 ， 如 果 CPL 权限 大 于 等 
于 DPL， 即 数值 上 CPL 科 门 描述 符 DPL， 特 权 级 “门槛 ”检查 通过 ， 进 入 下 一 步 的 “门框 ”检查 。 和 否则 ， 
处 理 器 抛 出 异常 。 

(b) 这 一 步 检查 特权 级 的 上 限 《 门 框 ): 处 理 器 要 检查 当前 特权 级 CPL 和 门 描述 符 中 所 记录 的 选择 子 
对 应 的 目标 代码 段 DPL， 如 果 CPL 权限 小 于 目标 代码 段 DPL， 即 数值 上 CPL> 目 标 代码 段 DPL， 检 查 通 
过 。 否 则 CPL 若 大 于 等 于 目标 代码 段 DPL， 处 理 器 将 引发 异常 ， 也 就 是 说 ， 除 了 用 返回 指令 从 高 特权 级 
返回 ， 特 权 转 移 只 能 发 生 在 由 低 向 高 。 
车 中 断 是 由 外 部 设备 和 异常 引起 的 ， 只 直接 检查 CPL 和 目标 代码 段 的 DPL， 和 上 面 的 步骤 b) 是 一 
羊 的 ， 要求 CPL 权限 小 于 目标 代码 段 DPL， 即 数值 上 CPL > 目标 代码 段 DPL， 否 则 处 理 器 引发 异常 。 

(3) 执行 中 断 处 理 程序 。 

特权 级 检查 通过 后 ， 将 门 描述 符 目 标 代码 段 选择 子 加 载 到 代码 段 寄存 器 CS 中 ， 把 门 描述 符 中 中 断 处 
理 程序 的 偏 移 地 址 加 载 到 EIP， 开 始 执行 中 断 处 理 程序 。 

以 上 过 程 如 图 7-7 所 示 。 
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全 局 描述 符 表 

GDT 

段 描述 符 0 

(不 可 用 ) 

内 核 代码 段 描述 符 

i 断 描述 符 胡 内 核 代 码 段 

的 起 始 地 址 | 
内 存 

二 0 个 六 还 符 , 
中 断 向 量 号 必 昌 
到 于 符 请 13 位 x 要 
1 过 a 
中 断 向 量 号 9 
x8 “| 中古 门 括 述 符 人 
中 断 处 理 程序 代码 段 
人 4 | | 所 在 代码 段 的 选择 
处 理 器 中 的 选择 子 上 
IDTR 3 所 在 代码 段 的 偏 移 量 
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4 图 7-7 中 断 处 理 过 程 
由 于 IDT 中 全 都 是 门 描述 符 ， 所 以 图 7-7 的 IDT 中 的 “ 某 门 描述 符 ” 表 示 中 断 门 、 陷 阱 门 或 任务 门 。 
Re pO rp mle ty 
中 的 正 位 被 自动 置 0， 避 免 中 断 庶 套 ， 即 中 断 处 理 过 程 中 又 来 了 个 新 的 中 断 ， 这 是 为 防止 在 处 理 某 个 中 断 
的 过 程 中 又 来 了 个 相同 的 中 断 ， 即 同一 种 中 断 未 处 理 完 时 又 来 了 一 个 ， 这 会 导致 一 般 保护 性 (GP) 异常 。 
这 表示 默认 情况 下 ， 处 理 器 会 在 无 人 打扰 的 方式 下 执行 中 断 门 描述 符 中 的 中 断 处 理 例 程 。 
若 中 断 发 生 时 对 应 的 描述 符 是 任务 门 或 陷阱 门 的 话 ， CPU 是 不 会 将 正 位 清 0 的 。 因 为 陷阱 门 主 要 用 
于 调试 ， 它 允许 CPU 响应 更 高 级 别 的 中 断 ， 所 以 允许 中 断 撕 套 。 而 对 任务 门 来 说 ， 这 是 执行 一 个 新 任务 ， 
任务 都 应 该 在 开 中 断 的 情况 下 进行 ， 否 则 就 独占 CPU 资源 ， 操 作 系 统 也 会 由 多 任务 退化 成 单 任务 了 。 
Ce 令 是 iret， 它 从 栈 中 弹出 数据 到 寄存 器 cs、eip、eflags 等 ， 根 据 特权 级 是 否 改变 ， 判 
断 是 恢复 旧 栈 ， 也 就 是 说 是 否 将 栈 中 位 于 SS_old 和 ESP_old 位 置 的 值 弹 出 到 寄存 ss 和 esp。 当 中 断 
处 理 程序 执行 完成 反 回 后 ， 通 过 iret 指令 从 栈 中 恢复 eflags 的 内 容 。 
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当然 如 果 大 伙 儿 愿意 的 话 ， 可 以 在 中 断 处 理 程序 中 将 正 位 打开 ， 这 样 便 可 以 根据 需要 优先 处 理 更 高 
特权 级 的 中 断 。 可 是 如 何 打开 此 位 呢 ? 
有 些 eflags 中 的 位 需要 以 pushf 压 到 栈 中 修改 后 再 弹 回 的 方式 修改 ， 这 样 有 内 存 参与 的 操作 必须 是 
低 效 率 ， 而 且 此 操作 是 由 多 个 步骤 完成 的 ， 执 行 过 程 中 容易 被 拆 开 ， 不 能 保证 操作 的 原子 性 ， 原 子 性 就 
是 所 有 的 步骤 一 次 性 全 部 完成 ， 中 间 不 能 被 打 断 ， 像 原子 那样 不 可 再 分 〈 话 说 ， 数 据 库 中 的 “事务 ”就 
是 原子 性 的 代表 )。 所 以 ， 处 理 器 提供 了 专门 用 于 控制 IF 位 的 指令 ， 通 过 它 ，IF 可 以 直接 控制 。 指 令 
cli 使 正 位 为 0， 这 称 为 关中 断 ， 指 令 si 使 正 位 为 1， 这 称 为 开 中 断 。 

IF 位 只 能 限制 外 部 设备 的 中 断 ， 对 那些 影响 系统 正常 运行 的 中 断 都 无 效 ， 如 异常 exception， 软 中 断 ， 
如 intn 等 ， 不 可 屏蔽 中 断 NMI 都 不 受 下 限制 。 

现在 给 大 伙 儿 加 餐 了 【如果 已 经 觉得 很 撑 了 ， 可 以 先 消 化 消化 前 面 的 内 容 再 继续 从)， 前 面 说 过 ， 
进入 中 断 时 要 把 NT 位 和 TF 位 置 为 0。TF 表示 Trap Flag， 也 就 是 陷阱 标志 位 ， 这 用 在 调试 环境 中 ， 当 
TF 为 0 时 表示 禁止 单 步 执行 , 也 就 是 说 , 进入 中 断后 将 TF 置 为 0， 表示 不 允许 中 断 处 理 程 序 单 步 执行 ， 
这 是 好 理解 的 。 至 于 为 什么 要 把 NT 位 置 为 0 昵 ? 这 和 中 断 返 回 指令 iret 有 关 ， 在 这 里 简要 和 大 伙 儿 说 
下 ， 更 多 相关 内 容 (TSS 和 任务 门 ) 将 在 用 户 进 程 的 章节 中 介绍 。 

NT 位 表示 Nest Task Flag， 即 任务 从 套 标志 位 ， 也 就 是 用 来 标记 任务 藤 套 调用 的 情况 。 任 务 众 套 调 用 是 指 
CPU 将 当前 正 执行 的 旧 任务 挂 起 ， 转 去 执行 另外 的 新 任务 ， 待 新 任务 执行 完 后 ，CPU 再 回 到 旧 任务 继续 执行 。 
为 什么 CPU 执行 完 旧 任务 后 还 能 回 到 新 任务 呢 ? 原因 是 在 执行 新 任务 之 前 ，CPU 做 了 两 件 准 备 工作 。 

(1) 将 旧 任 务 TSS 选择 子 写 到 了 新 任务 TSS 中 的 “上 一 个 任务 TSS 的 指针 ”字段 中 。 

(2) 将 新 任务 标志 寄存 器 eflags 中 的 NT 位 置 1， 表 示 新 任务 之 所 以 能 够 执行 ， 是 因为 有 别 的 任务 调 
用 了 它 。 

第 (2) 步 中 这 个 “ 别 的 任务 ” 便 是 指 CPU 在 第 1 步 中 写 进 新 任务 自己 TSS 的 “上 一 个 任务 TSS 的 
指针 ”字段 中 的 值 。 

CPU 把 新 任务 执行 完 后 还 是 要 回去 继续 执行 旧 任 务 的， 怎样 回 到 旧 任务 呢 ? 这 也 是 通过 iret 指令 。iret 指令 
因此 有 了 两 个 功能 ， 一 是 从 中 断 返回 ， 另 外 一 个 就 是 返回 到 调用 自己 执行 的 那个 旧 任 务 ， 这 也 相当 于 执行 一 个 任 
务 。 那 么 问题 来 了 ， 对 同一 条 iret 指令 ，CPU 是 如 何 知道 该 从 中 断 返 回 呢 ， 还 是 返回 到 旧 任务 继续 执行 呢 ? 

这 就 用 到 NT 位 了 ， 当 CPU 执行 iret 时 ， 它 会 去 检查 NT 位 的 值 ， 如 果 NT 位 为 1， 这 说 明 当 前 任务 
是 被 嵌 套 执行 的 ， 因 此 会 从 自己 TSS 中 “上 一 个 任务 TSS 的 指针 ”字段 中 获取 旧 任 务 ， 然 后 去 执行 该 任 
务 。 如 果 NT 位 的 值 为 0， 这 表示 当前 是 在 中 断 处 理 环境 下 ， 于 是 就 执行 正常 的 中 断 退出 流程 。 

7.4.2 中断 发 生 时 的 压 栈 

我 们 只 讨论 32 位 保护 模式 下 的 中 断 情 况 。 

中 断 在 发 生 时 ， 处 理 器 收 到 一 个 中 断 向 量 号 , 根据 此 中 断 向 量 号 在 中 断 描述 符 表 中 找到 相应 的 中 断 门 描述 
符 , 门 描述 符 中 保存 的 是 中 断 处 理 程 序 所 在 代码 段 的 选择 子 及 在 段 内 偏 移 量 ， 处 理 器 从 该 描述 符 中 加 载 目标 代 
码 段 选择 子 到 代码 段 寄 存 器 CS 及 偏 移 量 到 指令 指针 寄存 器 EIP。 注 意 ， 由 于 CS 加 载 了 新 的 目标 代码 段 选择 
子 ， 处 理 器 不 管 新 的 选择 子 和 任何 段 寄 存 器 (包括 CS) 中 当前 的 选择 子 是 否 相 同 ， 也 不 管 这 两 个 选择 子 是 否 
指向 当前 相同 的 段 ， 只 要 段 寄 存 器 被 加 载 ， 段 描述 符 缓冲 寄存 器 就 会 被 刷新 ， 处 理 器 都 认为 是 换 了 一 个 段 ， 属 
于 段 间 转移 ， 也 就 是 远 转 移 。 所 以 ， 当 前 进程 被 中 断 打 断后 ， 为 了 从 中 断 返回 后 能 继续 运行 该 进程 ， 处 理 器 自 
动 把 CS 和 EIP 的 当前 值 保 存 到 中 断 处 理 程序 使 用 的 栈 中 。 不 同 特权 级 别 下 处 理 器 使 用 不 同 的 栈 ， 至 于 中 断 处 
理 程序 使 用 的 是 哪个 栈 ， 要 视 它 当时 所 在 的 特权 级 别 ， 因 为 中 断 是 可 以 在 任何 特权 级 别 下 发 生 的 。 除 了 要 保存 
CS、EIP 外 ， 还 需要 保存 标志 寄存 器 EFLAGS， 如 果 涉 及 到 特权 级 变化 ， 还 要 压 入 SS 和 ESP 寄存器。 

下 面 看 看 以 上 寄存 器 入 栈 情 况 及 顺序 ， 这 里 不 再 讨论 有 关 特 权 检 查 的 内 容 。 

(1) 处 理 器 根据 中 断 向 量 号 找到 对 应 的 中 断 描 述 符 后 ， 拿 CPL 和 中 断 门 描述 符 中 选择 子 对 应 的 目标 
代码 段 的 DPL 比 对 ， 若 CPL 权限 比 DPL 低 ， 即 数值 上 CPL > DPL， 这 表示 要 向 高 特权 级 转移 ， 需 要 切换 
到 高 特权 级 的 栈 。 这 也 意味 着 当 执 行 完 中 断 处 理 程 序 后 ， 若 要 正确 返回 到 当前 被 中 断 的 进程 ， 同 样 需要 将 
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te 














栈 恢复 为 此 时 的 旧 栈 。 于 是 处 理 器 先 临 时 保存 当前 旧 栈 SS 和 ESP 的 值 ， 记 作 SS_old 和 ESP_old， 然 后 在 
ESP 中 , 记 作 SS_new 和 ESP_new， 








TSS 中 找到 同 目标 代码 段 DPL 级 别 相同 的 栈 加 载 到 寄存 器 SS 和 















































再 将 








之 前 临时 保存 的 SS_old 和 ESP_old 压 入 新 栈 备份 ， 以 备 返 回 时 重新 加 载 到 栈 段 寄存 器 SS 和 栈 指针 ESP。 





位 数据 后 入 栈 。 此 时 新 栈 内 容 如 图 7-8 中 A 所 示 。 











由 于 SS_old 是 16 位 数据 ，32 位 模式 下 的 栈 操作 数 是 32 位 ， 所 以 将 SS_old 用 0 扩 





展 其 高 16 位 ， 成 为 32 


(2) 在 新 栈 中 压 入 EFLAGS 寄存 器 ， 新 栈 内 容 如 图 7-8 中 B 所 示 。 

















标 代码 段 , 对 于 这 种 段 间 转 移 , 要; 
程序 执行 结束 后 能 恢复 到 被 中 断 的 进 














(3) 由 于 要 切换 至 
和 EIP_old， 以 便 中 断 


Ss 
























































程 。 

















于 第 1 步 中 是 否 涉及 到 特权 级 转移 。 

(4) 某 些 异常 会 有 错误 码 ， 此 错误 码 ) 
以 错误 码 中 包含 选择 子 等 信息 ， 一 会 介 
栈 内 容 如 图 7-8 中 D 所 示 。 




















ES 有 








] 于 报 
绍 。 错 





























告 异 常 是 在 哪个 段 上 发 生 的 ， 也 就 是 异常 发 生 的 位 置 ， 
误 码 会 紧 跟 在 EIP 之 后 入 栈 ， 记 作 ERROR_CODE。 此 时 新 


委 CS 和 EIP 保存 到 当前 栈 中 备份 , 记 作 CS_old 
同样 CS_old 是 16 位 数据 ， 需 要 用 0 填充 
其 高 16 位 ， 扩 展 为 32 位 数据 后 入 栈 。 此 时 新 栈 内 容 如 图 7-8 中 C 所 示 。 当 前 栈 是 新 栈 ， 还 是 旧 栈 ， 取 决 

















所 























如 果 在 第 1 步 中 判断 未 涉及 到 特权 级 转移 ， 便 不 会 到 TSS 中 寻找 新 栈 ， 而 是 继续 使 ) 

















j 当 前 旧 栈 ， 





因此 也 谈 不 上 恢复 旧 栈 ， 此 时 中 断 发 生 时 栈 中 数据 不 包括 SS_old 和 ESP_old。 比 如 中 断 发 生 时 当前 正 





在 运行 的 是 内 核 程 序 ， 这 是 0 特权 级 到 0 特权 级 ， 无 特权 级 变化 ， 














如 图 7-9 所 示 。 


0 


























< SS_new : ESP_new 

























































































< SS_new : ESP_new 




















高 地 址 31 15 0 31 15 
栈 0 SS_old 0 SS_old 
向 ESP_old 昌 SS_new : ESP_new ESP_old 
下 EFLAGS EFLAGS 
扩 
展 
低地 址 
A B 
高 地 址 31 15 0 31 15 
栈 0 SS_old 0 SS_old 
向 ESP_old ESP_old 
下 EFLAGS EFLAGS 
扩 0 CS_old 0 CS_old 
展 EIP_old SS_new : ESP_new EIP_old 
ERROR_CODE 
低地 址 
C D 


中 断 发 生 ， 特 权 级 变化 时 新 栈 中 的 内 容 




























































































































































































4 图 7-8 中断 时 特权 级 变化 时 的 压 械 
处 理 器 进入 中 断 执 行 完 中 断 处 理 程序 后 ， 还 要 返回 到 被 中 断 的 进程 ， 这 是 进入 中 断 的 逆 过 程 。 中 断 返 
回 是 用 iret 指令 实现 的 。Iret， 即 interrupt ret， 此 指令 专用 于 从 中 ”高 地 址 
断 处 理 程序 返回 ， 假 设 在 32 位 模式 下 ， 它 从 当前 术 顶 处 依次 弹出 楼。 [| a 机 
32 位 数据 分 别 到 寄存 器 EIP、CS、EFLAGS 。iret 指令 并 不 清楚 栈 加 Ed 故意 将 当前 术 
中 数据 的 正确 性 ， 它 只 负责 把 栈 项 处 往 上 的 数据 ， 每 次 4 字 节 ， 扩 EIP_old 
对 号 入 座 弹出 到 相关 寄存 器 ， 所 以 在 使 用 iret 之 前 ， 一 定 要 保证 。 展 ， ERCODE| oo os 
栈 顶 往 上 的 数据 是 正确 的 ， 且 从 栈 顶 往 上 的 顺序 是 EIP、CS、 低地 址 





























EFLAGS， 根 据 特权 级 是 否 





由 于 段 寄 存 器 CS 是 16 位 , 故 从 栈 中 返 








16 位 被 丢弃 ， 只 将 低 16 位 载 


变化， 还 有 ESP、SS。 

的 32 位 数据 , 其 
入 到 CS。 若 处 理 器 发 现 返 回 后 特权 
级 会 变化 ， 还 会 继续 将 两 个 双 字 数据 返回 











口 




















到 ESP、SS， 其 中 











也 是 16 位 寄存 器 ， 所 以 同样 也 是 弹出 32 位 数据 后 ， 只 将 其 中 


无 特权 级 变化 时 栈 中 数据 


7-9 中 断 发 生 时 无 特权 级 
SS 变化 时 的 栈 中 内 容 


的 低 16 位 加 载 到 SS。iret 指令 意 


站 
[可 








入 | 
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味 着 从 中 
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斯 返 


顺便 说 一 下 ， 同 类 的 指令 还 有 iretw 和 iretd，16 位 模式 下 用 
有 码 ， 都 可 以 


的 简 


iretd， 取 决 于 伪 指 令 BITS 所 


和 eflags 中 ， 在 不 涉及 到 特权 级 改变 





级 改 





出 32 位 数据 ， 先 丢弃 

















回 ， 所 以 ， 它 是 中 断 处 理 程序 














写 , 无 论 是 在 16 位 模式 ， 还 是 在 
间 明 的 字 


iretw 隐 含 操作 数 是 16 位 ， 所 以 











最 后 一 个 指令 。 





























只 上 




















32 位 模式 下 乡 








A 








iretd 隐 含 操作 数 是 32 位 ， 所 以 

















9 减 6。 















































变 的 情况 下 ， 
注意 ， 如 果 中 


栈 指针 esp 自 减 12。 



































准备 
中 的 


权 级 
这 个 
置 ， 











iret 指令 返回 时 


PY 





高 16 位 ， 只 将 低 16 位 加 载 到 CS， 














数据 对 号 入 座 ， 弹 出 到 各 自 对 









































YE 


iretw，32 位 模式 下 用 iretd。iret 是 iretw 和 iretd 


iret 指令 ， 它 是 被 编译 成 iretw， 还 是 
































在 介绍 调用 门 时 和 大 家 说 过 ， 人 处 型 








器 并 不 记 和 虑 




















检查 ， 所 以 为 了 安全 起 见 ， 处 理 








器 在 返 下 



































从 中 断 处 理 程 序 返 回 的 过 程 ， 
即 指向 EIP_old。 
(1) 当 处 理 器 执行 到 iret 指令 时 ， 





















































它 知 





择 子 CS_old 及 指令 指针 EIP_old。 这 时 候 它 要 进 











道 要 执行 远 返 回 ， 




















RPL 位 ， 即 未 来 的 CPL， 判 断 在 返回 过 程 中 是 否 要 改变 特权 级 。 


规则 
充 为 


将 EIP_old 加 载 到 EIP 寄存 器 ， 之 后 栈 指针 指向 EFLAGS。 如 果 进 入 ! 
断后 ， 是 继续 使 


《2) 栈 中 CS 选择 子 是 








CS_old, 根 所 




































































首先 需要 从 栈 中 返回 被 中 断 进 
行 特权 级 检查 。 先 检查 栈 中 CS 选择 子 CS_old， 根 据 其 


居 CS_old 对 应 的 代码 段 的 DPL 及 CS_old 中 
不 再 袭 述 。 如 果 检 查 通过 ， 随 即 需要 更 新 寄存 器 CS 和 EIP。 由 了 














E 从 栈 中 弹出 32 位 数据 到 寄存 器 EIP， 再 









































只 用 在 16 位 模式 下 。 它 依次 从 栈 中 分 别 弹 出 2 字 节 到 寄存 器 卫 、CS 
的 情况 下 ， 栈 指针 sp 
在 32 位 模式 下 。 它 
再 弹出 32 位 数据 到 eflags 中 。 在 











单 
` 涉 及 到 特权 


mm 








断 有 错误 码 ， 处 理 器 并 不 会 主动 跳 过 它 的 位 置 ， 咱 们 必须 手动 将 其 跳 过 ， 也 就 是 说 ,在 
， 当 前 栈 指针 esp 必须 指向 栈 中 备份 的 EIP_old 所 在 的 位 置 ， 这 样 处 理 器 才能 将 栈 
立 的 寄存 器 中 。 














自己 来 到 这 儿 之 前 〈 此 处 是 指 进入 中 断 ) 已 经 做 过 了 特 
到 被 中 断 过 程 中 也 要 再 进行 一 次 特权 级 检查 ， 下 另 














1 虽 们 聊 聊 
































段 设 此 时 已 经 手动 将 ERROR _CODE 从 栈 中 弹出 , 栈 顶 已 位 








的 位 


本 全 














的 RPL 做 特权 级 检查 


程 的 代码 段 选 

















F CS_old 在 入 栈 时 已 经 将 高 16 位 扩 


0， 现 在 是 32 位 数据 ， 段 寄存 器 CS 是 16 位 ， 故 处 理 器 丢弃 CS_old 高 16 位 ， 将 低 16 位 加 载 到 CS， 



































ESP_old (说 明 在 之 前 进入 ! 

















针 是 
断后 











此 时 











站 








的 是 TSS 中 记录 的 新 栈 )。 











] 旧 栈 )。 




















断 时 未 涉及 特权 级 转移 ， 此 时 栈 指 
否则 栈 指针 是 ESP_new 〈 说 明 在 之 前 进入 中 














(3) 将 栈 中 保存 的 EFLAGS 弹出 到 标志 寄存 器 EFLAGS。 如 果 在 第 1 步 中 判断 返回 后 要 改变 特权 级 ， 














栈 指针 是 ESP_new， 它 指向 栈 ! 





是 ESP_old， 栈 中 己 无 因此 次 中 断 发 9 












































的 ESP_old。 否 则 进入 中 断 时 属 
而 入 栈 的 数据 ， 栈 指针 指向 中 断 发 生前 的 栈 顶 。 
判断 出 返回 时 需要 改变 特权 级 ， 也 就 是 说 需要 


平 级 转移 ，| 











于 





次 复 | 








] 的 是 旧 

















栈 ， 此 时 栈 指 














日 栈 ， 山 才 便 





CH 


需要 将 ESP_old 

















和 SS_old 分 别 加 载 到 寄存 器 ESP 及 SS， 丢弃 寄存 器 SS 和 ESP 中 原 有 的 SS_new 和 ESP_new， 同 时 进行 


特权 





级 检查 。 补 充 ， 由 于 SS_old 在 入 








重新 








们 之 
返 忆 
过 啦 



































至 此 ， 处 理 器 回 到 
注意 ， 如 果 在 返回 



































后 的 CPL> 数 据 段 描述 符 的 DPL， 
， 原 理 是 选择 子 为 0 便 指 向 GDT 












































所 以 
成 ， 
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下 面 说 说 | 





断 错 误 码 。 





























已 经 





栈 时 


] 处 至 














1 











器 将 高 16 位 填充 














已 二 - 
段 























处 理 器 将 把 数值 0 填充 到 相应 的 段 寄存 器 。 原 








口 




















加 载 到 栈 段 寄存 器 SS 之 前 ， 需 要 将 SS_old 高 16 位 剥离 丢弃 ， 
了 被 中 断 的 那个 进程 。 
时 需要 改变 特权 级 ， 将 会 检查 数 寺 
中 ， 某 个 寄存 器 中 选择 子 所 指向 的 数据 





述 符 的 DPL 权限 比 返 


/~、 








口 

















为 0， 现在 是 32 位 数据 ， 所 以 在 
其 低 16 位 加 载 SS。 
































中 第 0 个 段 描 
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格式 如 医 








7-10 所 示 。 





因 在 介 











届 段 寄存 器 DS、ES、FS 和 GS 的 内 容 ， 如 果 在 它 
后 的 CPL (CS.RPL) 高 ， 即 数值 上 





绍 调用 门 时 说 

















述 符 ， 该 段 描述 符 不 可 用 ， 从 而 故意 使 处 理 器 抛 异常 。 
如 果 大 伙 儿 忘记 啦 ， 可 以 参考 从 调用 门 返 回 时 的 部 分 。 


7.4.3 ”中断 错误 码 














有 些 中 断 会 在 栈 中 压 入 错误 码 ， 有 点 “临终 遗言 ,提供 线索 ”的 意味 ， 用 来 指明 中 断 发 4 
， 错 误 码 最 主要 的 部 分 就 是 选择 子 ， 只 不 过 此 选择 子 可 以 在 多 和 





和 表 中 检索 描述 符 。 错 码 


在 哪个 段 上 。 
码 由 几 部 分 组 





















































































































































您 看 ， 错 误 码 和 选择 子 的 格式 很 像 吧 ， 只 是 低 2 位 不 再 是 RPL， 而 是 EXT 和 IDT。 总 之 ， 错 误 码 本 
质 上 就 是 个 描述 符 选择 子 ， 通 过 低 3 位 属性 来 修饰 ”3 15 32 1 0 
此 选择 子 指向 是 哪个 表 中 的 哪个 描述 符 。 保留 0 选择 子 高 13 位 索引 | TI | IDT | EXT 
EXT 表示 EXTernal event， 即 外 部 事件 ， 用 来 
各 明 中 断 源 是 否 来 自 处 理 器 外 部 ， 如 果 中 断 源 是 不 人 
可 屏蔽 中 断 NMI 或 外 部 设备 , EXT 为 1, 否则 为 0。 4 图 /一 0 错误 码 
IDT 表示 选择 子 是 否 指向 中 断 描述 符 表 IDT，IDT 位 为 1， 则 表示 此 选择 子 指向 中 断 描 述 符 表 ， 否 则 















































































































































































































































































































































指向 全 局 描述 符 表 GDT 或 局 部 描述 符 表 LDT。 

TI 和 选择 子 中 TI 是 一 个 意思 ， 为 0 时 用 来 指明 选择 子 是 从 GDT 中 检索 描述 符 ， 为 1 时 是 从 LDT 中 
检索 描述 符 。 当 然 ， 只 有 在 IDT 位 为 0 时 TI 位 才 有 意义 。 

选择 子 高 13 位 索引 就 是 选择 子 中 用 来 在 表 中 索引 描述 符 用 的 下 标 。 

高 16 位 是 保留 位 ， 全 0。 

有 时 候 不 仅 错误 码 的 高 16 位 全 为 0， 低 16 位 也 全 为 0， 那 一 个 全 0 的 错误 码 能 指明 什么 信息 ? 当 全 
0 的 错误 码 出 现时 ， 表 示 中 断 的 发 生 与 特定 的 段 无 关 ， 或 者 引用 了 一 个 空 描述 符 ， 引 用 描述 符 就 是 往 段 寄 
存 器 中 加 载 选择 子 的 时 候 ， 处 理 器 发 现 选择 子 指向 的 描述 符 是 空 的 。 

中 断 返回 时 ，iret 指令 并 不 会 把 错误 码 从 栈 中 弹出 ， 所 以 在 中 断 处 理 程 序 中 需要 手动 用 栈 指 针 跨 过 错 
误 码 或 将 其 弹出 。 和 否则 栈 顶 处 若 不 是 EIP (EIP_ old) 的 话 ，iret 返回 时 将 会 载 入 错误 的 值 到 后 续 寄 存 器 。 

通常 能 够 压 入 错误 码 的 中 断 属于 中 断 向 量 号 在 0 一 32 之 内 的 异常 ， 而 外 部 中 断 (中 断 向 量 号 在 32 一 
255 之 间 ) 和 int 软 中 断 并 不 会 产生 错误 码 。 通 常 我 们 并 不 用 处 理 错误 码 。 











可 编程 中 断 控制 器 X94 
































































































































我 们 本 节 将 介绍 可 屏蔽 中 断 的 代理 一 一 可 编程 中 断 控制 器 8259A。 

8259A 的 作用 是 负责 所 有 来 自 外 设 的 中 断 ， 其 中 就 包括 来 自 时 钟 的 中 断 ， 以 后 我 们 要 通过 它 完成 进程 
调度 。 尽 管 我 们 实际 对 8259A 编程 的 部 分 并 不 多 ， 但 不 把 它 通 透 介 绍 一 番 的 话 ， 即 使 我 告诉 您 应 该 如 何 
使 用 它 ， 您 也 不 会 真正 清楚 自己 为 什么 要 这 么 做 ， 这 必然 不 是 本 书 的 初衷 。 所 以 我 一 定 要 帮助 大 伙 儿 把 
8259A 的 工作 原理 搞 清楚 ， 我 会 努力 的 。 
7.5.1 8259A 介绍 


为 了 让 CPU 获得 每 个 外 部 设备 


中 断 ， 但 这 是 不 可 能 
少 引 脚 都 不 够 ) 

















上 一 节 中 我 们 说 到 ， 可 
8 的 中 晰 者 


机 、 声 卡 等 ， 其 发 
行 在 CPU 上 执行 的 
它 到 底 先 响应 哪个 
CPU 
脆 请 个 专人 来 做 这 事 [ 





?》 


























的 中 断 信号 ， 最 好 的 
9， 计 算 机 中 提 





E 了 很 多 外 部 设备 ， 而 且 外 设 数量 是 没有 上 限 的 ， 无 论 CPU 中 ? 
j， 况 且 ， 引 脚 越 多 ， 体 积 越 大 ， 我 们 还 嫌 


方式 是 在 CPU 中 为 每 一 个 外 设 准备 一 个 引 脚 接收 
侍 备 多 





























前 CPU 的 体积 大 呢 。 




















CPU 每 次 只 



































了 ， 不 仅 要 占用 





ee 
是 否 要 


CPU 时 间 ， 而 且 还 要 





屏蔽 中 断 是 通过 INTR 信号 线 进入 CPU 的 ， 一 般 可 独立 运行 的 外 部 设备 ， 如 打印 
了 是 可 屏蔽 中 断 ， 都 共享 这 一 根 INTR 信和 号 线 通知 CPU。 大 家 想 想 看 ， 伯 
能 执行 一 个 任务 ， 如 果 同 时 有 多 个 外 设 发 出 中 断 ， 而 CPU 
尼 ? 还 有 , 为 了 不 使 这 些 中 断 丢 失 ， 
来 做 的 话 ， 似 乎 有 些 大 材 小 


日 
所 











EF 务 是 上 上 
只 能 先 处 理 一 个 ， 
个 中 断 队 列 ? 这 些 问 题 如 果 让 
占用 内 存 来 存储 中 断 队列 ， 所 以 ， 干 





得 











为 它们 单独 维护 






































巴 ， 这 个 专 ， 





人 士 就 是 中 断代 理 























它 负 责 对 所 有 中 断 仲裁 ， 决 定 哪个 中 断 优 先 被 CPU 


























受理 。 这 有 点 像 大 
断代 理 有 很 多 
中 断 控制 器 (PIC) 8 
8259A 有 哪些 功 
8259A 用 于 管理 
中 断 向 量 号 等 功能 。 
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臣 和 旺 马 


的 关 
种 ,我 们 这 里 采用 的 是 较 
259A。 
能 呢 ? 
和 控制 可 
而 它 称 为 


， 低 阶 官员 写 的 奏折 只 


a 
流行 




















已 表现 在 
寻 ， 就 是 





屏蔽 中 断 ， 
可 编程 的 原 
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的 中 断代 到 


异 蔽 外 设 中 断 ， 对 它们 实行 优先 级 判决 
以 通过 编程 的 方式 来 设置 以 上 的 ] 


























能 先 交 给 大 臣 ， 由 大 臣 决 定 是 否 要 呈 给 星 帝 过 目 。 
的 可 编程 


EIntel 8259A 芯片 ， 就 是 本 节 所 说 上 






































， 向 CPU 提供 
功能 。 
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对 于 初学 者 ，8259A 的 设置 有 些 复杂 ， 咱 们 还 是 多 花 点 篇 幅 来 介绍 ， 和 希望 大 伙 儿 不 要 嫌 我 咖 嗪 。 

Intel 处 理 器 共 支 持 256 个 中 断 ， 但 8259A 只 可 以 管理 8 个 中 断 ， 不 知道 Intel 这 是 要 闸 哪 样 ， 所 以 它 
为 了 多 支持 一 些 中 断 设 备 ， 提 供 了 另 一 个 解决 方案 ， 将 多 个 8259A 组 合 ， 官 方术 语 就 是 级 联 。 有 了 级 联 
这 种 组 合 后 ， 每 一 个 8259A 就 被 称 为 1 片 。 若 采用 级 联 方式 ， 即 多 片 8259A 芯片 串 连 在 一 起 ， 最 多 可 级 
联 9 个 ,也 就 是 最 多 支持 64 个 中 断 .n 片 8259A 通过 级 联 可 支持 7n+1l 个 中 断 源 , 级 联 时 只 能 有 一 片 8259A 
为 主 片 master， 其 余 的 均 为 从 片 slave。 来 自从 片 的 中 断 只 能 传递 给 主 片 ， 再 由 主 片 向 上 传递 给 CPU， 也 
就 是 说 只 有 主 片 才 会 向 CPU 发 送 INT 中 断 信 和 号 。 

每 个 独立 运行 的 外 部 设备 都 是 一 个 中 断 源 ， 它 们 所 发 出 的 中 断 ， 只 有 接 在 中 断 请 求 (IRQ: Interrupt 
ReQuest) 信号 线 上 才能 被 CPU 大 神 知晓 ， 这 也 就 是 大 家 在 开机 时 ， 电 脑 屏幕 上 会 看 到 的 IRQ1…IRQn， 
这 些 都 是 为 外 部 设备 所 分 配 的 中 断 号 。 

我 们 说 下 什么 是 级 联 。 由 于 单个 8259A 芯片 只 有 8 个 中 断 请 求 信号 线 : IRQ0~IRQ7， 这 显然 是 不 够 
用 的 ， 所 以 它 提 供 了 一 种 组 合 的 方式 ， 可 以 将 多 个 自己 像 串联 电路 一 样 组 合 在 一 起 ， 提 供 更 多 的 中 断 请 求 
信号 线 。 这 种 组 合 方式 就 称 为 级 联 (cascade)， 乍 一 听 是 否 觉得 很 熟悉 ? 咱们 平时 用 的 交换 机 或 hub 都 是 
这 样 做 的 ， 一 个 交换 机 上 的 网 线 接 口 是 有 限 的 ， 当 上 网 的 人 多 了 接口 不 够 用 的 时 候 ， 只 能 再 买 个 交换 机 插 
在 老 交 换 机 上 做 扩展 ， 这 就 是 典型 的 级 联 。8259A 也 是 这 样 的 道理 ,无非 是 交换 机 传输 的 是 数据 链 路 层 数 
据 报 文 ，8259A 传输 的 是 外 设 的 中 断 向 量 。 
在 咱们 的 个 人 电脑 中 只 有 两 片 8259A 芯片 ， 也 就 是 说 ， 一 共 16 个 IRQ 接口 。 不 过 ,单独 使 用 哪个 芒 
片 都 只 能 支持 8 个 中 断 源 ， 它 们 只 有 通过 级 联 后 才能 都 利用 上 ， 根 据 前 面 所 说 的 公式 ， 最 多 也 只 是 支持 
7*2+1=15 个 中 断 。 为 什么 不 是 2*8=16 个 ?因为 级 联 一 个 从 片 , 要 占用 主 片 一 个 IRQ 接口 , 而 从 片上 的 IRQ 
接口 不 被 占用 ， 从 片上 有 专门 的 接口 用 于 级 联 (相当 于 从 片上 向 CPU 发 送 INT 信号 的 接口 插 在 了 主 片 上 的 
某 个 IRQ)。 这 和 级 联 交 换 机 的 原理 是 一 样 的 ， 交 换 机 上 通 向 网 关 的 接口 是 单独 的 ， 下 级 交换 机 必须 用 该 接 
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口 通过 网 线 接 在 核心 交换 机 的 某 个 普通 网 卡 接口 上 。 IRQ0 时 钟 
外 部 设备 和 8259A 芯片 是 独立 的 ， 它 们 也 得 通过 信 J 
号 线 连接 到 8259A， 主 板 电路 上 已 经 实现 了 这 些 ， 咱 们 INTR 主 [IRQ3 串口 2 
只 要 把 外 设 往 主板 上 一 插 ， 这 些 设备 自动 就 和 8259A 连 | CPU 
接 上 了 。 这 些 设备 在 发 中 断 的 时 候 都 以 为 是 直接 发 给 了 语气 生生 
CPU， 它 们 并 不 知道 中 间 还 隔 着 个 中 断代 理 ，8259A 在 | IRQ7 并 口 1 
收 到 了 中 断后 ， 对 中 断 判 优 ， 将 优先 级 最 高 的 中 断 转发 | i 
给 CPU 处 理 。 NMI IRQ9 重 定向 的 IRQ2 
有 了 8259A 这 个 中 断代 理 ， 咱 们 重新 审视 下 可 屏蔽 a 
中 断 和 CPU 的 关系 ， 如 图 7-11 所 示 。 8259 | IRQ12 PS/2 鼠标 
8259A 内 部 的 工作 流程 是 怎么 样 的 呢 ? 为 了 给 大 家 A 
说 清楚 , 咱们 得 了 解 下 8259A 的 内 部 结构 , 请 见 图 7-12。 IRQ15 保留 
图 7-12 所 示 是 8259A 内 部 结构 逻辑 示意 图 , 这 里 有 
_ 些 信号 和 寄存 器 给 大 家 介绍 下 。 4 图 7-11 个 人 计算 机 中 的 级 联 8259A 














。 INT: 8259A 选 出 优先 级 最 高 的 中 断 请 求 后 ， 发 信号 通知 CPU。 

。 INTA: INT Acknowledge， 中 断 响应 信号 。 位 于 8259A 中 的 INTA 接收 来 自 CPU 的 INTA 接口 的 
中 断 响应 信号。 

。 IMR: Interrupt Mask Register， 中 断 屏蔽 寄存 器 ， 宽 度 是 8 位 ， 用 来 屏蔽 某 个 外 设 的 中 断 。 

。 JIRR: Interrupt Request Resgister， 中 断 请 求 寄存 器 ， 宽 度 是 8 位 。 它 的 作用 是 接受 经 过 IMR 寄存 器 过 
滤 后 的 中 断 信号 并 锁 存 ， 此 寄存 器 中 全 是 等 待 处 理 的 中 断 ,“ 相 当 于 ”5259A 维护 的 未 处 理 中 断 信 号 队列 。 

。 PR: Priority Resolver， 优 先 级 仲裁 器 。 当 有 多 个 中 断 同时 发 生 ， 或 当 有 新 的 中 断 请 求 进来 时 ， 将 
蕊 与 当前 正在 处 理 的 中 断 进 行 比较 ， 找 出 优先 级 更 高 的 中 断 。 

e ISR: In-Service Register， 中 断 服务 寄存 器 ， 宽 度 是 8 位 。 当 某 个 中 断 正在 被 处 理 时 , 保存 在 此 寄存 器 中 。 










































































































































































以 上 介绍 的 寄存 器 都 是 8 位 ， 这 是 有 We 
位 代表 8259A 的 每 个 IRQ 
对 应 的 IRQ 接口 





存 器 中 的 每 一 
的 位 便 表 示 处 理 





i 














来 




























INT 控制 
INTA 电路 


4———————P>| 





优先 权 判 别 器 
(PR) 





受 | 





7-12 8259A 芯片 


内 部 结构 



































原因 是 8259A 
的 位 图 








共 8 个 IRQ 接口 ， 
， 这 样 在 后 续 的 操作 中 ， 

















接口 
断 


言 号 。 
































的 














在 “有 图 有 
工作 流程 了 。 


真相 ” 


























当 某 个 外 设 发 出 一 个 中 断 信号 时 ， 











所 以 该 ! 








> 后, 
































中 断 信 号 。IMR 寄存 器 : 











的 位 ， 











位 已 经 被 置 











1, 即 表示 来 自 

















寄存 器 ， 
列 。 在 茶 个 恰当 














通过 INT 接 
至 











将 该 IRQ 接口 所 在 IRR 寄存 器 中 对 应 的 BIT 置 


该 IRQ 接 





由 于 主板 上 已 经 将 信号 





re 








蔽 了 来 
为 0， 则 表示 中 断 放 行 。 如 果 该 






































为 1， 则 表示 中 上 断 屏 蔽 ， 














们 看 看 当 8259A 收 到 一 个 中 断后 会 发 生 什么 呢 ? 现在 可 以 介 


号 通路 指向 了 8259A 芯片 的 某 个 IRQ 接 
断 信 号 最 终 被 送 入 了 8259A。8259A 首先 检查 IMR 寄存 器 中 是 否 已 经 屏 该 IRQ 接 


IRQ 对 应 的 相应 


可 以 用 8 位 寄 
操作 寄存 器 中 


站 绍 8259A 的 


口 ， 
口 的 





























上 的 中 断 己 经 被 屏 巩 了 , 则 将 该 中 断 信 号 丢弃 , 否则 ， 








将 其 送 入 IRR 














1。IRR 寄存 器 的 作用 “相当 于 ” 

















时 机 ， 优 先 级 人 f 








! 裁 器 PR 会 从 IRR 寄存 器 中 挑选 一 个 优先 级 最 











判 很 简单 ， 就 是 IRQ 接口 号 越 
口 向 CPU 发 送 INTR 信号 
| 来 了 ， 又 有 活 干 了 ， 于 是 CPU 将 手 旦 














竺 处 理 中 断 队 








大 的 中 断 ， 此 处 的 优先 级 决 


氏 ， 优 先 级 越 大 ， 所 以 IRQ0 优先 级 最 大 。 之 后 ，8259A 会 在 控制 电路 中 ， 























音 号 被 送 入 了 CPU 
的 指令 执行 完 后 ， 





后 , 这 样 CPU 便 知 
己 的 INTA 接 


的 INTR 接口 
马上 通过 自 
























































j 这 个 信 
前 正在 处 理 























的 中 断 ， 同 











BE 











就 
量 


量 号 被 修改 ， 原 因 后 画 























接口 回复 一 个 中 断 响 应 信号 ， 表 示 现 在 CPU 我 已 准备 好 啦 ，8259A 你 可 以 继续 后 面 
号 后 ， 立 即将 刚才 选 








对 应 的 BIT 置 0。 之 后 ，CPU 将 再 次 发 送 INTA 
ee 0 一 255 
会 说 )， 


来 的 优先 级 最 大 的 中 断 在 ISR 寄存 器 中 对 应 的 BIT 置 
时 要 将 该 中 断 从 “ 待 处 理 


的 “整数 ”。 
所 以 用 起 始 中 断 向 



































断 队 列 ” 寄 存 器 IRR 中 去 掉 ， 也 就 是 在 
言 号 给 8259A， 这 一 次 是 想 获 取 中 
| 于 大 部 分 情况 下 8259A 的 起 始 中 断 向 量 号 
量 号 +IRQ 接口 号 便 是 该 设备 的 中 断 拨 
向 量 号 这 回 事 ， 不 知道 自己 会 被 中 
































a 
1 里 宁 ， 
























































ee 但 它 并 不 知道 还 有 : 
随后 ，8259A 


配 一 个 这 样 的 整数 。 


















































将 此 中 断 向 量 


号 
与 











该 中 断 向 量 号 后 ， 用 它 做 ! 








时 

















向 量 表 或 中 断 描述 符 























的 索引 ， 


道 有 新 的 中 断 





向 8259A 的 INTA 
的 工作 。 
1， 此 寄存 器 表示 当 





8259A 在 收 





IRR 中 将 该 中 


断 对 应 的 中 断 向 量 号 ， 
号 并 不 是 0〈 起 始 中 断 向 





由 此 可 见 ， 外 


断代 理 (如 8259A) 分 
通过 系统 数据 总 线 发 送 给 CPU。CPU 从 数据 总 线 上 拿 到 
找到 相应 的 中 断 处 理 程序 并 去 








执行 





























处 理 流程 到 


这 就 结束 了 吗 ? 还 早 还 早 , 这 才刚 完成 了 上 











若 被 设置 为 非 E 

















到 EOI 后， 将 当前 1 





- 处 理 

















动 模式 〈 手 工 模式 )， 中 




















自动 将 此 中 断 在 ISR 
并 不 是 进入 
在 8259A 发 送 : 






























































向 量 号 发 给 CPU。 您 看 ， 
来 的 中 断 优先 级 较 低 ， 











入 了 ISR 后 的 ! 


























场 。 如 果 8259A 的 <“EOI 通 知 (End 























新 处 理 
































言 号 后 ， 也 就 是 CPU 向 8259A 要 中 断 向 量 号 的 习 











对 应 的 BIT 置 0。 









































本 来 


依然 会 被 放 进 IRR 寄存 器 中 等 待 处 理 。 


断 就 高 枕 无 忧 等 着 国 
断 向 量 号 给 CPU 之 前 , 这 时 候 又 来 了 
也 就 是 优先 级 更 高 ， 原 来 ISR 中 准备 上 CPU 处 理 
中 的 相应 BIT 恢复 为 1， 随后 在 ISR 中 将 此 优先 






































的 旧 中 断 ， 其 对 应 的 BIT 就 得 清 0 
级 更 高 的 新 中 断 对 应 的 BIT 置 1， 然后 将 此 
面 圣 的 ， 屁 股 还 没 坐 热 ， 结 果 还 是 被 换 了 下 来 。 














高 高 兴 兴 去 


























Of Interrupt)” 


程序 结束 处 必须 有 向 8259A 发 送 EOI 的 代码 ，8259A 在 收 
的 中 断 在 ISR 寄存 器 中 对 应 的 BIT 置 0。 如 果 “EOI 
在 刚才 8259A 接收 到 第 二 个 INTA 





通知 ”被 设置 为 自动 模式 ， 
了 个 INTA，8259A 会 


面 见 圣 上 CPU 了 , 它 还 是 有 可 能 被 后 者 换 下 来 的 。 比 如 ， 
新 的 中 断 , 如 果 它 的 来 源 IRQ 接口 号 比 ISR 中 的 低 ， 
同时 将 它 所 在 的 IRR 














新 中 断 的 中 断 


当然 ， 如 果 新 
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以 上 整个 过 程 就 像 皇 帝 上 早 朝 一 样 ， 皇 帝 起 床 洗 汶 完 毕 后 到 了 人 金 套 殿 〈 相 当 于 CPU 开机 运行 后 )， 说 
了 句 :“ 众 位 爱 卿 ， 有 本 启 奏 ， 无 本 退 朝 ”。8259A 带 着 几 本 重要 奏折 说 :“ 老 臣 有 本 要 奏 ” 用 声音 向 皇上 
的 耳 条 发 了 个 信号 。 星 上 听 到 后 回复 一 句 :“82$9A， 有 何事 啊 ? ”也 是 用 声音 向 8259A 的 耳 条 传 了 个 应 
答 信 号 。8259A 一 听 , 这 表示 皇上 现在 心情 不 错 有 时 间 处 理 奏折 , 于 是 把 心里 最 重要 的 那个 奏折 挑 了 出 来 ， 
剩 下 的 几 个 奏折 准备 一 会 再 启 奏 。 这 时 候 皇 上 说 :“ 呈 上 来 ” 于 是 8259A 便 把 奏折 交 给 了 数据 总 线 太监 
同学 ， 皇 上 从 太监 那里 拿 到 了 奏折 后 ， 开 始 处 理 。 

8259A 是 “可 编程 ”中 断 控制 器 ,在 了 解 8259A 的 工作 原理 后 ， 咱 们 该 去 了 解 如 何 对 其 编程 了 。 说 
实话 ， 当 初 我 头 一 次 接触 它 的 时 候 ， 觉 得 它 的 设置 好 麻烦 ， 时 隔 今 日 ， 我 依然 觉得 不 顺手 。 对 于 新 手 来 说 
确实 有 点 难 ， 不 过 咱们 只 做 最 基本 的 设置 ， 能 让 它 跑 起 来 就 行 。 

为 叙述 方便 ， 咱 们 下 面 只 讨论 32 位 保护 模式 下 的 中 断 情 况 。 

刚才 咱们 说 过 ， 外 部 设备 不 知道 自己 还 有 个 中 断 向 量 号 ， 这 完全 是 8259A 来 分 配 的 ， 其 实 这 人 句 话 # 
不 完全 正确 ， 因 为 8259A 是 咱们 通过 编程 来 设置 的 ， 归 根 结 底 还 是 咱们 人 来 控制 的 ， 下 面 给 各 位 说 说 ， 
话 要 从 头 说 起 …… 

软件 的 舞台 要 靠 硬件 的 支撑 ， 为 开发 方便 ， 很 多 功能 都 是 由 硬件 原生 支持 的 ， 因 此 ，CPU 也 提供 了 
中 断 处 理 的 框架 。 在 此 框架 中 ， 咱 们 只 要 填 入 所 需要 的 数据 即 可 ， 其 他 的 工作 由 CPU 自动 运作 。 和 中 断 
处 理 相 关 的 数据 结构 是 中 断 描述 符 表 和 中 断 向 量 号 , 我 们 要 做 的 工作 就 是 准备 这 两 项 。 中断 描 述 符 表 也 称 
为 IDT， 我 们 会 在 下 一 节 中 介绍 。 既 然 称 为 “描述 符 ” 的 表 ， 说 明 它 和 全 局 描述 符 表 GDT 类 似 ， 表 中 的 
每 一 项 都 是 8 字 节 的 描述 符 (这 里 还 是 要 提 一 句 , 实 模式 下 的 中 断 向 量 表 IVT 中 的 每 一 项 大 小 是 4 字 节 )， 
我 们 曾经 构建 过 GDT， 再 次 构建 类 似 的 结构 一 点 也 不 难 。 不 过 有 区 别 的 是 中 断 描 述 符 表 本 质 上 就 是 中 断 处 
理 程序 地 址 数组 ， 而 中 断 向 量 号 便 是 此 数组 的 索引 下 标 ， 这 就 是 中 断 向 量 号 是 个 整数 的 原因 。CPU 不 支持 
“数组 名 [索引 ]” 的 形式 ， 那 是 高 级 语言 编译 器 支持 的 东西 ， 它 最 终 也 要 编译 转换 成 某 种 内 存 寻 址 方式 之 一 ， 
必须 得 用 最 基本 的 形式 一 一 地 址 来 访问 内 存 。 当 CPU 接收 到 8259A 送 来 的 中 断 向 量 号 后 要 将 其 乘 以 8， 
再 加 上 中 断 描述 符 表 的 起 始 地 址 ， 经 过 内 存 寻 址 ， 最 终 定 位 到 目标 中 断 处 理 程序 。 

以 上 说 的 是 中 断 处 理 框架 的 流程 ， 我 们 要 做 的 确实 很 简单 。 

(1) 构造 好 IDT。 

(2) 提供 中 断 向 量 号 。 

外 部 设备 不 知道 中 断 向 量 号 这 回 事 ， 它 只 负责 发 中 断 信 号 。 中 断 向 量 号 是 8259A 传送 给 CPU 的 ， 
8259A 是 由 咱们 来 控制 的 ， 中 断 描述 符 表 也 是 咱们 构造 的 ， 不 知道 大 家 有 没有 注意 到 ， 我 们 要 做 的 事 其 
就 是 “自圆其说 ”， 自己 为 外 部 设备 设置 好 中 断 向 量 号 ， 然 后 自己 在 中 断 描述 符 表 中 的 对 应 项 添加 好 合 
的 中 断 处 理 程序 。 

好 啦 ， 我 不 能 再 咖 叶 了 ， 本 节 到 此 结束 ， 下 节 咱 们 看 看 如 何 通过 编程 8259A 来 设置 这 些 。 


7.5.2 ”8259A 的 编程 


既然 8259A 称 为 可 编程 中 断 控制 器 ， 就 说 明 它 的 工作 方式 很 多 ， 咱 们 就 要 通过 编程 把 它 设 置 成 需要 
的 样子 。 对 它 的 编程 也 很 简单 ， 就 是 对 它 进行 初始 化 ， 设 置 主 片 与 从 片 的 级 联 方式 ， 指 定 起 始 中 断 向 量 号 
以 及 设置 各 种 工作 模式 。 
其 实 ， 不 光 是 咱们 要 操作 8259A， 在 开机 之 后 的 实 模式 下 ，BIOS 也 对 它 光 顾 过 ，8259A 的 卫 Q0 一 7 
已 经 被 BIOS 分 配 了 0x8 一 0xf 的 中 断 向 量 号 。 而 在 保护 模式 下 ， 大 家 从 表 7-1 中 已 经 看 到 了 ， 中 断 向 量 号 
为 0x8 一 0xf 的 范围 已 经 被 CPU 占 了 ， 分 配给 了 各 种 异常 ， 咱 们 还 得 重新 为 8259A 芯片 上 的 IRQ 接口 们 
分 配 中 断 向 量 号 。 
中 断 向 量 号 是 逻辑 上 的 东西 ， 它 在 物理 上 是 8259A 上 的 IRQ 接口 号 。8259A 上 IRQ 号 的 排列 顺序 是 
固定 的 ， 但 其 对 应 的 中 断 向 量 号 是 不 国定 的 ， 这 其 实 是 一 种 由 硬件 到 软件 的 映射 ， 通 过 设置 8259A， 可 以 
将 IRQ 接口 映射 到 不 同 的 中 断 向 量 号 。 
在 8259A 内 部 有 两 组 寄存 器 ， 一 组 是 初始 化 命令 寄存 器 组 ， 用 来 保存 初始 化 命令 字 《Initialization 
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75 _ 可 编程 中 断 控制 器 8259A 


Command Words, ICW), 





ICW 共 4 个 ，ICW1~ICW4。 





另 一 组 寄存 器 是 操作 命令 寄存 器 组 ， 




















来 保存 操 


作 命 令 字 (Operation Command Word，OCW)，OCW 共 3 个，OCW1~OCW3。 所 以 ， 我 们 对 8259A 的 


编程 ， 





一 部 分 是 用 ICW 
其 编程 就 是 往 8259A 的 端 











入 很 多 设置 ， 某 些 设置 之 i 
了 分 要 求 严格 的 顺序 ， 必 须 依 
OCW 来 操作 控制 8259A， 前 本 
口 发 送 OCW 实现 的 。OCW 的 发 送 

下 面 分 别 说 一 下 每 个 ICW 和 OCW， 这 是 本 节 的 习 





所 以 这 间 











男 





部 分 是 用 





也 分 为 初始 化 和 操 


乍 两 部 分 。 




















发 送 一 系列 ICW 。 
是 具有 关联 、 依 赖 性 























日 














做 初始 化 ， 用 来 确定 是 否 需要 级 


联 ， 设 置 起 始 中 断 应 























掉 的 某 个 设置 会 依赖 前 | 





H 








次 写 入 ICW1、 





























顺序 不 固 





























































































































一 次 虱 
某 个 ICW 写 入 的 设置 ， 


量 写 ， 设 置 中 断 结束 模式 。 
于 从 一 开始 就 要 决定 8259A 的 工作 状态 ， 所 以 要 
的 ， 也 许 后 
ICW2、ICW3、ICW4。 

所 说 的 中 断 屏蔽 和 中 断 结束 ， 就 是 通 
定 ，3 个 之 中 先 发 送 哪个 都 可 以 。 
点 ， 需 要 花 点 精力 了 ， 其 





E 写 


过 往 8259A 端 





实 它们 本 身 并 不 难 ， 只 是 


















































咱们 接触 得 少 ,所 以 在 学 习 过 程 中 可 能 会 显得 不 是 那么 轻松 ， 建 议 先 去 洗 个 脸 精 神 精神 回来 再 看 …… 闲 话 
少 说 ， 哥 几 个 走 起 。 
ICW1 用 来 初始 化 8259A 的 连接 方式 和 中 断 信 号 的 触发 方式 。 连 接 方 式 是 指 用 单 片 工作 ， 还 是 用 多 片 
级 联 工作 ， 触 发 方式 是 指 中 断 请 求 信号 是 电 平 触发 ， 还 是 边沿 触发 。 
注意 ，ICW1 需要 写 入 到 主 片 的 0x20 端口 和 从 片 的 0xA0 端口 ， 如 图 7-13 所 示 。 
IC4 表示 是 否 要 写 入 ICW4， 这 表示 ， 并 不 是 所 有 的 ICW 初始 ICW1 
化 控制 字 都 需要 用 到 。IC4 为 1 时 表示 需要 在 后 面 写 入 ICW4, 为 0 
则 不 需要 。 注 意 ，x86 系统 IC4 必须 为 1 。 7 6 5 4 3 2 家 -让 
SNGL 表示 single， 若 SNGL 为 1， 表 示 单 片 , 若 SNGL 为 0, 表 en 和 





示 级 联 (cascade )。 这 里 说 一 下 ， 若 妖 
个 ) 和 从 片 ( 多 个 ) 用 哪个 RQ 接口 互相 连接 
ADTI 表示 call address interval， 用 来 设置 8085 的 






































































































































E 级 联 模式 下 ， 这 要 涉及 到 主 片 (1 
的 问题 ， 所 以 当 SNGL 为 0 时 ， 主 片 和 从 片 也 是 需要 ICW3 的 。 
周 




















ns 

















时 间 间 隅 ，x86 个 需要 设置 








































































































































































































































































































边沿 触发 ，LTIM 为 1 


















































LTIM 表示 level/edge triggered mode， 用 来 设置 中 断 检 测 方式 ，LTIM 为 0 表示 
表示 电 平 触发 。 

第 4 位 的 1 是 固定 的 ， 这 是 ICW1 的 标记 ， 此 时 您 可 能 不 明白 标记 是 什么 ， 不 过 在 本 节 的 最 后 您 将 茅 
塞 顿 开 。 

第 5~7 位 专用 于 8085 处 理 器 ，x86 不 需要 ， 直 接 置 为 0 即 可 。 

ICW2 用 来 设置 起 始 中 断 向 量 号 ， 就 是 前 所 说 的 硬件 IRQ 接口 到 逻辑 中 断 向 量 号 的 映射 。 由 于 每 个 
8259A 芯片 上 的 IRQ 接口 是 顺序 排列 的 ， 所 以 咱们 这 里 的 设置 就 是 指定 IRQ0 映射 到 的 中 断 向 量 号 ， 其 他 
IRQ 接口 对 应 的 中 断 向 量 号 会 顺 着 自动 排 下 去 。 

注意 ，ICW2 需要 写 入 到 主 片 的 0x21 端口 和 从 片 的 0xA1 端口 如 图 7-14 所 示 。 

由 于 咱们 只 需要 设置 耻 Q0 的 中 断 向 量 号 , IRQ1~IRQ7 的 中 断 向 量 号 是 耻 Q0 的 顺延 ， 所 以 ， 咱们 只 
负责 填写 高 S 位 T3~T7，ID0~ID2 这 低 3 位 不 用 咱们 负责 。 由 于 咱们 只 填写 高 $ 位 ， 所 以 任意 数字 都 是 
8 的 倍数 ,这 个 数字 表示 的 便 是 设 定 的 起 始 中 断 向 量 号 。 这 是 有 意 设计 的 , 低 3 位 能 表示 8 个 中 断 向 量 号 ， 
这 由 8259A 根据 8 个 IRQ 接口 的 排列 位 次 自行 导入 ，IRQ0 的 值 是 000，IRQ1 的 值 是 001，IRQ2 的 值 便 
是 010*……: 以 此 类 推 ， 这 样 高 5 位 加 低 3 位 ， 便 表示 了 任意 一 个 IRQ 接口 实际 分 配 的 中 断 向 量 号 。 

ICW3 仅 在 级 联 的 方式 下 才 需 要 (如果 ICW1 中 的 SNGL 为 0), 用 来 设置 主 片 和 从 片 用 哪个 IRQ 接口 互 连 。 



































主 片 和 从 片 的 级 有 

















方式 不 一 样 ， 








对 于 主 片 ， ICW3 中 置 1 的 尺 


对 于 这 个 ICW3， 主 片 和 从 片 都 有 自己 不 






































若 主 片 [RQ2 和 IRQ5 
对 于 从 片 ， 











要 设置 与 


一 位 对 应 的 IRQ 接口 


接 有 从 片 ， 则 主 片 的 ICW3 为 00100100， 如 图 


主 片 8259A 的 连接 方式 ， 


“不 需 到 








用 于 连接 从 片 ， 若 为 0 贝 
7-16 所 示 。 
己 的 哪个 IRQ 接 








EF ?9 








指定 用 上 














二 





同 的 结构 ， 如 图 7-15 所 示 。 
上 表示 接 外 部 设备 。 比 如 ， 


口 与 主 片 连接 ， 从 
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片上 专门 ) 
， 在 从 片上 指定 的 IRQ 接 
时 ， 在 从 片上 还 要 设置 自己 





月 于 级 联 主 片 的 接口 并 不 是 IRQ。 
便 默 认 与 主 片上 做 级 







































































口 就 行 了 。 在 中 断 响应 时 ， 





您 想 ， 丸 
联 的 习 
用 于 连接 主 片 的 IRQ 接口 
这 反而 更 麻烦 。 所 以 ， 设 置 从 片 连接 主 片 的 方法 是 只 需要 在 从 片上 指定 主 片 用 于 连接 
主 片 会 发 送 与 从 片 做 级 联 的 IRQ 














I 果 从 片 用 IRQ 
pb 个 


个 IRQ 接 


接口 
口 
































与 主 片 





连接 主 片 ， 若 主 片 只 
匹配 了 。 但 如 
上 连接 从 片 的 哪个 IRQ 





级 联 一 个 从 
果 主 片 级 联 多 个 从 片 
接口 (有 多 个 ) 对 接 ， 














自己 的 那个 IRQ 接 























接口 号 ， 所 有 从 片 








自 





己 的 ICW3 的 低 3 位 














和 它 对 比 ， 若 一 致 则 认为 是 发 给 自己 的 。 比 如 主 片 用 










































































IRQ2 接口 连接 从 片 A， 用 IRQ5 接 








连接 从 片 B， 































































































































































































从 片 A 的 ICW3 的 值 就 应 该 设 为 00000010， 从 片 B 的 ICW3 的 值 应 该 设 为 00000101。 所 以 ， 从 片 ICW3 
中 的 低 3 位 ID0~ID2 就 够 了 ， 高 5 位 不 需要 ， 为 0 即 可 。 
ICW2 主 片 ICW3 
7 6 4 3 2 1 0 6 5 4 3 1 0 
T7|T6|T5|T4|T3|1ID2 | ID1 | ID0 s7|se|ss|s4|s3|s2|si|so 
A 图 7-14 1CW2 A 图 7-15 主 片 1CW3 
ICW4 用 于 设置 8259A 的 工作 模式 ， 当 ICW1 中 的 IC4 为 1 时 才 需 要 ICW4。 
注意 ，ICW4 需要 写 入 主 片 的 0x21 及 从 片 的 0xAl 端口 ， 如 图 7-17 所 示 。 
从 片 ICW3 ICW4 
7 6 5 4 3 2 1 0 7 6 5 4 3 2 1 0 
01|0|0|,0|0 |I1D2| ID1 | D0 0 | 0 0 |SFENM | BUF | M/S | AEOI | uPM 
A 图 7-16 ”从 片 1CW3 A 图 7-17 1CW4 
ICW4 有 些 低位 的 选项 基于 高 位 ， 所 以 咱们 从 高 位 开始 介绍 
第 7 一 5 位 未 定义 ， 直 接 置 为 0 即 可 。 




















SFNM 表示 特殊 全 秽 套 模式 (Special Fully Nested Mode), 若 SFNM 为 0, 则 表示 全 髓 套 模式 , 若 SFNM 





为 1， 则 表示 特殊 全 嵌 套 模式 。 
BUF 表示 本 8259A 芯片 是 否 工作 在 缓冲 模式。 
缓冲 模式 。 











BUF 为 0， 则 工作 非 缓 冲模 式 ， 





BUF 为 1， 则 工作 在 





当 多 个 8259A 级 联 时 ， 如 果 工 作 在 缓冲 模式 下 ，M/S 用 来 规定 本 8259A 是 主 片 ， 还 是 从 片 。 若 M/S 为 








1， 则 表示 则 表示 是 主 片 ， 若 M/S 为 0， 则 表示 是 从 片 。 若 工作 在 非 组 六 











AEOI 表示 车 
中 断 ， 此 项 用 来 设置 
自 们 可 以 在 中 断 处 理 


动 结束 中 断 (Auto End Of Interrupt 


是 否 要 让 8259A 




































































一 


























程序 中 或 主 函数 中 手动 向 8259A 上 














)，8259A 在 收 到 中 








的 主 、 从 片 发 送 EOI 信和 号 























通过 下 面 要 介绍 的 OCW 进行 。 若 AEOI 为 1， 则 表 
HPM 表示 微 处 理 器 类 型 
8085 处 理 器 ， 若 hPM 为 1， 则 表示 x86 处 理 器 。 
4 个 ICW 都 介绍 过 了 ， 下 面 咱们 看 看 用 于 操作 
OCW1 用 来 屏 
这 里 的 屏蔽 是 说 是 否 把 来 

















































































































9 外 部 设备 的 中 断 信 












































I (microprocessor)， 此 项 是 为 了 兼容 老 处 理 


号 转发 给 CPU。 
以 最 终 还 是 要 受 标 志 寄 存 器 eflags 中 的 下 位 的 管束 ， 若 正 为 0， 可 屏蔽 中 断 全 音 





自动 结束 中 断 。 


示 -| 





























器 。 


8259A 的 各 种 OCW 的 格式 。 





模式 (BUF 为 0) 下 ，MVS 无 效 。 
断 结束 信号 时 才能 
自动 把 中 断 结束 。 若 AEOI 为 0， 则 表示 非 自 动 ， 即 手动 结束 中 断 ， 
。 这 种 “操作 ?” 


继续 处 理 下 一 











类 命令 ， 


若 uPM 为 0， 则 表示 8080 或 


让 连接 在 8259A 上 的 外 部 设备 的 中 断 信 号 ， 实 际 上 就 是 把 OCW1 写 入 了 IMR 寄存 器 
由 于 外 部 设备 的 中 








断 都 是 可 屏蔽 中 断 ， 所 








p 





























被 屏蔽 ， 也 就 是 说 ， 在 














下 为 0 的 情况 下 ， 即 使 8259A 把 外 部 设备 的 中 断 向 量 号 发 过 来 ，CPU 也 置之不理 。 

注意 ，OCW1 要 写 入 主 片 的 0x21 或 从 片 的 0xAl 端口 ， 如 图 7-18 所 示 。 

M0 一 M7 对 应 8259A 的 了 下 Q0 一 了 下 Q7， 某 位 为 1， 对 应 的 了 Q 上 的 中 断 信 号 就 被 屏蔽 了 。 否 则 某 位 为 
0 的 话 ， 对 应 的 IRQ 中 断 信 号 则 被 放行 。 




















OCW2 用 来 设置 中 断 结束 方式 和 优先 级 模式 。 
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注意 ，OCW2 要 写 入 到 主 片 的 0x20 及 从 片 的 0xA0 端口 。 
OCW2 的 配置 比较 复杂 ， 各 种 属性 位 要 配合 在 一 起 ， 组 合 出 8259A 的 各 种 工作 模式 。 如 图 7-19 所 示 ， 
由 高 3 位 R、SL、EOI 可 以 定义 多 种 中 断 结 束 方式 和 优先 级 循环 方式 。 



















































































OCWI1 OCW2 
by 6 5 4 3 2 1 0 7 6 5 4 3 2 和 0 
M7 | M6 | M5 M4 M3 M2 M1 MO R SL | EOI 0 0 L2 L1 L0 
4 图 7-18 0CW1 4 图 7-19 0CW2 
































在 OCW2 中 比较 灵活 的 是 有 个 开关 位 : SL， 可 以 针对 某 个 特定 优先 级 的 中 断 进行 操作 ， 以 下 的 优先 
级 模式 设置 和 中 断 结束 都 可 以 基于 此 开关 做 更 细 粒 度 的 控制 。 

OCW2 其 中 的 一 个 作用 就 是 发 EOI 信号 结束 中 断 。 如 果 使 SL 为 1， 可 以 用 OCW2 的 低 3 位 (L2~L0) 来 
指定 位 于 ISR 寄存 器 中 的 哪 一 个 中 断 被 终止 ,也 就 是 结束 来 自 哪个 IRQ 接口 的 中 断 信 号 。 如 果 SL 位 为 0，L2 一 
L0 便 不 起 作用 了 ，8259A 会 自动 将 正在 处 理 的 中 断 结束 ， 也 就 是 把 ISR 寄存 器 中 优先 级 最 高 的 位 清 0。 

OCW2 另 一 个 作用 就 是 设置 优先 级 控制 方式 ， 这 是 用 及 位 〈 第 7 位 ) 来 设置 的 。 

为 表述 方便 ，IRQ 各 个 接口 在 此 被 表述 为 “IR 数字 ”的 形式 ， 这 也 是 微机 接口 中 的 命名 规则 。 

如 果 R 为 0， 表示 固定 优先 级 方式 ， 即 IRQ 接口 号 越 低 ， 优 先 级 越 高 。 

如 果 RR 为 1， 表明 用 循环 优先 级 方式 ， 这 样 优先 级 会 在 0~7 内 循环 。 如 果 SL 为 0， 初 始 的 优先 级 次 
序 为 IR0>IR1>IR2>IR3>IR4>IR5>IR6>IR7。 当 某 级 别 的 中 断 被 处 理 完成 后 ， 它 的 优先 级 别 将 变 成 最 低 ， 
将 最 高 优先 级 传 给 之 前 较 之 低 一 级 别 的 中 断 请 求 ， 其 他 依次 类 推 。 所 以 ,可 循环 方式 多 用 于 各 中 断 源 优先 
级 相同 的 情况 ， 优 先 级 通过 这 种 循环 可 以 实现 轮 询 处 理 。 该 循环 可 总 结 为 如 果 循环 优先 级 
IR (i) 优先 级 最 低 ，IR (i+1》 则 优先 级 最 高 。 其 优先 级 关系 如 图 7-20 所 示 。 这 时 针 逐 级 高 ， 硕 时 针 逐 级 低 









































































































































































































































































































































































































































在 图 7-20 中 ， 顺 时 针 方向 的 优先 级 是 逐 级 减 小 ， 反 之 逆 时 针 方向 的 优先 级 。 nz 一 外 ni 
是 逐渐 增 大 。 和 和 
比如 ， 当 前 IR3 为 最 高 级 别 中 断 请 求 ， 处 理 完成 后 ，IR3 将 变 成 最 低级 别 ， 
IR4 变 成 最 高 级 别 ， 这 一 组 循环 之 后 的 优先 级 变 成 了 : As 


IR4>IR5>IR6>IR7>IR0>IR1>IR2>IR3 

另外 ， 还 可 以 打开 SL 开关 ,使 SL 为 1， 再 通过 L2~L1 指定 最 低 优 先 级 “ 
是 哪个 IRQ 接口 。 
举 个 例子 ， 在 R 和 SL 都 等 于 1 的 情况 下 ， 寿 想 指 定 IR5 为 最 低 的 优先 级 ， 需 要 将 L2 一 L0 置 为 101。 
这 样 ， 参 看 图 7-20， 新 的 初始 优先 级 循环 是 : 

IR6>IR7>IRO>IR1>IR2>IR3>IR4>IR5 

以 上 就 是 OCW2 的 工作 原理 ， 咱 们 再 细 说 一 下 各 个 属性 位 的 意义 ， 还 从 高 位 开始 说 起 。 

R,Rotation， 表 示 是 否 按 照 循环 方式 设置 中 断 优先 级 。R 为 1 表示 优先 级 自动 循环 ，R 为 0 表示 不 自 
动 循环 ， 采 用 固定 优先 级 方式 。 

SL,Specific Level， 表 示 是 否 指定 优先 等 级 。 等 级 是 用 低 3 位 来 指定 的 。 此 处 的 SL 只 是 开启 低 3 位 的 
开关 ， 所 以 SL 也 表示 低 3 位 的 L2~L0 是 否 有 效 。SL 为 1 表示 有 效 ，SL 为 0 表示 无 效 。 
EOI，End Of Interrupt， 为 中 断 结束 命令 位 。 令 EOI 为 1， 则 会 令 ISR 寄存 器 中 的 相应 位 清 0， 也 就 是 
将 当前 处 理 的 中 断 清 掉 ， 表 示 处 理 结束 。 向 8259A 主动 发 送 EOI 是 手工 结束 中 断 的 做 法 ， 所 以 ， 使 用 此 
命令 有 个 前 提 ， 就 是 ICW4 中 的 AEOI 位 为 0， 非 自动 结束 中 断 时 才 用 。 
值得 注意 的 是 在 手动 结束 中 断 (AEOI 位 为 0) 的 情况 下 ,如 果 中 断 来 自主 片 ， 只 需要 向 主 片 发 送 EOI 
就 行 了 ， 如 果 中 断 来 自从 片 ， 除 了 向 从 片 发 送 EOI 以 外 ， 还 要 再 向 主 片 发 送 EOI。 
第 4 一 3 位 的 00 是 OCW2 的 标识 。 
L2 一 L0 用 来 确定 优先 级 的 编码 ， 这 里 分 两 种 ， 一 种 用 于 EOI 时 ， 表 示 被 中 断 的 优先 级 别 ， 另 一 种 用 


317 





到 7-20 循环 优先 级 

































































































































































































































































































































































































































































于 优先 级 循环 时 ， 指 定 起 始 最 低 的 优先 级 别 。 
通过 前 面 的 介绍 ， 其 实 整个 OCW2 融 是 各 种 关键 字 属 性 的 配合 使 用 ， 主 要 就 是 L2 一 L0 需要 配合 有 
位 、SL 位 、EOI 位 的 设置 。 虽 们 看 看 这 几 种 组 合 ， 见 表 7-2。 













































































































































































































































































































































































































































































表 7-2 OCW2 高 位 属性 组 合 
R SL EOI 描 述 
普通 EOI 结束 方式 : 
当中 断 处 理 完成 后 ， 向 8259A 发 送 EOI 命令 ，8259A 会 将 ISR 中 当前 级 别 最 高 的 位 置 0 
. 1 特殊 EOI 结束 方式 : 
当中 断 处 理 完成 后 ， 向 8259A 发 送 EOI 命令 ，8259A 将 ISR 寄存 器 中 由 L2~L0 指定 的 位 清 0 
普通 EOI 循环 命令 
1 0 1 当中 断 处 理 完 成 后 ，8259A 将 ISR 中 当前 优先 级 最 高 的 位 清 0， 并 使 此 位 的 优先 级 变 成 最 低 ， 使 原 
来 第 二 高 的 优先 级 成 为 最 高 优先 级 。 其 他 优先 级 类 推 ， 可 以 参照 图 7-20 
特殊 EOI 循环 命令 
1 1 1 当中 断 处 理 完 成 后 ，8259A 将 ISR 中 由 L2~L0 指定 的 相应 位 清 0， 并 使 此 位 的 优先 级 变 成 最 低 ， 
使 原来 第 二 高 的 优先 级 成 为 最 高 优先 级 。 其 他 优先 级 类 推 ， 可 以 参照 图 7-20 
0 0 0 清除 自动 EOI 循环 命令 
设置 自动 EOI 循环 命令 : 
1 0 0 8259A 自动 将 ISR 寄存 器 中 当前 处 理 的 中 断 位 清 0， 并 使 此 位 的 优先 级 变 成 最 低 ， 使 原来 第 二 高 的 
优先 级 成 为 最 高 优先 级 。 其 他 优先 级 类 推 ， 可 以 参照 图 7-20 
1 1 0 设置 优先 级 命令 : 
将 L2~L0 指定 的 IRG) 为 最 低 优 先 级 ，IR(i+1) 为 最 高 优先 级 。 其 他 优先 级 类 推 ， 可 以 参照 图 7-20 
0 1 0 无 操作 
到 现在 为 止 ， 咱 们 需要 用 到 的 部 分 已 经 说 完了 ， 还 差 一 个 OCW3， 虽 然 咱们 用 不 上 ， 但 说 实话 也 不 差 
这 一 个 了 ， 还 是 朱 带 着 说 下 。 OCW3 
OCW3 用 来 设 定 特殊 屏蔽 方式 及 查询 方式 ， 如 图 7-21 RU 
所 示 。 / ESMM | SMM 0 1 P PR RIS 
注意 ,OCW3 要 写 入 主 片 的 0x20 端口 或 从 片 的 0xA0 端口 。 4 图 7-21 0CW3 





























第 7 位 未 用 到 。 
第 6 位 的 ESMM (Enable Special Mask Mode) 和 第 5 位 的 SMM (Special Mask Mode) 是 组 合 在 一 起 
用 的 , 用 来 启用 或 禁用 特殊 屏蔽 模式 。ESMM 是 特殊 屏蔽 模式 允许 位 ,是 个 开关 。SMM 是 特殊 屏蔽 模式 位 。 
只 有 在 启用 特殊 屏蔽 模式 时 ， 特 殊 屏 蔽 模式 才 有 效 。 也 就 是 若 ESMM 为 0， 则 SMM 无 效 。 若 ESMM 为 1， 
SMM 为 0， 表示 未 工作 在 特殊 屏蔽 模式 。 若 ESMM 和 SMM 都 为 1， 这 才 正 式 工作 在 特殊 屏蔽 模式 下 。 
第 4 一 3 位 的 01 是 OCW3 的 标识 ，8259A 通过 这 两 位 判断 是 哪个 控制 字 。 
PPoll command， 查 询 命 令 ， 当 P 为 1 时 , 设置 8259A 为 中 断 查询 方式 ， 这 样 就 可 以 通过 读 取 寄存 器 ， 
如 IRS， 来 查看 当前 的 中 断 处 理 情况 。 
RR,Read Register， 读 取 寄 存 器 命令 。 它 和 RIS 位 是 配合 在 一 起 使 用 的 。 当 RR 为 1 时 才 可 以 读 取 寄存 器 
RIS,Read Interrupt register Select， 读 取 中 断 寄存 器 选择 位 ， 顾 名 思 义 ， 就 是 用 此 位 选择 入 地 该 取 的 寄存 
器 。 有 点 类 似 显卡 寄存 器 中 的 索引 的 意思 。 若 RIS 为 1， 表示 选择 ISR 寄存 器 , 若 RIS 为 0， 表示 选择 IRR 
寄存 器 。 这 两 个 寄存 器 能 否 读 取 ， 前 提 是 RR 的 值 为 1。 
讲 到 这 里 ， 有 关 8259A 的 学 习 也 就 快 到 尾声 了 ， 但 还 有 件 事 不 吐 不 快 ， 大 家 有 没有 疑惑 ，8259A 就 2 
个 端口 地 址 ， 它 是 如 何 识 别 4 个 ICW 和 3 个 OCW 的 ? 
如 果 是 初学 者 ， 我 就 当 您 有 这 个 疑惑 了 。 其 实 ， 这 是 有 关内 部 寄存 器 寻 址 的 问题 ， 人 家 8259A 有 
套 方法 辨识 自己 。 
ICW1 和 OCW2、OCW3 是 用 偶 地 址 端口 0x20〈 主 片 ) 或 0xA0 (从 片 ) 写 入 。 
ICW2~ICW4 和 OCW1 是 用 奇 地 址 端口 0x21 ( 主 片 ) 或 0xAl1 (从 片 ) 写 入 。 
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7.6 编写 中 断 处 理 程 





以 上 4 个 ICW 要 保证 一 定 的 次 序号 入 ， 所 以 8259A 就 知道 写 入 端 




















的 数据 是 什么 了 。 





OCW 的 写 入 与 顺序 无 关 ， 并 且 ICW1 和 OCW2、OCW3 的 写 入 端口 是 一 致 的 ， 那 8259A 怎样 来 辨识 




































































它们 呢 ? 又 是 自问 自 答 ， 其 实 就 是 各 控制 字 中 的 第 4~3 标识 位 ， 通 过 这 两 位 的 组 合 来 唯一 确定 某 个 控制 
字 ， 见 表 7-3。 
表 7-3 控制 字 中 标识 汇总 
控 制 字 第 4 位 第 3 位 
ICW1 I / 
OCW2 0 0 
OCW3 0 1 


OCW1 是 怎样 确定 的 呢 ? OCW 是 在 初始 化 之 后 才 有 效 的 ， 所 以 在 初始 化 之 后 写 入 奇 地 址 端 
便 被 认为 是 OCW 
8259A 的 编程 就 是 写 入 ICW 和 OCW， 下 








] 。 
































总 结 


昌 


下 写 入 的 步骤。 











对 于 8259A 的 初始 化 必须 最 先 完成 ， 步 又 是 : 


和 从 片 ! 
































总 结 再 总 结 ， 
不 要 ， 其 余 全 要 。 


在 以 




















好 啦 ， 到 此 有 关 8259A 日 


只 有 当 ICW1 
各 写 入 ICW3。 














无 论 8259A 是 否 级 联 ，ICW1 和 ICW2 是 必须 
Ph 的 SNGL 位 为 0 时， 这 表示 级 联 ， 级 联 就 需要 设置 主 片 和 从 片 ， 这 才 需 要 在 主 片 
注意 ，ICW3 的 格式 在 主 片 和 从 片 中 是 不 同 的 。 
只 能 当 ICW1 中 的 IC4 为 1 时 ， 才 需要 写 入 ICW4。 不 过 ，x86 系统 IC4 必须 为 1。 
在 x86 系统 中 ， 对 于 初始 化 级 联 8259A，4 个 ICW 都 需要 ， 初 始 化 单 片 8259A，ICW3 











上 初始 化 8259A 之 后 才 可 以 用 

















要 有 的 ， 并 且 





























OCW 对 它 操作 。 





的 介绍 都 结束 了 ， 大 家 有 兴趣 的 话 


编写 中 断 处 理 程序 


为 了 实现 中 断 处 理 ， 
经 过 这 些 苦难 之 后 ， 











时 钟 中 断 ， 再 逐渐 
从 最 简单 的 中 断 处 理 程 


7.6.1 





今天 我 们 终于 又 7 








丰富 它 ， 使 ] 


前 面 讲述 了 不 少 基 础 知识 :特权 级 、 内 联 汇编 、 
Tf 始 写 代码 啦 。 这 一 节 中 ， 我 们 以 循序 渐进 的 方式 ， 先 写 一 个 简陋 的 





















































其 越 来 越 “ 像 模 像样 ”。 





训 开 始 


本 节 我 们 将 通过 操作 8259A 打开 中 断 ， 实 现 第 一 个 中 断 处 理 程序 。 


Intel 8259A 芯片 位 于 主板 上 的 南 桥 芯片 中 ， 咱 们 不 需要 像 
连接 的 外 部 设备 ， 这 一 切 都 安排 好 啦 ， 
有 路 实现 了 ， 趴 


为 它 的 各 个 IR 引 
经 由 内 部 


























脚 指定 























部 设备 是 否 连 接 上 了 8259A。 








程序 初步 计划 以 图 7-22 所 示 的 流 





这 些 还 没 开始 做 呢 。 


我 们 从 上 往 下 看 ，init all 函数 用 


们 打算 在 主 函 数 
init all 首先 




















P 调 用 











由 于 初始 化 也 要 分 成 几 部 分 来 


成 ，idt_ 











init 中 调用 这 两 个 函数 完成 
可 编程 中 断 控制 器 8259A。 如 果 您 在 想 为 什么 不 叫 8259A_init, 我 解释 


























断 描 述 符 、 上 














要 顺序 写 入 。 


自行 参阅 相关 书籍 。 














口 的 数据 




















FP 断代 理 8259A， 


























网 卡 、 硬 盘 那 样 









































们 只 需要 直接 操作 8259A 就 行 ， 不 用 担心 这 些 外 
程 开 启 中 断 ， 先 和 大 家 描述 下 愿景 ， 




















来 初始 化 所 有 的 设备 及 数据 结构 ， 我 
它 来 完成 初始 化 工作 。 
周 用 idt init， 它 用 来 初始 











化 中 断 相 关 的 内 容 。 





改 ， 这 





| pic_init 和 ide_desc_init 分 别 完 








初始 化 





工作 。 其 中 ，pic_init 用 来 初始 化 








一 下 ， 

































































单独 安装 才能 用 ， 也 不 需要 
比如 主 片 IRO0 引 脚 上 就 是 时 钟 中 断 ， 这 已 
(mmo) 
(ee ) 
iatinn0 
4 图 7-22 ”启用 中 断 流程 





PIC 就 是 可 编程 中 断 控 制 器 Programmable Interrupt Controller 的 简称 ， 而 8259A 也 是 PIC 的 一 种 ， 万 一 























天 想 尝 试用 别 的 ! 





断代 理 ， 





成 的 。 



































函数 名 上 就 不 用 再 改动 了 ， 其 实 就 是 为 了 扩展 。 








1 











在 idt_init 完成 之 后 便 可 以 加 载 IDT 啦 ， 到 此 打开 中 断 的 条 件 便 准备 好 了 。 









































































































































在 用 pic_init 函数 初始 化 8259A 后 ， 我 们 还 需要 初始 化 中 断 描述 符 表 IDT， 这 是 用 ide_desc_init 来 完 























































































































































































































































































































































































































































































































1. 用 汇编 语言 实现 中 断 处 理 程序 

在 这 个 初始 化 过 程 中 ， 最 核心 、 最 底层 的 便 是 ide_desc_init， 在 该 函数 中 我 们 要 填充 中 断 处 理 程序 的 
地 址 到 IDT 中 ， 所 以 我 们 在 执行 该 函数 之 前 ， 需 要 提前 把 所 有 中 断 处 理 函 数 准 备 好 。 中 断 处 理 函 数 用 汇 
编 语言 ， 还 是 C 语言 实现 呢 ? 为 了 较 容 易 地 演示 中 断 机 制 的 原理 ， 大 伙 儿 包容 一 下 ， 就 先 用 汇编 吧 ， 
后 咱们 再 用 C 语言 完成 个 升级 版 。 

由 于 代码 中 我 们 用 到 了 新 的 内 容 一 一 宏 ， 先 提前 给 大 伙 介 绍 下 。 

宏 属 于 预 处 理 指 令 ， 预 处 理 指令 是 编译 器 为 用 户 编码 方便 而 提供 的 、 仅 被 编译 器 中 的 预 处 理 器 支持 的 
符号 ， 并 不 是 处 理 直 接 支持 的 指令 ， 故 属于 伪 指 令 。 

预 处 理 指令 是 指 在 编译 前 ， 编 译 器 需要 预先 处 理 的 指令 ， 也 就 是 在 编译 前 先 扫描 一 下 代码 ， 将 一 些 编 
译 器 提供 的 伪 指 令 展 开 替 换 成 具体 的 语言 符号 后 编译 器 才能 识别 ， 也 就 是 说 代码 在 预 处 理 之 后 ， 其 中 的 预 
处 理 指令 〈 伪 指令 ) 全 都 会 不 见 的 。 而 完成 预 处 理工 作 的 软件 通常 称 为 预 处 理 器 , 其 实 就 是 一 个 功能 模块 ， 
伪 指 令 的 意义 只 能 编译 器 中 的 预 处 理 器 知道 。 

宏 ， 即 Macro， 宏 是 用 来 代替 重复 性 输入 ， 是 一 段 代码 的 模板 。 不 同 的 编译 器 基本 上 都 会 提供 这 样 的 
预 处 理 指令 。 


























用 法 一 致 ， 不 多 说 啦 。 


在 汇编 中 定义 宏 有 多 种 方式 , 如 果 是 定义 单行 的 宏 , 可 以 



































如 果 是 定义 多 行 的 宏 ， 就 要 用 %macro 来 实现 ， 这 个 简单 说 





其 定义 方法 是 : 
smacro 宏 名 字 参 数 个 数 
宏 代码 体 
dendnaces 


在 宏 定义 头 中 人 











1 全 








以 支持 的 参数 个 数 。 在 “ 宏 代码 体 ” 部 分 ， 如 果 想 
， 以 此 类 推 。 


日. A 千 
个 是 第 


个 参数 
? 哪 


%1 就 表示 第 1 
参数 在 哪里 
用 的 方式 为 : 























宏 名 称 以 逗号 分 隔 参数 列 

















下 。 




















的 ， 后面 











“ 宏 名 字 ” 这 是 调用 




















j%define 指令 来 实现 ,这 和 CC 语言 中 的 define 














的 “参数 个 数 ” 是 告诉 预 处 理 器 ， 此 宏 可 














宏 时 用 
引 














] 某 个 参数 ， 就 要 用 















































1 个 参数 呢 ? 和 函数 调用 一 样 , 这 是 由 调 





1> 


表 


由 








参数 列表 中 最 左边 的 参数 就 是 第 1 个 参数 ， 参 数 序号 并 不 是 从 0 起 的 。 我 们 在 实际 




















入 参数 顺序 要 与 宏 代码 体 ! 














引用 的 参数 协调 好 。 











smacro mul add3 
mov eax,%1 
add eax, $2 

add eax, $3 
Sendmacro 


用 此 方式 
该 说 的 都 说 了 ， 下 面 




















举 个 例子 ， 比 如 以 下 定义 了 一 个 宏 。 





周 用 : mul_add 45，24，33， 其 中 %1 是 45，%2 是 24，%3 是 33。 








F 干 货 ， 给 各 位 看 官 呈 上 汇编 版 本 的 中 断 处 理 程 序 ， 见 代码 7- 





























文件 中 ， 这 就 是 kernel.S。 
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“% 数 字 ” 的 方式 来 引用 ， 比 如 


j 宏 时 参数 传递 的 顺序 决定 的 。 宏 调 





骨 用 宏 的 时 候 ， 传 


1， 它 定义 在 新 的 


7.6 编写 中 断 处 理 


代码 7-1 (projectc7/a/kernelkernel.S ) 








1 as 32] 


























































































































































































































2 Sdefine ERROR CODE nop ; 若 在 相关 的 异常 中 CPU 已 经 自动 压 
; 错误 码 ， 为 保持 栈 中 格式 统一 ， 这 全 不 做 操作 
3 sdqefine ZERO push 0 ; 若 在 相关 的 异常 中 CPU 没有 压 入 错误 码 
;为 了 统一 栈 中 格式 ， 就 手工 压 入 一 个 0 
4 
5 extern put_stx; 声 明 外 部 函数 
6 
7 section .data 
8 intr str db "interrupt occur!", Oxa, 0 
9 global intr entry table 
0 intr entry table: 
11 
12 Smacro VECTOR 2 
13 Section .text 
14 intr%slentry: ;每 个 中 断 处 理 程序 都 要 压 入 中 断 向 量 号 
;所 以 一 个 中 断 类 型 一 个 中 断 处 理 程序 
;自己 知道 自己 的 中 断 向 量 号 是 多 人 少 
ee] $2 
16 push intr str 
17 call put str 
18 add esp,4 ; 跳 过 参数 
19 
20 ; 如 果 是 从 片上 进入 的 中 断 ， 除 了 往 从 片上 发 送 EOI 外， 还 要 往 主 片 上 发 送 EOI 
久生 mov al, Ox20 ;中 断 结 来 命令 EOI 
22 out Oxa0,al ;向 从 片 发 送 
23 out 0x20,al ;向 主 片 发 送 
24 
25 add esp,4 ; 跨 过 error_code 
26 iret ;从 中 断 返 回 ，32 位 下 等 同 指令 iretad 
27 
28 section .data 
29 dd intrgslentry ;存储 各 个 中 断 入 口 程序 的 地 址 








;形成 intr_entry table 数组 
30 Sendmacro 


32 VECTOR 0x00,2ZERO 
33 VECTOR 0x01,ZERO 
34 VECTOR 0x02,ZERO 


62 VECTOR Oxle,ERROR CODE 
63 VECTOR 0xlf,ZERO 
64 VECTOR 0x20,2ZERO 


先 说 重点 内 容 ， 代 码 7-1 定义 了 33 个 中 断 处 理 程序 。 每 个 中 断 处 理 程序 都 一 样 ， 就 是 调用 字符 串 打 
印 函 数 put_str 来 打印 字符 串 “interrupt occur!”， 之 后 直接 退出 中 断 。 
为 什么 定义 33 个 中 断 处 理 程序 呢 ? 
原因 是 中 断 向 量 0 一 19 为 处 理 器 内 部 固定 的 异常 类 型 ，20 一 31 是 Intel 保留 的 ， 忘 记 的 话 ， 大 伙 赶 紧 往 
翻 看 表 7-1。 所 以 咱们 可 用 的 中 断 向 量 号 最 低 是 32， 将 来 咱们 在 设置 8259A 的 时 候 , 会 把 IR0 的 中 断 向 量 
号 设置 为 32 (这 是 后 话 )。 目 前 只 为 演示 中 断 机 制 的 原理 ， 咱 们 就 拿 连接 在 主 片 IR0 接口 上 外 部 设备 一 一 时 
钟 ， 小 试 身手 。 
由 于 目前 咱们 的 中 断 处 理 程序 一 样 ， 这 是 重复 性 的 工作 ,而 且 是 由 多 行 代码 组 成 ， 所 以 用 宏 来 定义 它 
们 是 再 合适 不 过 的 啦 。 接 下 来 看 看 是 怎么 实现 的 。 
第 12 一 30 行 是 用 宏 定 义 中 断 处 理 程序 的 地 方 。 在 第 12 行 ， 用 macro 定义 了 名 为 VECTOR 的 宏 ， 其 
接受 2 个 参数 。 
哪 两 个 参数 呢 ? 您 一 定 想到 了 ， 看 看 宏 是 怎么 调用 的 不 就 行 了 吗 。 所 以 ， 和 暂且 止步 于 此 ， 咱 们 不 妨 先 
看 看 62 行 和 63 行 ， 这 是 调用 宏 VECTOR 的 两 个 地 方 ， 本 例 中 从 32 一 64 行 一 共有 33 个 调用 VECTOR 的 
地 方 ， 即 预 处 理 后 ， 会 有 33 个 中 断 处 理 程序 。 
拿 第 62 行 的 “VECTOR 0xle，ERROR_CODE” 来 说 ， 第 1 个 参数 0xle 是 中 断 向 量 号 ， 用 来 表示 : 
本 宏 是 为 了 此 中 断 向 量 号 而 定义 的 中 断 处 理 程 序 ， 或 者 说 这 是 本 宏 实现 的 中 断 处 理 程序 对 应 的 中 断 向 量 
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号 ， 总 之 将 来 咱们 要 把 它 装载 到 中 断 描述 符 表 中 以 该 中 断 向 量 号 为 索引 的 中 断 门 描述 符 位 置 。 第 2 个 参数 
ERROR_CODE 也 是 个 宏 ， 它 定义 在 第 2 行 “%define ERROR_CODE nop” 它 的 值 为 nop。nop 是 汇编 指 
令 ， 它 表示 no operation， 不 操作 ， 什 么 都 不 干 。 在 此 完全 是 占 位 充 数 用 的 ， 一 会 儿 说 占 位 是 怎么 回 事 。 

第 63 行 的 “VECTOR 0xlf，ZERO” 第 1 个 参数 0x1f 是 中 断 向 量 号 ， 第 2 个 参数 是 ZERO， 它 也 是 个 






















































































宏 ， 定 义 在 第 3 行 “%define ZERO push 0”， 也 就 是 说 ZERO 的 值 是 push 0， 是 “把 0 压 入 栈 ” 这 个 操作 。 
大 家 想 , 为 什么 有 的 宏 的 参数 是 ERROR_CODE, 而 有 的 宏 的 参数 是 ZERO? 是 时 候 解 释 占 位 的 事 啦 。 
如 果 您 看 了 代码 中 的 注释 ， 想 必 您 也 能 猜 到 是 怎么 回 事 。 是 这 样 的， 之 前 咱们 在 介绍 错误 码 时 说 过 ， 

























































































有 的 中 断 会 产生 错误 码 ， 用 来 指明 中 断 是 在 哪个 段 上 发 生 的 ， 错 误 码 会 在 进入 中 断后 ， 处 理 器 在 栈 中 压 入 
寄存 器 EIP 之 后 压 入 。 

为 了 表述 清楚 ， 大 伙 儿 最 好 了 解 进入 中 断后 ， 处 理 器 会 向 栈 中 压 入 数据 的 情况 ， 虽 然 前 面 讲 过 啦 ， 但 
为 了 不 那么 抽象 ， 这 里 还 是 再 简单 说 下 。 
在 中 断 发 生 时 ， 处 理 器 要 在 目标 栈 中 保存 被 中 断 进 程 的 部 分 寄存 器 环境 ， 这 是 处 理 器 自动 完成 的 ， 不 















































































































































需要 咀 们 手动 号码。 保存 的 寄存 器 名 称 及 顺序 是 : 

















(1) 妇 


ds 





果 发 生 了 特权 级 转移 ， 比 如 被 中 断 的 进程 是 3 特权 级 ， 中 断 处 理 程序 是 0 特权 级 ， 此 时 要 把 低 











特权 级 的 栈 段 选 择 子 ss 及 栈 指针 esp 保存 到 栈 中 。 

(2) 压 入 标志 寄存 器 eflags。 

(3) 压 入 返回 地 址 cs 和 eip， 先 压 入 cs， 后 压 入 eip。 

(4) 如 果 此 中 断 没有 相应 的 错误 码 ， 至 此 ， 处 理 嚣 把 寄存 器 压 栈 的 工作 完成 ， 栈 中 情况 如 图 7-23A 所 
示 。 如 果 此 中 断 有 错误 码 的 话 ， 处 理 器 在 压 入 eip 之 后 会 压 入 错误 码 ， 至 此 ， 处 理 器 自动 压 栈 工 作 全 部 完 
成 ， 如 图 7-23B 所 示 。 































































































无 特权 级 变化 时 , 中断 发 生 后 栈 中 情况 





























楼 
内 | eflags 的 值 | eflags 的 值 

由 cs 的 值 cs 的 值 

址 eip 的 值 ss:esp eip 的 值 

扩 错误 码 error code | _ SS:esp 
展 






































A 无 错误 码 B 有 错误 码 
4 图 7-23 中断 压 入 的 栈 























您 看 ， 有 的 中 断 会 压 入 错误 码 ， 而 有 的 中 断 则 不 会 压 入 ， 说 明 这 两 种 不 同 的 中 断 发 生 时 ， 即 使 栈 顶 初 
始 值 一 样 , 由 于 个 别 的 中 断 压 入 了 错误 码 , 最 终 栈 指针 也 是 不 一 样 的 , 至 少 差 了 存储 错误 码 的 那 4 个 字 节 。 








我 们 知道 , 用 iret 指令 从 中 断 返 回 时 栈 顶 必须 是 EIP 的 值 ， 也 就 是 栈 顶 必须 如 图 7-23A 中 esp 指向 的 位 置 。 





























所 以 如 果 栈 中 有 错误 码 ， 在 iret 指令 执行 前 必须 要 把 栈 中 的 错误 码 跨 过 。 而 目前 的 情况 是 不 是 所 有 的 中 断 都 






































有 错误 码 ， 对 于 那些 没有 压 入 错误 码 的 中 断 不 需要 跨 过 什么 ， 难 道 要 单独 处 理 ? 可 是 我 们 是 用 宏 来 实现 的 ， 
这 是 一 个 代码 模板 ， 具 有 通用 性 ， 怎 么 办 呢 ? 

















大 家 也 看 出 来 了 ， 问 题 的 关键 是 栈 顶 指针 不 一 致 ， 即 包含 错误 码 的 中 断 ， 其 栈 项 指针 比 不 包含 错误 码 的 











中 断 低 了 4 字 节 。 























其 实 只 要 保证 这 两 种 情况 的 中 断 发 生 后 ， 栈 项 指针 值 是 一 样 的 就 行 了 。 让 我 们 设想 一 下 ， 











我 们 只 要 保证 在 栈 中 EIP 的 位 置 之 后 还 会 再 压 入 一 个 32 位 的 数 就 成 了 ， 错 误 码 是 由 处 理 器 自动 压 入 的 ， 所 











以 有 错误 码 的 中 断 1 






































自 们 就 不 管 了 。 如 果 没 有 错误 码 ， 咱 们 手工 压 入 一 个 32 位 的 数 ， 这 样 不 管 中 断 是 否 会 压 





























入 错误 码 ， 栈 顶 指针 都 是 一 样 的 ， 即 栈 结构 相同 ， 在 iret 指令 执行 前 我 们 再 将 栈 顶 的 数据 〈 错 误 码 或 手工 压 
入 的 32 位 数 ) 跨 过 就 万 事 大 吉 了 。 而 做 这 件 事 的 前 提 是 ， 我 们 得 知道 哪些 中 断 会 压 入 错误 码 才 行 。 
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在 表 7-1 中 我 


























门 已 经 知道 哪些 中 断 会 压 入 错误 码 , 所 以 针对 那些 会 压 入 错误 码 的 中 断 , 我 们 喻 都 不 做 ， 
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如 果 中 断 未 压 入 错误 码 ， 我 们 就 手工 压 入 个 数 。 聪 明 的 您 绝对 想到 了 ， 对 ， 这 就 是 我 们 把 ERROR_CODE 
和 ZERO 作为 参数 的 目的 。 
由 于 ERROR_CODE 的 值 为 nop， 所 以 对 于 那些 参数 为 ERROR_CODE 的 宏 调用 ， 它 们 对 应 的 都 是 包含 错 
误 码 的 中 断 。 对 于 那些 参数 为 ZERO 的 宏 调 用 ， 它 们 对 应 的 中 断 都 不 包括 错误 码 ， 针 对 此 种 情况 我 们 手工 往 栈 
中 压 个 0 占 个 位 置 ，ZERO 其 值 为 push 0， 这 表示 我 们 手工 往 栈 中 压 入 一 个 0， 这 样 后 面 在 调用 iret 指令 从 中 断 
返回 之 前 ， 我 们 可 以 用 通用 的 代码 跨 过 栈 顶 的 数据 ， 即 错误 码 或 0， 以 使 栈 顶 指向 EIP， 为 iret 准备 好 数据 。 
由 于 EIP 和 错误 码 都 是 处 理 器 自动 压 入 栈 的 ， 错 误 码 是 在 EIP 压 入 栈 之 后 压 入 的 ,所 以 我 们 手工 压 入 
的 32 位 数 也 应 该 放 在 压 入 EIP 之 后 操作 ， 即 它 必 须 是 中 断 处 理 程序 中 的 第 一 个 指令 。 所 以 ， 大 家 看 宏 定 
义 中 的 第 一 条 指令 是 第 15 行 的 %2， 它 在 预 处 理 之 后 ， 会 根据 实际 的 参数 展开 为 nop 或 push 0， 一 会 儿 把 
预 处 理 后 的 文件 给 大 伙 儿 看 下 。 
汇编 中 的 section， 即 节 ， 用 来 定义 一 段 相 同属 性 的 数据 ， 该 范围 起 始 于 当前 section 的 定义 处 , 一 
直 持 续 到 下 一 个 section 的 定义 处 ， 若 没有 过 到 新 的 section 定义 ， 则 一 直 持 续 到 文件 结束 处 。 
在 这 个 宏 中 髓 套 了 两 个 section, 分 别 是 第 13 行 的 .text, 用 作 代码 范围 的 起 始 定义 , 以 及 第 28 行 的 .data， 
是 用 作 上 个 .text 的 结束 ， 再 有 就 是 此 数据 范围 的 起 始 定义 。 由 于 我 们 调用 了 该 宏 33 次 ， 所 以 在 预 处 理 
之 后 ， 宏 中 的 这 两 个 section 将 会 各 出 现 33 次 。 
在 .text 的 section 中 ， 即 代码 的 第 14 一 26 行 , 我 们 定义 的 是 中 断 处 理 程序 ， 这 里 大 伙 儿 可 能 会 对 第 14 
行 的 “intr%lentry: ”有 点 疑问 ， 这 是 在 干吗 ? 大 家 看 ，intr%lentry 的 后 面 有 个 冒号 ， 说 明 它 是 个 标号 ， 
也 就 是 地 址 ， 这 是 中 断 处 理 程序 的 起 始 处 ， 所 以 此 标号 是 为 了 获取 中 断 处 理 程序 的 地 址 。 由 于 我 们 目前 有 
33 个 中 断 处 理 程序 ， 标 号 不 能 重 名 ， 所 以 我 们 在 intr 和 entry 之 间 夹 了 个 %1， 上 面 看 过 宏 调用 的 形式 了 ， 
参数 1 是 中 断 向 量 号 ， 所 以 最 终 中 断 处 理 程序 起 始 地 址 的 范围 是 intr[0 一 32]entry。 
为 了 引用 所 有 中 断 处 理 程序 的 地 址 ， 我 们 得 事先 把 它们 都 记 下 来 。 为 此 ， 我 们 在 kernel.S 中 定义 了 一 个 
数组 ， 数 组 名 为 intr_entry_table， 它 在 第 10 行 定 义 ， 并 且 已 经 在 第 9 行 由 global 语句 导出 为 全 局 符号 ， 这 
样 其 他 程序 便 可 以 使 用 此 数组 了 。 为 了 使 此 数组 中 的 元 素 是 每 个 中 断 处理 程 序 的 地 址 ， 我 们 在 第 28 一 29 行 
定义 了 数据 段 ( 节 )， 这 就 是 section .data 起 的 作用 ， 由 于 32 位 下 的 地 址 是 4 字 节 ， 所 以 在 第 29 行 用 伪 指 令 
dd 来 定义 数组 元 素 的 宽度 ， 元 素 值 为 intr%1lentry。 这 样 每 个 宏 调 用 都 将 在 数组 中 产生 新 的 地 址 元 素 。 
也 许 您 觉得 有 点 不 可 思议 ， 因 为 我 们 都 知道 ， 数 组 名 是 数组 中 所 有 数据 元 素 的 起 始 地 址 ， 数 组 元 素 所 
在 的 内 存 地 址 之 间 是 连续 的 。 而 这 里 的 数组 名 intr_entry_table 定义 在 宏 外 ， 并 且 ， 其 他 数组 元 素 ， 即 中 断 
程序 地 址 ， 所 在 的 section 和 数组 名 并 不 属于 同一 个 section 的 定义 ， 怎 么 就 能 保证 数组 元 素 地 址 是 连续 的 
呢 ? 也 就 是 说 ， 它 们 是 怎么 能 合并 到 一 起 了 呢 ? 
在 很 久 很 久之 前 就 和 大 家 说 过 啦 ， 编 译 器 会 将 属性 相同 的 section 合并 到 同一 个 大 的 segment 中 ， 而 
且 , 为 了 显得 更 靠 谱 一 点 , 我 们 在 kernel.S 中 对 所 有 的 数据 section 都 用 了 同一 个 名 字 .data， 这 显得 更 万 无 
一 失 啦 。 所 以 ， 大 家 放心 ， 编 译 之 后 ， 所 有 中 断 处 理 程 序 的 地 址 都 会 乖乖 地 作为 数组 intr_entry_table 的 元 
素 紧 凑 地 排 在 一 起 。 
给 大 伙 看 一 下 预 处 理 后 的 效果 ， 这 里 用 nasm 提供 的 -E 参数 即 可 ， 该 参数 告诉 nasm 仅 做 预 处 理 
编译 ， 如 图 7-24 所 示 。 
在 图 7-24 中 的 左右 两 部 分 其 实 是 竖 着 排 下 来 的 , 为 了 排版 方便 我 才 把 下 面 的 0x20 号 中 断 处 理 程序 挪 
到 了 右边 。 
这 只 是 其 中 的 最 后 两 个 宏 调 用 被 替换 后 的 代码 ， 我 们 以 0x1f 和 0x20 为 例 ， 在 intr 和 entry 之 间 ， 它 
们 已 经 被 替换 为 实际 的 中 断 向 量 号 0x1f 和 0x20 啦 。 
以 上 罗 哩 罗 嗪 地 介绍 完了 宏 ， 咱 们 再 看 看 其 中 的 代码 。 
第 15 行 的 % 是 手工 压 入 凑 数 32 位 数据 ， 前 面 已 有 详 述 。 
第 16 一 18 行 是 为 了 在 中 断 程 序 中 打印 字符 串 “interrupt occur!”。 参 数 intr_str 定义 在 第 8 行 ， 其 值 为 
字符 串 “interrupt occur! 换 行 0” 的 地 址 ， 结 尾 的 0 表示 字符 串 结 束 。 由 于 要 调用 put_str， 所 以 在 第 5 行 有 
extern 声明 了 put_str， 它 告诉 nasm，put_str 定义 在 别 的 文件 中 ， 链 接 时 可 以 找到 。 第 18 行 是 跳 过 压 入 栈 
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中 的 参数 ， 也 就 是 intr_str。 


[section .text] [section .text] 

%line 63+0 kernel/kernel.S %line 64+0 kernel/kernel.S 
intr@xifentry: intrOx20entry: 

push 0 push 0 

push intr_str push intr_str 

call put_str call put_str 

add esp,4 add esp,4 


mov al ,0x20 mov al ,0x20 
out Oxa0,al out Oxa0,al 
out Ox20,al out Ox20,al 


add esp,4 add esp,4 
iret iret 


[section .data] [section .data] 
dd intr@xifentry dd intrOx20entry 








A 图 7-24 ”nasm 预 处 理 


























第 21 一 23 行 是 往 主 片 和 从 片 中 写 入 0x20， 也 就 是 写 入 EOI。 这 是 8259A 的 操作 控制 字 OCW2， 其 中 
第 5 位 是 EOI 位 , 此 位 为 1, 其 余 位 全 为 0, 所 以 是 0x20。 由 于 将 来 咱们 在 设置 8259A 时 设置 了 手动 结束 ， 
所 以 咱们 得 在 中 断 处 理 程序 中 手动 向 8259A 发 送 中 断 结束 标记 ， 和 否则 8259A 并 不 知道 中 断 处 理 完成 了 ， 
它 会 一 直 等 下 去 ， 从 而 不 再 接受 新 的 中 断 。 也 就 是 说 ， 为 了 让 8259A 接受 新 的 中 断 ， 必 须要 让 8259A 知 
道 当 前 中 断 处 理 程序 已 经 执行 完成 。 

好 啦 ，kernel.S 到 这 就 说 完 啦 。 根 据 图 7-22 我 们 还 有 好 多 事 要 做 呢 。 短 口气 儿 ， 下 一 节 咱 们 继续 。 

2. 创建 中 断 描述 符 表 IDT， 安 装 中 断 处 理 程序 
上 一 节 中 完成 了 中 断 处 理 程序 的 编写 ， 在 本 节 中 咱们 要 把 它们 安装 到 中 断 描述 符 表 中 。 接 下 来 再 
看 看 如 何 将 这 些 中 断 处 理 程序 地 址 装载 到 中 断 描述 符 中 。 上 代码 7-2， 这 是 我 们 新 增 的 又 一 个 文件 ， 


interrupt.c。 
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代码 7-2 (project/c7/a/kernel/interrupt.c ) 
#include "interrupt.h" 
2 #include "stdint.h" 
3 #include "global.h" 
八 













































































“ODO 

12 #define IDT DESC CNT 0x21 // 目前 总 共 支 持 的 中 断 数 
4 /* 中 断 门 描述 符 结构 体 */ 
5 struct gate desc { 
6 EL6 func offset low word; 
7 访 和 证 二 selector; 
8 uint8 七 dcount // 此 项 为 双 字 计数 字段 ， 是 门 描述 符 中 的 第 4 字 节 

// 此 项 固定 值 ， 不 用 考虑 

9 uint8 七 attribute; 

20 Uint1g 七 func offset high word; 

21 1}; 

22 


23 // 静态 函数 声明 , 非 必须 
24 static void make idt desc(struct gate desc* p gdesc, uint8 七 attr intr handler function) 
25 static struct gate desc idt[IDT DESC CNT];  // idt 是 中 断 描述 符 表 





















































// 本 质 上 就 是 个 中 断 门 描 述 符 数 组 
26 
27 extern intr handler intr entry table[IDT DESC CNT]; // 声明 引用 定义 在 kernel.s 
// 中 的 中 断 处 理 函 数 入 口 数 组 
28 
50 





51 /* 创建 中 断 门 描述 符 */ 
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7.6 编写 中 断 处 理 








52 static void make idt qdqesc(struct gate desc* p gdesc, uint8 七 attr, intr handler function) { 


383 PpP_gdesc->func offset low word = (uint32 七 ) function & Ox0000FFFF; 

54 p_gdesc->selector = SELECTOR K CODE; 

S55 PpP_gdesc->dcount = 0; 

56 PpP_gdesc->attribute = attr; 

57 PpP_gdesc->func offset high word = ((uint32 t)function & OxFFFFO0000) >> 16; 
58.< 守 

59 


60 /* 初 始 化 中 断 描述 符 表 */ 

61 static void idt desc init (void) { 

62 a ks 

63 for (i = 0; i < IDT DESC CNT; i++) { 





64 make idt desc(&idt[i], IDT DESC ATTR DPLO, intr entry table[il]); 


65 } 
66 potest (" idt desc init done\n"); 
67 } 


69 /* 完 成 有 关中 断 的 所 有 初始 化 工作 */ 
70 void idt init() { 














了 再 put str("idt init start\n"); 

2 idt desc init(); // 初始 化 中 断 描 述 符 表 

73 pic_ init () ; // 初始 化 8259A 

74 

75 /* 加 载 iadt */ 

76 uint64 t idt operand = ((sizeof (idt) — 1) | ((uint64 t) ((uint32 t)iqdt << 16))); 
3 asm volatile("lidt %$0"™ : : "m" (idt operandgd)); 

78 put str("idt init done\n"); 

9 

80 





见 代 码 7-2， 这 是 文件 interruptc， 我 们 有 关中 断 的 内 容 都 在 此 文件 中 实现 。 









































端的 struct gate_desc 来 描述 的 。 




















结构 体 中 位 置 越 偏 下 的 成 员 ， 其 地 址 越 高 。struct gate_desc 结 
























































第 70 行 的 idt_init 函数 负责 所 有 和 中 断 相 关 的 初始 化 工作 ， 是 中 断 初始 化 工作 的 主 
中 断 描 述 符 IDT 本 质 上 就 是 中 断 门 描述 符 的 数组 ， 门 描述 符 的 结构 咱们 也 定义 好 啦 ， 


构 中 成 员 的 定义 是 








已 是 由 文件 顶 

















参照 中 断 门 描述 

















符 来 定义 的 ， 大 伙 参 照 中 断 门 描述 符 的 图 自己 对 比 一 下 ， 各 成 员 名 也 一 目 了 然 ， 不 多 解释 啦 。 描 述 符 都 
是 8 字 节 ， 不 信 您 自己 算 算 struct gate_desc 结构 体 中 成 员 的 大 小 ， 总 和 便 是 8 字 节 。 

























































































DESC_CNT]， 就 是 我 们 定义 的 中 断 描述 符 表 。 您 看 ， 


















































有 了 门 描述 符 后 ， 便 可 以 定义 中 断 描述 符 表 啦 ， 在 文件 顶端 的 static struct gate_desc idt[IDT_ 


它 的 数据 类 型 正 是 struct gate_desc， 数 组 大 小 是 
IDT_DESC_CNT。IDT_DESC_CNT 定义 在 第 12 行 ， 其 值 为 0x21， 即 33， 表 示 33 个 中 断 处 理 程序 ， 也 


























就 是 要 定义 33 个 中 断 门 描述 符 。 另 外 ， 由 于 IDT 属于 全 局 数据 结构 ， 所 以 我 们 声明 它 为 static 类 型 。 




















有 了 IDT 之 后 ， 接 下 来 的 任务 便 是 在 每 个 中 断 门 
































述 符 中 安装 中 断 处 理 程 序 。 






































idt_desc_init 用 来 填充 中 断 描述 符 表 ， 这 是 重 中 之 重 。 咱 们 深入 进去 看 看 是 怎么 






































回 事 。 


























idt_desc_init 定义 在 第 61 行 , 函数 体 中 用 了 一 个 for 循环 , 通过 调用 make_idt_desc 函数 在 中 断 描述 符 


表 中 创建 了 IDT_DESC_CNT 个 中 断 门 描述 符 。 

















make idt_desc 函数 是 用 来 创建 中 断 门 描述 符 的 ， 它 接受 3 个 参数 : 中 断 门 描述 符 的 指针 、 



































符 内 的 属性 及 中 断 描述 符 内 对 应 的 中 断 处 理 函 数 。 



















































































上 断 描 述 





























make idt desc 的 原理 是 将 后 两 个 参数 写 入 第 1 个 参数 所 指向 的 中 断 门 描述 符 中 ， 实 际 上 就 是 用 后 面 的 两 个 























参数 构建 第 1 个 参数 指向 的 中 断 门 描述 符 。 它 定义 在 idt_ desc_ init 函数 的 上 面 
structgate_desc 中 的 成 员 赋 值 。 其 中 为 选择 子 selector 赋值 的 SELECTOR”、K_CODE 定义 在 global.h 中 ， 它 是 个 
指向 内 核 数据 段 的 选择 子 。 我 觉得 您 可 能 不 会 对 其 中 的 赋值 操作 有 疑惑 , 您 可 能 感到 疑惑 的 地 方 是 这 些 属性 的 具 



























































， 内 部 实现 就 是 为 结构 体 


















































体 值 是 什么 ， 比 如 想 看 下 globalh 中 的 内 容 ， 别 急 ， 一 会 儿 看 。 参 数 是 在 调用 时 赋值 的 ， 


























































































































大 








此 中 E 





























上 
make idt_ desc (&cidt[i],IDT_DESC_ATTR_DPLO, intr_entry table[i)， 这 是 在 函数 idt_desc_init 中 调用 的 ， 
第 1 个 参数 便 是 中 断 描述 符 表 idt 的 数组 成 员 指 针 , 第 2 个 参数 IDT_DESC_ATTR_DPL0 是 描述 符 的 属性 ， 
它 同样 定义 在 global.h 中 , 别 急 一 会 儿 给 你 看 global.h。 第 3 个 参数 是 在 kernel.S 
数组 intr_entry_table 中 的 元 素 值 ， 即 中 断 处 理 程序 的 地 址 。 





们 从 调用 入 手 。 





















































定义 的 中 断 描述 符 地 址 
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值得 一 提 的 是 intr_entry_table 在 文件 开头 是 这 样 声 明 的 : 
extern intr handler intr_entry_table[IDT_DESC_CNT]， 其 中 有 个 数据 类 型 是 intr handler， 这 是 我 们 在 
interrupt.h 中 自 定义 的 类 型 ， 其 定义 为 : 


| typedef void* intr_handler; 


也 就 是 说 intr handler 是 个 空 指针 类 型 ， 该 指针 没有 具体 的 类 型 ， 仅 仅 用 来 表示 地 址 。 这 是 因为 
intr_handler 是 用 来 修饰 intr_entry_table 的 ，intr_entry_table 中 的 元 素 都 是 普通 地 址 。 

由 于 我 们 在 实际 调用 make_idt_desc 的 时 候 ， 传 给 它 的 指针 是 来 自 中 断 描述 符 表 中 的 中 断 门 描述 符 地 
址 ， 即 数组 idt 的 某 个 数组 元 素 指针 ， 所 以 ， 通 过 这 个 循环 把 所 有 的 中 断 描述 符 都 填充 好 ， 这 样 我 们 将 整 
个 IDT 准备 好 了 。 

现在 把 global.h 搬出 来 给 大 伙 看 看 ， 请 见 代码 7-3。 


代码 7-3 (project/c7/a/kernel/global.h ) 
1 #ifndef KERNEL GLOBAL H 
#define KERNEL GLOBAL H 
#include "stdint.h" 









































































































































































































































#define RPL1 
#define RPL2 


2 
3 
4 
5 #define RPLO 
6 
7 
8 #define RPL3 


WO OPO 


10 #define TI GDT 0 
11 #define TI LDT 1 


13 #define SELECTOR K CODE ((1 << 3) + {TI GDT << 2) 4 RPL0) 
14 #define SELECTOR K DATA =((2 << 3) + (TI GDT << 2) + RPL0) 
15 #define SELECTOR K STACK SELECTOR K DATA 























16 #define SELECTOR K GS ((3 << 3) + (TI_GDT << 2) 4 RPLO0) 
17 

ne IDT 描述 符 属 性 > gy 

19 #define IDT DESC P TT 

20 #define IDT DESC DPLO 0 

21 #define IDT DESC DPL3 3 

22 #define IDT DESC 32 TYPE 0xE // 32 位 的 门 

23 #define IDT DESC 16 TYPE 0x6 // 16 位 的 门 , 不 会 用 到 








// 定义 它 只 为 和 32 位 门 区 分 
24 #define IDT DESC ATTR DPLO \ 
((IDT DESC P << 7) + (IDT DESC DPL0 << 5) + IDT DESC 32 TYPE) 
25 #define IDT DESC ATTR DPL3 \ 
((IDT DESC P << 7) + (IDT DESC DPL3 << 5) + IDT DESC 32 TYPE) 





QO 




















26 
27 #endif 

















刚才 用 到 的 两 个 宏 分 别 在 文件 global.h 的 第 13 行 和 第 24 行 。 

好 啦 ， 关 于 装载 中 断 描 述 符 表 的 部 分 到 这 就 完成 了 ， 本 节 到 此 结束 ， 咱 们 离 打开 中 断 不 远 了 ， 下 面 继 

续 看 其 他 部 分 。 

3. 用 内 联 汇编 实现 端口 IO 函数 

和 中 断 相 关 的 数据 准备 好 了 ， 接 下 来 只 要 把 中 断代 理 8259A 设置 好 就 可 以 啦 。 对 8259A 或 任何 硬件 

的 控制 都 要 通过 端口 ， 之 前 咱们 在 操作 硬盘 或 显卡 时 ， 都 是 用 Intel 语法 风格 的 汇编 语言 编写 的 ， 毕 况 其 

使 用 方法 不 如 C 函数 那样 方便 。 工 欲 善 其 事 ， 必 先 利 其 器 ， 在 进行 下 一 步 之 前 ， 咱 们 把 常用 的 端口 读 写 

功能 封装 成 C 函数 ， 这 就 用 到 了 我 们 之 前 所 学 的 内 联 汇编 。 
放心 ， 代 码 不 长 ,个 个 短小 精干 ， 我 们 把 有 关 端 口 操作 的 函数 定义 在 io.h 中 ， 这 是 我 们 又 新 增 的 一 个 

文件 ， 见 代码 7-4。 



























































































































































































































































































































































代码 7-4 (project/c7/a/lib/kernel/io.h ) 








/太太 炎 大 类 类 大火 大火 类 大 类 大 类 大 大 类 机 器 模式 类 大 炎炎 类 炎炎 大 大 大 类 大 大 类 类 类 类 大 大 
| 2 b -- 输出 寄存 器 QImode 名 称 ， 即 寄存 器 中 的 最 低 8 位 : [a-d]1 
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7.6 编写 中 断 处 理 






































































































































































































































3 w -- 输出 寄存 器 HImode 名 称 ， 即 寄存 器 中 2 个 字 节 的 部 分 , 如 [a-d]x 

4 

5 HImode 

6 "Half-Integer" 模 式 ， 表示 一 个 两 字 节 的 整数 

7 QImode 

8 "Quarter-Integer" 模 式 ， 表 示 一 个 一 字 节 的 整数 

9 类 炎炎 大火 炎 大 类 类 大 类 炎炎 类 炎炎 大 类 类 大 类 类 大 类 类 类 大 大 类 大 大 类 大 类 类 大 大 大 类 大 大 类 大 大 类 大 大 大 大 大 大 大 大 大 

10 

11 #ifndef LIB IOH 

12 #define LIB IOH 

3 #include "stdint.h" 

14 

15 /* 向 端口 port 写 入 一 个 字 节 */ 

16 static inline void outb(uint16 t port, uint8 t data) { 

yi /大 太太 炎炎 炎炎 交大 类 类 大 大 类 炎炎 类 类 类 类 类 大 大 类 大 大 类 类 大 大 交大 类 大 大 大 类 次 厌 大 交大 类 大 大 大 大 大 大 大 大 大 大 大 大 大 大 

18 ”对 端口 指定 N 表示 0 ~255，4 表示 用 dx 存储 端口 号 ， 

19 ”$b0 表示 对 应 al, swl 表示 对 应 dx */ 

20 asm volatile ( "outb %b0, Swl" : : "a™ (data), "Nd" (port)); 
Tl /太太 大火 炎炎 火炎 类 类 大 类 炎炎 大 大 类 炎炎 类 炎炎 大 大 类 大 类 类 大 类 交大 类 大 大 大 大 大 大 类 大大 大 大 大 大 大 大 大 大 大 大 大 大 了 

22 } 

23 

24 /* 将 addr 处 起 始 的 word_cnt 个 字 写 入 端口 port */ 

25 static inline void outsw(uint16 t port, const void* addr, uint32 t word cnt) { 
26 /大 太太 火炎 炎炎 交大 类 炎炎 类 类 类 类 类 交大 类 交大 类 类 类 大 类 类 类 类 交大 类 类 大 大 类 类 大 大 交大 类 大大 大 大 类 大 类 大 大 大 大 大 大 大 

27 + 表示 此 限制 即 做 输入 , 又 做 输出 . 

28 outsw 是 把 ds:esi 处 的 16 位 的 内 容 写 入 port 端口 ， 我 们 在 设置 段 描述 符 时 ， 
29 已 经 将 ds, es, ss 段 的 选择 子 都 设置 为 相同 的 值 了 ， 此 时 不 用 担心 数据 错乱 。*/ 

30 asm Volatile ("cld; rep outsw" : "+S" (addr), "+c" (word cnt) : "dq" (port)); 
仿生 /太太 类 炎炎 炎炎 炎炎 类 类 类 类 炎炎 类 类 交大 类 类 类 大 类 类 类 类 交大 类 交大 大 类 类 大 大 交大 类 交大 大 大 大 大 大 大 大 大 大 大 大 大 了 

32: 
33 

34 /* 将 从 端口 port 读 入 的 一 个 字 节 返回 */ 

35 static inline uint8 t inb(uint16 七 port) { 

36 uint8 七 data; 

这 asm Volatile ("inb Swl, $b0" : "=a" (data) : "Nd" (port)); 
38 return data; 

号 省 

40 

41 /* 将 从 端口 port 读 入 的 word_cnt 个 字 写 入 adqqr */ 

42 static inline void insw(uint16 t port, void* addr, uint32 t word cnt) { 
Pe /太太 大 炎 炎炎 火炎 炎炎 类 大大 类 类 类 类 交大 类 炎炎 大大 大大 类 类 类 类 类 大 大 类 类 大 类 类 大 类 交大 大 类 大 大 大 类 大 大 类 大 大 大 

44 insw 是 将 从 端口 port 处 读 入 的 16 位 内 容 写 入 es :edi 指向 的 内 存 ， 

45 我 们 在 设置 段 描 述 符 时 ， 已 经 将 ds, es, ss 段 的 选择 子 都 设置 为 相同 的 值 了 ， 
46 此 时 不 用 担心 数据 错乱 。*/ 

47 asm volatile ("cld; rep insw" : "+D" (addr), "+c" (word cnt) 
"dd" (port) 3 "memoryy; 

48 /太太 大大 炎炎 类 炎炎 类 类 类 大 类 类 类 类 交大 大 类 大 大 类 类 大 类 大大 大 交大 大 大 大 大 大 交大 类 大大 大 大 大 大 大 大 大 大 大 大 大 大 了 

49 } 

50 

51 #endif 


文件 io.h 并 不 长 ， 总 共 就 51 行 ， 与 其 他 c 文件 不 同 的 是 我 们 把 函数 的 实现 部 分 直接 放 到 了 以 .h 为 结 
尾 的 头 文件 中 ， 这 似乎 显得 有 些 怪 异 。 
我 们 平时 都 是 把 函数 体 放 在 .c 文件 中 ， 头 文件 







































































只 用 于 存放 函数 声明 ， 如 果 函 数 是 全 局 作用 域 的 话 ， 链 














接 后 ， 





























外 部 文件 就 可 以 调用 该 函数 了 ， 所 以 ， 一 般 情 况 下 ， 头 文件 都 作为 功能 模块 的 接口 而 存在 ， 头 文件 









































中 对 应 的 函数 在 程序 中 也 只 会 存在 一 份 。 而 我 们 的 io.h 却 是 函数 的 实现 ， 并 且 ， 里 面 各 函数 的 作用 域 都 是 


Static ， 





这 表明 该 函数 仅 在 本 文件 中 有 效 ， 对 外 不 可 见 。 这 意味 着 ， 凡 是 包含 ioh 的 文件 ， 都 会 获得 一 份 

















lo.h : 











看 上 去 哥们 还 是 “清醒 ”的 ， 但 为 什么 还 是 干 这 样 的 “糊涂 ” 事 呢 ? 














所 有 函数 的 拷贝 ， 也 就 是 说 同样 功能 的 函数 在 程序 中 会 存在 多 个 副本 ， 这 样 程序 体积 就 会 大 一 些 。 





















































是 这 样 的 ， 这 里 的 函数 并 不 是 普通 的 函数 ,它们 都 是 对 底层 硬件 端口 直接 操作 的 ， 通常 由 设备 的 驱动 程 
序 来 调用 ,不 用 说 ,为 了 快速 响应 ， 函 数 调用 上 需要 更 加 高 效 。 而且， 操作 系统 是 为 了 让 用 户 程 序 编写 、 执 





行 更 加 方便 才 诞 生 的 , 归根 结 底 是 为 了 用 户 程序 服务 , 所 以 它 会 让 处 理 器 的 大 多 数 时 间 花 在 3 特权 级 
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用 户 






































程序 上 。 为 了 让 处 理 器 更 多 地 为 用 户 程序 服务 ， 操 作 系统 〈 包 括 硬件 驱动 程序 ) 必须 减少 自己 占用 处 理 器 的 


时 间 ， 





























所 以 ， 对 硬件 端口 的 操作 ， 只 要 求 一 个 字 一 一 快 。 
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但 一 般 的 函数 调用 需要 涉及 到 现场 保护 及 恢复 现场 ， 即 函数 调用 前 要 把 相关 的 栈 、 返 回 地 址 (CS 和 
EIP) 保存 到 栈 中 ， 函 数 执行 完 返 回 后 再 将 它们 从 栈 中 恢复 到 寄存 器 。 栈 毕竟 是 内 存 ， 速 度 低 很 多 ， 而 且 
入 栈 、 出 栈 这 么 多 内 存 操作 ， 对 于 想方设法 提速 的 内 核 程 序 来 说 是 无 法 忍受 的 。 

因此 ,为 了 提速 ， 在 我 们 的 实现 中 ， 函 数 的 存储 类 型 都 是 static， 并 且 加 了 inline 关键 字 ， 它 建议 处 理 
器 将 函数 编译 为 内 构 的 方式 。 内 骨 函 数 大 家 都 清楚 吧 , 就 是 将 所 调用 的 函数 体 的 内 容 , 在 该 函数 的 调用 处 ， 
原封 不 动 地 展开 ， 这 样 编译 后 的 代码 中 将 不 包含 call 指令 ， 也 就 不 属于 函数 调用 了 ， 而 是 顺 次 执行 。 昌 然 
这 会 让 程序 大 一 些 ， 但 减少 了 函数 调用 及 返回 时 的 现场 保护 及 恢复 工作 ， 提 升 了 效率 还 是 值得 的 。 

好 啦 ， 解 释 清 楚 了 ， 咱 们 简单 看 下 里 面 定义 了 哪些 函数 。 

io.h 中 就 定义 了 4 个 函数 ， 分 别 是 。 

(1) 一 次 写 入 1 个 字 节 的 outb 函数 。 

(2) 一 次 写 入 多 个 字 的 outsw 函数 ， 注 意 ， 是 L 

(3) 一 次 读 入 1 个 字 节 的 inb 函数 。 

(4) 一 次 读 入 多 个 字 的 insw 函数 ， 同 样 以 2 字 节 为 单位 。 

outb 函数 接受 两 个 参数 ， 参 数 port 是 16 位 无 符号 整 型 的 端口 号 ， 此 类 型 可 容纳 Intel 所 支持 的 65536 
个 端口 号 , 参数 data 是 1 字 节 的 整 型 数据 ，outb 的 功能 是 将 data 中 的 1 字 节 数据 写 入 port 所 指向 的 端口 。 
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iD 
ly 
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为 单位 的 。 



























































函数 实现 是 用 内 联 汇编 来 实现 的 ， 内 联 汇 编 的 格式 是 : 

| asm [volatile] (“vassembly code” : output : input : clobber/modify): 
按照 以 上 格式 ， 我 们 自己 的 代码 是 : 

| asm volLlatile. ( Toutb Sb07 -SW 3 Va (data), Nd™ (port)); 





首先 必须 要 清楚 ，outb 指令 格式 为 outb %al，%dx， 其 中 %al 是 源 操作 数 ， 指 的 是 8 位 数据 ，%dx 是 
目的 操作 数 ， 指 的 是 数据 所 写 入 的 端口 。 

我 们 要 做 的 是 通过 gcc 提供 的 各 种 约束 和 机 器 模式 操作 码 将 内 联 汇编 形式 凑 成 outb %al，%dx， 明 们 
一 点 点 分 析 下 是 怎么 做 到 的 。 

从 右边 的 input 开始 看 ， 形 参 变量 port 的 约束 有 2 个 ， 分 别 是 N 和 d。N 为 立即 数 约束 ， 它 表示 0 一 
255 的 立即 数 ， 也 就 是 8 位 1 字 节 所 表示 的 范围 ， 这 样 把 写 入 的 数据 限制 在 1 字 节 之 内 。d 为 寄存 器 约束 ， 
它 表 示 让 gcc 为 port 分 配 的 寄存 器 可 以 是 dl、dx 或 edx。outb 的 目的 操作 数 是 dx， 我 们 得 想 办 法 将 寄存 
器 明确 为 dx。 这 可 以 用 操作 码 w 来 实现 ， 它 表示 使 用 寄存 器 的 HImode 名 称 ， 即 寄存 器 中 2 字 节 的 那个 
可 独立 使 用 的 部 分 ， 也 就 是 [a-d]x。 操 作 码 是 跟 序号 占 位 符 配 合 在 一 起 来 使 用 的 ， 所 以 操作 码 w 要 随 着 序 
号 占 位 符 在 内 联 汇编 的 “assembly code ”中 使 用 。 大 家 看 “assembly code”，port 所 对 应 约束 的 序号 占 位 符 
是 %1， 我 们 目的 是 使 用 dx 寄存 器 ， 所 以 用 %w1l 来 限制 目的 操作 数 为 寄存 器 dx。 

继续 说 output 中 的 data 变量 ， 它 对 应 的 约束 为 a， 这 表示 用 寄存 器 al、ax 或 eax 来 存储 该 变量 的 值 ， 
前 面 说 过 outb 指令 的 源 操作 数 是 寄存 器 al， 我 们 也 必须 将 源 操作 数 使 用 的 寄存 器 明确 为 al 才 行 。 这 可 以 
通过 机 器 模式 操作 码 b 来 实现 ， 操 作 码 b 表示 寄存 器 的 QImode 部 分 ， 也 就 是 寄存 器 中 最 低 8 位 可 独立 使 
用 的 部 分 ， 即 [a-dj1。 同 理 ， 在 “assembly code” 中 用 %b0 表示 al 寄存 器 。 
到 现在 为 止 ， 我 们 已 经 凑 成 了 “outb %al，%dx” 的 形式 ， 咱 们 的 任务 完成 ， 接 下 来 就 是 上 处 理 器 执行 了 。 
其 实 ， 这 几 个 函数 实现 都 差不多 ， 再 者 代码 中 的 注释 已经 很 详实 了 ， 大 伙 儿 自己 都 能 看 懂 ， 所 以 我 再 
给 大 伙 儿 说 一 个 。 

说 完了 一 个 简单 的 写 入 端口 函数 ， 再 介绍 一 个 相对 复杂 一 些 的 读 入 端口 函数 ，insw。 

insw 接受 三 个 参数 ， 无 符号 16 位 整 型 变量 port 是 待 读 入 的 端口 号 ， 空 指针 变量 addr 是 数据 缓冲 区 ， 
用 于 存储 读 出 来 的 数据 ， 无 符号 32 位 整 型 变量 word_cnt 是 以 字 (2 字 节 ) 为 单位 的 数据 单位 量 。insw 函 
数 的 功能 是 将 从 端口 port 读 入 的 word_cnt 个 字 写 入 addr。 

insw 函数 的 核心 是 用 同名 汇编 指令 insw 来 实现 的 ,该 指令 的 功能 是 从 端口 port 处 读 入 的 16 位 数据 写 
入 es: edi 指向 的 内 存 ， 即 一 次 读 入 2 字 节 。 狐 地 一 看 还 真有 点 不 解 ， 还 要 指定 段 寄 存 器 es， 咱 们 这 是 在 
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7.6 ”编写 中 断 处 理 程序 





C 环境 下 ， 











难道 还 要 在 内 联 汇 编 中 为 es 重新 赋 选 择 子 ? 











这 一 点 大 可 不 必 担 ， 


4GB 的 大 














段 中 ， 即 段 基 址 为 0， 段 界限 为 4GB-1。 丝 
早已 经 把 段 寄 存 器 ds、 
可 见 图 7-25。 所 以 es 和 

















心 ， 这 时 候 平坦 模型 的 好 处 就 体现 出 来 了 。 平 坦 模型 下 所 有 内 存 数 和 
们 在 loader 中 初始 化 全 局 描述 符 表 进 入 
es、ss 都 指定 为 相同 的 数据 段 选择 子 啦 (fs 未 使 用 ， 所 以 未 做 初始 化 )， 忘 记 的 话 





















































ds 指向 的 是 同一 个 基 址 为 0 的 段 , 咱们 只 要 指 











定 偏 移 地 址 就 行 啦 。 平 坦 模型 下 的 编译 器 ， 其 所 编译 出 来 的 程序 中 的 








符号 地 址 EE 
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指针 变量 





寄存 器 就 行 了 。 于 是 
将 变量 addr 的 值 约束 到 EDI 中 。 


就 是 偏 移 


addr 中 的 值 便 








然 按 照 平 坦 模 型 来 编排 ， 即 默认 段 基 址 为 0, 符号 地 址 其 实 
地 址 。 指 针 变 量 用 来 存储 其 他 符号 的 地 址 ， 也 就 是 说 ， 此 处 













































































是 偏 移 地 址 ， 虽 们 只 要 把 addr 的 值 约束 到 edi 






































都 在 同一 个 
果 护 模式 后 ， 








， 在 output 中 ，"+D”(addD 表 示 用 寄存 器 约束 D 图 7-25 loader 中 为 段 寄存 器 初始 化 


insw 函数 实现 的 是 将 多 个 字 从 指定 端口 读 出 ， 而 汇编 指令 insw 执行 一 次 只 能 从 端口 读 取 2 字 节 的 数 





+ 表示 所 修饰 




































































寄存 器 或 内 存 先 被 读 入 ， 再 被 写 入 。 
为 什么 要 用 + 呢 ? 原因 是 寄存 器 edi 和 ecx 先 被 读 入 ， 又 被 写 入 啦 ， 同 时 作为 指令 的 输入 和 输出 ， 这 

















在 之 前 咱们 介绍 内 联 汇编 的 修饰 符 +' 时 已 埋 下 了 伏笔 。 
也 许 您 隐约 觉得 ， 只 有 重复 执行 字符 串 操作 指令 才 会 这 样 ， 没 错 ， 让 我 们 回忆 下 




















luas 


家 介绍 过 数据 复制 的 三 剑客 。 


Ar 日 





(1) 字符 串 搬 运 指令 族 movs[dw] 


(2) 司 
(3) 方向 





ES: [E]DI 作为 目 


提醒 一 下 ，movsw 




















EE 复 执 行 指令 rep 

间 令 cld 和 std 
其 实 后 两 个 是 固定 不 变 的 ， 第 1 个 字符 串 搬 运 指令 可 以 替换 为 其 他 以 DS: [E]SI 作为 数 
的 地 址 的 字符 串 操作 《传输 ) 指令， 这 里 的 insw 相当 于 movsw。 



















































































只 会 更 新 edi， 不 会 更 新 
每 执行 一 次 insw 指令 , insw 要 把 ES: EDI 作为 数据 缓冲 区 , 这 时 EDI 作为 insw 指令 的 输入 。 由 于 姑 
除了 方向 位 DF， 故 insw 指令 执行 后 ，EDI 的 值 自动 加 2， 这 时 EDI 作为 输出 


lilo 


执行 前 已 经 用 cld 指令 清 
rep 用 ecx 控制 执行 
输入 ， 执 行 完 后 ，ecx 要 减 1， 这 时 ecx 作为 输出 。 


























esi。 这 在 前 面 介绍 内 联 汇 编 和 数据 复制 “三 剑客 ”时 已 强调 过 。 





















































后 面 指令 insw 的 次 数 ， 所 以 每 次 先 要 读 取 ecx 的 值 判 断 是 否 为 0， 























"d" (porb 就 不 用 说 啦 ， 就 是 把 端口 号 port 的 值 约束 到 dx 寄存 器 中 。 





在 内 联 ; 











写 入 了 数 寺 








































































































据 ， 所 以 这 必然 涉及 到 循环 执行 ， 这 里 用 的 是 重复 指令 rrp， 它 把 寄存 器 ecx 作为 循环 计数 器 ， 每 执行 一 
次 ，ecx 的 值 就 减 1， 直 到 ecx 为 0 时 停止 执行 。 这 就 很 好 理解 了 ，"+c" (word_cnb 便 是 把 word_cnt 的 值 约 
束 到 寄存 器 ecx 中 作为 循环 次 数 。 
的 约束 既 做 输入 (位 于 input 中 )， 也 做 输出 (位 于 output 中 )， 也 就 是 告诉 gcc 所 约束 的 





经 在 第 5 章 和 大 


源 地 址 ， 以 


] 到 了 esi 和 edi， 所 以 这 两 个 寄存 器 的 值 都 会 自动 更 新 , 但 insw 只 用 到 了 edi, 所 以 


Ff Insw 


这 时 ecx 作为 





[ 编 的 clobbermodify 部 ， 这 里 还 用 到 了 内 存 破坏 memory， 由 于 insw 指令 往 内 存 es: edi 处 
居 ， 所 以 通知 gcc 这 块 内 存 已 经 改变 。 


不 知 大 伙 儿 有 没有 疑问 ，edi 也 被 更 新 了 啊 ， 为 什么 edi 不 需要 在 clobber/modify 中 声明 ? 其 实 之 前 已 


经 说 过 ， 如 果 在 output 和 input 中 通过 寄存 器 约束 指定 了 寄存 器 ，gcc 必然 会 知道 这 些 寄存 器 会 被 修改 ， 

















不 需要 再 重复 通知 啦 。 





好 啦 兄弟 人 











天 到 此 为 止 。 


4. 设置 8259A 

















前 面 


在 准备 好 ! 








断 描述 符 后 ， 接 下 来 我 们 该 对 8259A 编程 啦 。 














7.5 节 中 介绍 过 的 8259A 内 容 确实 多 了 一 些 ， 但 那 是 为 了 让 大 伙 儿 明白 8259A 从 














其 编程 是 



























































作 原 理 











]， 咱 们 就 介绍 到 这 ， 另 外 两 个 没 介绍 的 函数 我 相信 您 绝对 有 能 力 掌 握 ， 大 伙 儿 辛苦 啦 ， 今 


到 对 


得 么 回 事 ， 而 我 们 这 里 的 实际 代码 却 不 多 ， 这 就 像 摇 控 电 视 机 ， 无 非 就 那 几 个 按钮 按 来 按 去 ， 但 
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第 一 次 接触 电视 机 的 时 候 ， 先 得 把 十 几 页 的 说 明 书 通读 一 遍 后 ， 才 知道 按 下 的 那 几 个 按钮 是 什么 意思 。 在 
本 节 ， 只 要 您 对 8259A 还 有 点 印象 ， 咱 们 就 能 顺利 地 读 下 去 。 
不 过 ， 估 计 大 伙 儿 已 经 态 记 怎么 对 8259A 编程 啦 ， 因 为 我 就 经 常态 。 所 以 ， 大 伙 儿 可 以 先 看 看 前 面 
对 8259A 的 编程 那 一 节 的 最 后 总 结 的 部 分 ， 如 果 您 懒得 往 回 翻 ， 这 里 给 大 家 摘要 了 一 些 重 点 。 

8259A 的 编程 就 是 写 入 ICW 和 OCW， 其 中 ICW 是 初始 化 控制 字 ， 共 4 个 ，ICW1~ICW4， 用 于 初 
始 化 8259A 的 各 个 功能 。OCW 是 操作 控制 字 ， 用 于 同 初始 化 后 的 8259A 进行 操作 命令 交互 。 所 以 ， 对 
8259A 的 操作 是 在 其 初始 化 之 后 ， 对 于 8259A 的 初始 化 必须 最 先 完成 。 

因为 硬盘 是 接 在 了 从 片 的 引 脚 上 ， 可 参见 图 7-12， 将 来 实现 文件 系统 是 离 不 开 硬 盘 的 ， 所 以 我 们 这 上 
使 用 的 8259A 要 采用 主 、 从 片 级 联 的 方式 。 在 x86 系统 中 ， 对 于 初始 化 级 联 8259A，4 个 ICW 都 需要 ， 
必须 严格 按照 ICW1 一 4 顺序 写 入 。 

ICW1 和 OCW2、OCW3 是 用 偶 地 址 端口 0x20 〈 主 片 ) 或 0xA0 (从 片 ) 写 入 。 

ICW2~ICW4 和 OCW1 是 用 奇 地 址 端口 0x21 ( 主 片 ) 或 0xAl1 (从 片 ) 写 入 。 

好 啦 ， 回 忆 结 束 ， 咱 们 现在 真 刀 真 枪 上 战场 啦 。 大 伙 放 心 ， 此 部 分 不 像 前 面 介 绍 它 的 时 候 那么 元 长 ， 
此 处 对 它 的 编程 我 们 也 只 用 了 最 基本 的 设置 。 不 信 的 话 大 伙 请 见 代 码 7-5。 

代码 7-5  ( project/c7/a/kernel/interrupt.c ) 
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wat 










































































… 略 
4 #include "io.hn 


LO 



































7 #define PIC M CTRL 0x20 // 主 片 的 控制 端口 是 0x20 
8 #define PIC M DATA 0x21 // 主 片 的 数据 端口 是 0x21 
9 #define PIC S CTRL 0xa0 // 从 片 的 控制 端口 是 0xa0 
10 #define PIC S DATA 0xal // 从 片 的 数据 端口 是 0xal 





… 略 
29 /* 初始 化 可 编程 中 断 控 制 器 8259A */ 
30 static void pic init(void) { 
六 站 


































































































32 /* 初 始 化 主 片 */ 
33 outb (PIC M CTRL, 0x11); // ICW1: 边沿 触发 , 级 联 8259， 需 要 ICW4 
34 outb (PIC M DATA, 0x20); // ICW2: 起 始 中 断 向 量 号 为 0x20 
// 也 就 是 IR[0-7] 为 0x20 ~ 0x27 
35 outb (PIC M DATA, 0x04); // ICW3: IR2 接 从 片 
36 outb (PIC M DATA, 0x01); // ICW4: 8086 模式 ， 正 常 EOI 
3 了 
38 /* 初 始 化 从 片 */ 
39 outb (PIC S CTRL, 0x11); // ICW1: 边沿 触发 , 级 联 8259， 需 要 ICw4 
40 outb (PIC S DATA, 0x28); // ICW2: 起 始 中 断 向 量 号 为 0x28 
// 也 就 是 IR[8-15] 为 0x28 ~ 0x2F 
41 outb (PIC S DATA, 0x02); // ICW3: 设置 从 片 连接 到 主 片 的 IR2 引 脚 
42 outb (PIC S DATA, 0x01); // ICW4: 8086 模式 ， 正 常 EOI 
43 
44 /* 打 开 主 片上 IR0, 也 就 是 目前 只 接受 时 钟 产生 的 中 断 */ 
45 outb (PIC M DATA, 0xfe) ; 
46 outb (PIC S DATA, Oxff); 
47 
48 put str(" pic init done\n"); 
49 } 
… 略 








69 /* 完 成 有 关中 断 的 所 有 初始 化 工作 */ 
TO void iat initty. 4 
引出 put_ str(" idt init StartNn”)y 











72 idt desc init(); // 初始 化 中 断 描述 符 表 

73 pic_ init (); // 初始 化 8259A 

74 

75 /* 加 载 iat */ 

76 uint64 t idt operand = ((sizeof (idt) — 1) | ((uint64 七 ) ((uint32 t)iqdt << 16))); 
77 asm volatile("lidt %$0"™ : : "m" (idt operand) ) ; 

78 put str("idt init done\n"); 

7 

80 


























方 
于 
讨 
ea 
并 


很 少 ? 和 之 前 8259A 那么 见长 的 理论 知识 相 比 ， 此 刻 是 否 宽慰 了 很 多 ? 
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7.6 编写 中 断 处 理 程 序 























代码 7-5 还 是 interrupt.c, 只 是 把 设置 8259A 的 代码 摘 了 出 来 。 在 文件 开头 我 们 包含 了 之 前 编写 的 io.h 














文件 ， 我 们 要 用 其 中 的 outb 函数 来 编程 8259A。 


























对 于 8259A 的 设置 是 用 pic_init 




















的 注释 。 





我 们 先 设置 主 片 ， 在 第 33 行 往 主 片 中 写 入 ICW1， 前 面 给 大 伙 儿 回忆 过 啦 ，ICW1 是 往 主 、 从 片 的 侦 









































数 地 址 写 入 的 ， 即 3 
通过 刚 风 











We 








出 炉 的 outb 函数 往 端 








片 端口 地 址 是 0 























函数 完成 的 ， 它 在 idt_init 中 被 调用 ， 其 定义 在 第 30 行 。 








在 pic_init 中 依次 设置 主 片 和 从 片 8259A， 无 论 是 主 片 ， 还 是 从 片 ， 都 必须 按 顺 序 依次 写 入 ICW1、 
ICW2、ICW3、ICW4， 这 在 前 面 介绍 8259A 编程 时 已 经 解释 过 啦 。 
为 方便 编码 ,我 们 在 文件 开头 定义 了 四 个 宏 来 表示 主 、 从 片 的 控制 端口 和 数据 端口 。 详 见 宏 定义 处 后 







































































x20， 从 片 端 口 地 址 是 0xA0。 























PIC M_CTRL (也 就 是 主 片 的 控制 端口 0x20) 写 入 ICW1， 其 值 为 








0x11。 对 照 图 7-14ICWI1 格式 , 第 0 位 是 IC4 位 ,表示 是 否 需 要 指定 ICW4, 我 们 需要 在 ICW4 中 设置 EOI 

















A 











第 34 行 往 主 片 














为 手动 方式 ， 所 以 需要 ICW4。 由 于 我 们 要 级 联 从 片 ， 所 以 将 ICW1 中 的 第 1 位 SNGL 置 为 0， 表 示 级 联 。 
设置 第 3 位 的 LTIM 为 0， 表示 边沿 触发 。ICW1 中 第 4 位 是 固定 为 1。 其 他 位 不 设置 。 


中 写 入 ICW2, ICW2~ICW4 是 写 入 主 、 从 片 的 奇 地 址 端口 ， 即 主 片 的 0x21 和 从 片 的 






























































0xA1， 以 下 再 讨论 ICW3~ICW4 时 不 再 重复 说 明 。 























ICW2 专用 于 设置 8259A 的 起 始 中 断 癌 量 号 ， 由 于 中 断 向 量 号 0 一 31 已 经 被 占用 或 保留 ， 从 32 起 才 
























































可 用 ， 所 以 我 们 往 主 片 PIC M_DATA 端口 〈 主 片 的 数据 端口 0x21) 写 入 的 ICW2 值 为 0x20， 即 32。 这 
说 明 主 片 的 起 始 中 断 向 量 号 为 0x20， 
IR1~IR7 对 应 的 中 断 向 量 号 依次 往 下 排 。 

















第 35 行 往 主 片 























中 写 入 ICW3。 






































即 IR0 对 应 的 中 断 向 量 号 为 0x20， 这 是 我 们 的 时 钟 所 接 入 的 引 脚 。 




















ICW3 专用 于 设置 主 从 级 联 时 用 到 的 引 脚 。 我 发 现 很 多 人 在 设置 级 联 8259A 时 ， 都 是 用 IR2 引 脚 来 
级 联 从 片 的 ， 所 以 我 也 是 用 IR2 引 脚 作为 主 片 级 联 从 片 的 接口 ， 我 猜想 其 他 引 脚 也 行 的 ， 要 不 然 ICW3 
为 什么 是 8 位 的 ? 不 过 我 并 未 亲自 测试 , 我 们 这 里 能 保证 8259A 正常 运行 就 可 以 , 大 家 感 兴趣 的 话 可 以 





























即 PIC M DATA。 
第 36 行 往 主 片 
8259A 的 很 多 了 














自行 测试 。 第 2 个 引 脚 ， 旧 






































中 写 入 ICW4。 
























































1 IR2, 在 ICW3 中 将 其 置 为 1， 故 ICW3 值 为 0x04， 写 入 主 片 奇 地 址 端口 0x21， 

















[ 作 模 式 都 在 ICW4 中 设置 ， 可 以 参见 图 7-18 ICW4 的 格式 ， 我 们 只 要 设置 其 中 的 第 0 

















位 : hnPM 位 ， 它 设置 当前 处 理 器 的 























类 型 ， 咱 们 所 在 的 开发 平台 是 x86， 所 以 要 将 其 置 为 1。 此 外 还 要 设 

















置 ICW4 的 第 1 位 : 




















EOI 的 工作 模式 位 。 还 记得 EOI 的 作用 吧 ， 即 End OF Interrupt， 就 是 告诉 8259A 中 





























断 处 理 程序 执行 完了 ，8259A 现在 可 以 接受 下 一 个 中 断 信号 啦 。EOI 的 工作 模式 位 就 是 设置 故 送 EOI 的 方 
式 。 如 果 为 1，8259A 会 自动 结束 中 
所 以 ICW4 的 值 为 0x01。 写 入 主 片 奇 地 址 端口 0x21， 即 PIC M_DATA。 
至 此 ， 已 经 向 主 片 发 送 了 4 个 ICW， 接 下 来 设置 从 片 8259A。 


























他 位 按 默 认 就 行 了 ， 
































第 39 行 向 从 片 











发 送 ICW1, 其 意 











断 ， 这 里 我 们 需要 手动 向 8259A 发 送 中 断 ， 所 以 将 此 位 设置 为 0。 其 











义 和 主 片 的 ICW1 一 致 , 只 不 过 是 往 从 片 的 偶数 地 址 端口 0xA0 发 送 ， 








这 是 从 片 的 控制 端口 ， 即 PIC S$S_CTRL。 





























第 40 行 向 从 片 发 送 ICW2,， 这 是 设置 从 片 的 起 始 中 断 向 量 号 。 由 于 主 片 的 中 断 向 量 号 是 0x20 一 0x27， 





























故 从 片 的 中 断 向 量 号 顺 着 它 延 续 下 来 ， 从 0x28 开始 ， 即 ICW2 值 为 0x28， 也 就 是 IR[8-15] 为 0x28 一 
0x2F。ICW2 通过 outb 函数 向 从 片 的 奇数 地 址 端口 0xAl 写 入 ， 即 PIC_S_DATA。 












































第 41 行 向 从 片 发 送 ICW3, ICW3 专用 于 设置 级 联 的 引 脚 , 这 里 设置 从 片 连接 在 主 片 的 哪个 IRQ 引 脚 





























上 。 刚才 在 设置 主 片 的 时 候 是 设置 用 IR2 引 脚 来 级 联 从 片 ， 所 以 此 处 要 告诉 从 片 连接 到 主 片 的 下 2 上 ， 即 
ICW2 值 为 0x02， 通 过 outb 函数 向 从 片 的 奇数 地 址 端口 0xAl 写 入 ， 即 PIC S_DATA。 





第 42 行 向 从 片 




















发 送 ICW4， 同 3 











FE 片 的 ICW4 一 样 ， 不 再 解释 。 





至 此 主 、 从 片 都 已 经 初始 化 完成 了 。 
我 们 立即 就 能 测试 中 断 处 理 程 请 















































啦 ， 虽 然 我 们 在 kernel.S 中 将 所 有 的 中 断 处 理 程序 都 用 宏 macro 设置 
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上 的 耻 0 引 脚 上 的 时 钟 中 断 











屏蔽 寄存 器 IMR 来 实现 ， 咱 们 只 要 将 








成 一 样 的 了 ,但 我 们 还 是 只 测试 一 个 中 断 源 比较 靠 谱 。 为 此 ,我 们 拿 位 于 主 片 」 
举例 ， 位 于 其 他 引 脚 的 外 部 中 断 信号 咱们 统统 屏蔽 。 

障 蔽 某 个 外 部 设备 中 断 信号 可 以 通过 设置 位 于 8259A 中 的 中 断 
相应 位 置 1 就 达到 了 屏蔽 相应 中 断 源 信号 的 目的 。 顺 便 说 一 句 ， 标 志 寄存 器 eflags : 
中 断 有 效 ， 不 能 通过 它 来 屏蔽 某 个 外 设 的 中 断 。 

所 以 ， 现 在 还 有 一 件 事 要 做 ， 就 是 设置 中 断 屏蔽 寄存 器 IMR， 只 放行 主 片 上 IR0 








他 外 部 设备 的 中 断 。 


第 
这 样 的 命令 操 














芷 已 经 不 


















































45 一 46 行 开始 设置 IMR 寄存 器 只 放行 时 钟 ! 
属于 初始 化 了 ， 所 以 此 时 再 向 8259A 发 送 的 从 























OCW。 往 IMR 寄存 器 























症 字 称 为 OCW1， 






































的 下 位 对 所 有 外 部 











的 时 钟 中 断 ， 屏蔽 其 


E 何 数据 都 称 为 操作 控制 字 ， 即 
主 片 上 的 OCW1 为 0xfe， 即 第 0 位 为 0， 表 示 不 
屏蔽 IR0 的 时 钟 中 断 。 其 他 位 都 是 1， 表 示 都 屏蔽 。 从 片上 的 所 有 外 设 都 屏蔽 ， 所 以 发 送 的 OCWI1 值 为 








0xff。OCW1 是 写 入 主 、 从 片 的 奇 地 址 端口 ， 即 主 片 的 0x21 端口 (PIC M_DATA) 和 从 片 的 0xAl 端口 


(PIC S_DATA )。 


好 啦 ，8259A 的 设置 到 这 就 结束 啦 ， 
开启 中 断 
本 节 是 开启 中 断 


5. 加 载 IDT， 








可 以 参见 图 









































高 32 位 是 IDT 的 线性 基地 址 。 














往 IDTR， 
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a 





们 将 打 了 














加 


LD 























lidt 48 位 内 存 数 据 


代码 7-6 


25 static struct gate desc idt[IDT DESC CNT]; 





// idt 是 中 断 描述 符 表 ， 本 质 上 就 是 个 





… 略 





/* 加 载 iat */ 
uint64 t idt operand = ((sizeof (idt) - 1) | 
asm volatile("lidt %0"™ : : 
put_str("idt init done\n"); 


P 断 门 描述 符 数 组 


"m" (idt operand 





于 中 断 ， 让 中 断 处 到 





E 程 




















( project/c7/a/kernel/interrupit.c ) 


序 跑 起 来 。 


断 描 述 符 表 IDT 的 信息 加 载 到 IDTR 寄存 器 。 
7-6 IDTR 结构 ，IDTR 是 48 位 的 寄存 器 ， 低 16 位 是 IDT 的 界限 ， 即 IDT 尺寸 大 小 -1， 


加 载 IDT 的 指令 是 lidt，lidt 的 操作 数 也 要 符合 IDTR 寄存 器 的 结构 ， 所 以 lidt 的 操作 数 也 必须 是 


48 位 ， 前 16 位 是 界限 limit， 后 32 位 是 基 址 ， 只 不 过 这 48 位 的 数据 必须 位 于 内 存 中 ， 所 以 lidt 的 用 法 是 : 


((uint64 t) ((uint32 t)idt << 16))); 


) ); 


见 代 码 7-6， 我 们 的 IDT 定义 在 文件 开头 第 25 行 ， 即 数组 struct gate_desc idt。 





由 于 C 语言 中 没有 48 位 的 数据 类 型 ， 所 以 我 们 
lidt 中 会 取出 48 位 数据 做 操作 数 , 所 以 咱们 只 要 保证 64 位 变量 中 的 前 48 位 数据 是 正确 











凌 出 48 位 的 操作 数 ， 在 第 76 行 。 














(1) 先 用 
(2 ) 捞 



































sizeoflidt) 一 1 得 
下 来 再 将 idt 的 地 弓 
名 便 是 地 址 ， 即 指针 ， 故 先 将 











到 idt 的 段 界限 limit， 这 | 
止 挪 到 高 32 位 即 可 ， 这 可 以 通过 





















































高 位 将 被 丢弃 ， 万 




















大 小 的 整 型 
将 





























进行 左 移 操作 ， 这 样 
业 ， 故 32 位 的 指针 不 能 


转换 成 uint64_t, 之 后 再 对 这 个 64 位 的 无 











原 地 址 高 16 位 不 是 0， 这 样 会 造成 数据 错 
其 高 32 位 都 是 0， 经 过 左 移 操作 依然 能 够 保证 


大 并口 




















16~48 位 ， 低 16 位 自动 填充 为 0。 


(3) 之 后 再 将 以 上 两 步 的 结果 通过 “ 按 位 或 ”运算 符 
的 三 步 得 到 的 操作 数 是 64 位 ， 但 





虽然 经 过 以 上 
依然 只 在 该 地 址 处 
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在 第 77 行 , 通过 内 联 汇 编 的 








(&idt_operand) 取 3 


符号 











j 64 位 的 变量 idt operand 来 代替 ， 这 是 没 问 题 的 ， 








] 作 低 16 位 的 段 界限 。 


的 就 行为 了 给 lidt 














巴 idt 地 址 左 移 16 位 的 形式 实现 。 由 于 数组 
其 转换 成 整数 才能 参与 后 面 的 左 移 运算 。 考 虑 到 32 位 地 址 经 过 左 移 操作 后 ， 
误 ， 故 需要 将 idt 地 址 转换 成 64 位 整 型 后 














其 精度 



































其 中 的 48 位 数据 当 作 操作 数 。 


























。 由 于 指针 
[ 接 转换 成 64 位 的 整 型 ， 所 以 采取 迁 回 的 作法 ， 先 将 其 转换 成 uint32_t， 
整 型 数据 进行 左 移 16 位 操作 。 这 样 idt 地 址 被 移 到 了 





只 能 


转换 成 相同 





' 组 合 到 一 起 后 ， 存 储 到 变量 idt operand 中 。 
于 lidt 的 操作 数 是 从 内 存 地 址 处 获得 的 ， 所 以 lidt 


E 式 将 变量 idt_ operand 通过 内 存 约 束 m 的 形式 传 给 lidt 作为 操作 数 ， 该 





操作 数 对 应 的 内 存 约束 用 序号 占 位 符 %0 表示 ， 所 以 lidt %0 便 将 idt 载 入 了 IDTR 寄存 器 


数 ， 


原 











备 都 是 接 在 8259A 





















































这 里 小 扩展 一 下 : 不 知道 大 伙 儿 是 否 还 记得 ， 内 存 约束 是 传递 的 C 变量 的 指针 给 汇编 指 
也 就 是 说 ， 在 “lidt %0” 中 ，%0 其 实 是 idt_operand 的 地 址 &idt_operand， 并 不 是 idt_operand 的 值 。 
因 是 AT&T 语法 的 汇编 语言 把 内 存 寻 址 放 在 最 高 级 , 任何 数字 都 被 看 成 是 内 存 地 址 (所 以 立即 数 需要 加 

前 级 $ 表 示 )， 所 以 lidt %0 直接 便 去 %0 指向 的 内 存 地 址 处 获取 48 位 的 操作 数 。 而 在 Intel 汇编 语法 中 ， 立 
te 也 就 是 说 数字 就 是 数字 ， 不 代表 地 址 ， 内 存 寻 址 并 不 是 最 高 级 ， 所 以 内 存 寻 
用 中 括号 [] 的 方式 ， 如 lidt [idt_ptr]。 













































































好 啦 ， 数 据 都 备 齐 了 ， 一 切 就 结 ， 就 差 按 下 局 动 按钮 啦 。 




















令 当 作 操 作 






































址 需要 用 显 式 





一 直 以 来 ,我 们 都 是 自 底 向 上 为 开启 中 断 而 准备 数据 的 ， 做 的 工作 就 像 是 上 沫 之 前 的 配 菜 ， 我 们 之 前 
它 就 是 触发 










































































辛 辛 苗 昔 所 做 的 工作 得 有 人 触发 才 行 。 回 顾 图 7-22 启用 中 断 流程 ， 我 们 只 差 init_all 没 做 啦 ， 
我 们 之 前 所 有 工作 的 按钮 。 


init_all 顾名思义 ， 用 来 做 所 有 初始 化 相关 的 工作 ， 而 中 断 初始 化 只 是 其 中 之 一 。 鉴 于 这 个 原因 ， 为 将 来 扩 
展 方便 ， 我 们 单独 写 个 文件 用 来 调用 所 有 模块 的 初始 化 主 函数 ， 就 像 调用 idt_init 一 样 。 
这 个 比较 简单 ， 我 们 在 kernel 目录 下 再 写 个 initc 文件 ， 把 init_all 定义 在 其 中 就 行 啦 ， 大 伙 儿 见 代码 7-7。 























































































































代码 7-7 (project/c7/a/ kernel/init.c ) 
#include "init.h" 
#include "print.h" 
#include "interrupt.h" 


/* 负 责 初 始 化 所 有 模块 */ 

void init all() { 
Put Str (VinituallLNn Ly) 
idt init(); // 初 始 化 中 断 








MD oo ~OwW 必 wmN 情 











不 是 很 简单 ? 直接 在 init all 中 调用 idt_ init 就 行 啦 。 
































| 是 由 main.c 中 的 主 函 数 main 调用 的 ， 我 们 接 下 来 修改 main.c， 见 代码 7-8。 














代码 7-8 (projectc7/a/ kernel/main.c ) 
1 #include "print.h" 
2 #include "init.h" 
3 void main(void) { 























4 put str("I am kernel\n"); 

3 init all(); 

6 asm volatile ("sti"); ”// 为 演示 中 断 处 理 , 在 此 临时 开 中 断 
7 while(1); 

8 } 

















为 了 在 main 中 调用 init_all，main.c 文件 开头 处 便 包含 了 inith， 里 面 就 一 句 函数 的 声明 ; wu 












































真正 到 了 开启 中 断 的 时 多 


到 








了 ， 为 了 让 中 断 程序 运行 ， 我 们 得 打开 中 断 才 行 ， 打 开 中 断 是 











] sti 指令 ， 



































它 将 标志 寄存 器 eflags 中 的 正 位置 1， 这 样 来 自 中 断代 理 8259A 的 中 断 信 号 便 被 处 理 




















器 受理 
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拉 。 外 部 设 




















T 















































断 都 屏蔽 了 ， 这 样 开 启 中 断后 ， 处 理 器 只 会 收 到 源源 不 断 地 时 钟 中 断 。 


下 。 














好 ， 到 这 该 说 的 都 说 啦 ， 就 差 编 译 运 行 了 。 





的 引 脚 上 ， 由 于 我 们 在 8259A 中 已 经 通过 IMR 寄存 器 将 除 时 钟 之 外 的 所 有 外 部 设备 中 





































































































NS 











出 译 、 链 接 、 写 入 磁盘 的 步骤 如 下 。 


gcc -I lib/kernel/ -I lib/ -I kernel/ -c -fno-builtin \ 
-Oo build/main.o kernel/main.c 回 车 
































nasm -f elf -o build/print.o lib/kernel/print.S 回 车 

















nasm -f elf -o build/kernel.o kernel/kernel.S 问 车 








gcc -I lib/kernel/ -I lib/ -I kernel/ -c -fno-builtin\ 


为 了 目录 不 至 于 太 乱 ， 我 建立 了 build 目录 ， 用 于 将 所 有 目标 文件 和 编译 后 的 内 核 文件 都 放 在 此 目录 
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-oO build/interrupt.o kernel/interrupt.c 加 后 





gcc -I lib/kernel/ -I lib/ -I kernel/ -c -fno-builtin \ 

-oO build/init.o kernel/init.c 回 车 
ld -Ttext 0xc0001500 -e main -o build/kernel.bin build/main.o build/init.o\ 
build/interrupt.o build/print.o build/kernel.o 回 车 





























dd if=build/kernel.bin of=/home/work/my workspace/bochs/hd60M.img\ 
bs=512 count=200 seek=9 conv=notrunc 

记录 了 12+1 的 读 入 

记录 了 12+1 的 写 出 
6172 字 节 ( 6.2 kB ) 已 复制 ，8.994e-05 秒 , 68.6 MB/s 


进入 bochs 运行 ， 结 果 如 图 7-26 所 示 。 
昌 Bochs x86 emulator, http://bochs.sourceforge.net 人 


ResetsuspEnpPORer 















































_desc_init done 
nit done 


interrupt 
interrupt 

interrupt + 
interrupt occur? 
interrupt occur! 
interrupt occur! 
interrupt occur?! 
interrupt occur?! 
interrupt 


interrupt 

interrupt occur! 
interrupt occur! 
interrupt occur?! 
interrupt occur?! 








CTRL + 3rd button enables nouse NUM [caps | [ | | | | 


和 图 7-26 中断 运行 


看 ， 每 执行 一 个 中 断 处 理 程序 将 会 打印 字符 串 “interrupt occur!” 一 次 并 换行 ， 这 里 出 现 了 多 次 
我 们 成 功 了 。 
有 没有 同学 想 看 下 安装 后 的 中 断 描 述 符 是 什么 样子 ? 这 个 简单 ， 只 要 我 们 在 bochs 中 输入 info idt 就 
可 以 看 到 啦 ， 下 面 给 大 伙 儿 截 了 张 图 ， 如 图 7-27 所 示 。 
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所 新 ， 
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中 断 处 理 程序 地 址 
<bochs:10> info idt 


Interrupt Descriptor Table (base=0xcg9002ccg9, |limit=263): 
IDT[Ox00]=32-Bit Interrupt ETT EU TT ET TEEN) 
it Interrupt arget=0x0008:0xc0001899| 
Interrupt arget=0x0008:0xc00018b2 
Interrupt arget=0x0008:0xc90018cb 
Interrupt arget=0x0008:0xc00018e4 
Interrupt arget=0x0008 : 
Interrupt arget=0x0008 : 
Interrupt arget=0x0008 : 
Interrupt arget=0x0008 : 
Interrupt arget=0x0008 : 
Interrupt arget=0x0008 : 
Interrupt arget=0x0008:0xc0001991 
Interrupt arget=0x0008:0xc00019a9| 
Interrupt arget=0x0008:0xc00019c2 
Interrupt arget=Qx0008: 
Interrupt arget=0x0008 : 
Interrupt arget=0x0008 : 
Interrupt arget=0x0008 : 
Interrupt arget=0x0008 : 
Interrupt arget=0x0008 : 
Interrupt arget=0x0008 : 
Interrupt arget=0x09008 : 
Interrupt arget=0x0008:0xc0001aa0| 
Interrupt arget=0x0008:0xc0001ab9| 
Interrupt arget=0x0008 : 
Interrupt arget=0x0008 : 
Interrupt arget=0x0008 : 
Interrupt arget=0x0008 : 
Interrupt arget=0x0008 : 
Interrupt arget=0x0008 : 
Interrupt arget=0x0008:0xc0001b64 
Interrupt arget=0x0008:0xco001b7c, 
IDT[Ox20]=32-Bit Interrupt arget=0x0008:0xc0001b95 


4 图 7-27 中断 描述 符 IDT 中 信息 
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7.6 编写 





中 断 处 理 程 序 











图 7-27 中 第 一 列 是 中 断 门 描述 符 的 序号 ， 这 里 共 0x20 个 。 在 白色 框 之 内 的 target 是 门 









































述 符 中 所 指 
































向 的 中 断 处 理 程序 地 址 ， 用 选择 子 ; 偏 移 量 的 形式 给 出 ， 所 有 中 断 处 理 程 序 所 在 段 的 选择 子 都 是 0x0008， 








思 | 














段 内 偏 移 地 址 各 不 相同 ， 也 就 是 中 断 门 描述 符 中 记录 的 目标 程序 的 选择 子 及 选择 子 所 在 段 的 
如 果 是 想 查 看 某 个 中 断 门 描述 符 ， 可 以 用 “info idt 序号 ”的 形式 来 查看 ， 图 7-28 所 示 前 












































号 0x20 对 应 的 中 断 门 描述 符 。 





<bochs:11> info idt 0x20 

















局 移 量 。 




















Interrupt Descriptor Table (base=0xc9002cc@9，Limit=263) : 


IDT[Ox20]=32-Bit Interrupt Gate target=0x0008:0xc9001b95，DPL=0 























好 啦 ， 本 节 就 这 样 ， 下 一 节 我 们 让 中 断 处 理 程序 变 得 帅 一 点 ， 另 外 ， 本 来 想 给 大 伙 儿 演示 进入 中 断 时 
处 理 器 实际 压 栈 情况 ， 思 考 了 一 下 ， 不 如 在 下 一 节 一 起 演示 比较 合适 ， 在 下 节 中 ， 我 们 实际 查看 一 下 处 理 


























器 进出 中 断 时 栈 中 的 情况 。 
7.6.2 改进 中 断 处 理 程序 
在 上 一 节 中 ， 我 们 只 是 为 了 向 大 家 演示 中 断 机 制 的 原理 ， 所 以 中 断 





























































































































4 图 7-28 中断 向 量 0x20 对 应 的 中 断 门 描述 符 








it 是 中 断 向 量 












































处 理 程 序 很 简陋 ， 确 切 地 说 ， 我 们 
只 是 在 中 断 处 理 程序 的 入 口中 “处 理 ” 了 一 下 就 返回 啦 ， 一 切 都 只 是 在 汇编 中 完成 的 。 


按理 说 最 终 干 活 的 中 断 处 理 函 数 相对 功能 复杂 ， 光 靠 汇编 语言 来 号 太 不 人 道 了 ， 而 且 我 们 也 不 想 把 kemel.S 
































写 得 太 见 长 ， 这 样 维护 起 来 也 不 方便 。 所 以 最 好 的 选择 是 用 C 语言 编写 中 断 处 理 






















































































好 啦 ， 方 案 就 这 样 定 啦 : 在 汇编 版 本 的 intrXXentry 中 调用 C 语言 版 本 的 中 断 处 理 函 数 。 


























的 intrXXentry 就 如 其 名 一 样 ， 真 正 变 成 了 中 断 的 entry， 即 入 口 。 



































接 下 来 的 工作 要 自己 协调 好 才 行 : 在 C 语言 中 建立 个 目标 中 断 处 理 
版 本 的 中 断 处 理 函 数 地 址 ， 供 汇编 语言 中 的 intrXXentry 调用 。 
intrXXentry 是 如 何 找到 对 应 的 C 版 本 中 断 处 理 函 数 呢 ? 



















































































程序 ， 在 汇编 中 调用 它 。 











这 样 汇编 中 














函数 数组 idt table， 数 组 元 素 是 C 




















由 于 每 个 中 断 的 中 断 向 量 号 不 同 ， 所 以 它 就 成 了 中 断 入 口 程序 intrXXentry 调用 C 版 本 中 断 处 理 函数 




















的 依据 , idt_table 中 数组 元 素 是 32 位 地 址 , 故 要 占用 4 字 节 , 这 样 ， 























值 ， 便 是 对 应 的 C 语言 版 本 的 中 断 处 理 函 数 地 址 。 

这 样 一 来 ，intr_entry table 数组 元 素 ， 也 就 是 每 个 中 断 入 口 
intrXXentry, 都 相当 于 用 自己 的 中 断 向 量 号 作为 idt_ table 中 的 索引 ， 
于 是 intr_entry_table 数组 中 的 每 个 元 素 均 与 idt_table 中 的 每 个 元 素 
对 等 ， 相 当 于 intr_entry_table[ 计 调用 idt_table[i]。 

这 么 说 吧 ， 汇 编 版 本 的 中 断 入 口 程序 intrXXentry 相当 于 路 由 器 ， 
中 断 到 达 时 , 它 根据 自己 所 属 的 中 断 向 量 号 把 中 断路 由 到 对 应 的 C 版 
本 中 断 处 理 程序 。 关 系 如 图 7-29 所 示 。 

这 涉及 到 修改 两 个 文件 ，interrupt.c 和 kemel.S， 我 们 现在 先 看 一 下 
interrupt.c 的 内 容 ， 见 代码 7-9。 














































































































在 中 断 入 口 程序 中 ， 将 中 断 向 量 号 乘 以 4， 再 加 上 idt table 地 址 的 汇编 intr_entry_table 





























中 断 入 口 数 组 : 目标 中 断 处 理 程序 数组 : 
C 语 言 idt_table 
intr00enty: “| ”| 中 世 外 理 程 序 
idt_tableto*4 中 断 处 理 程序 
了 1 
intrOlentry: 中 断 处 理 程序 
idt_table+1*4 a 学 
中 医 处 理 程序 
intr02entry : 
idt_table+2°4 Pe 
中 断 处 理 程序 
--7| Xx 








intrXXentry: 
idt_table+xx*4 


, 





4 图 7-29 intr_table 与 











代码 7-9 (project/c7/b/ kernel/interrupt.c ) 


… 略 

27 char* intr name [IDT DESC CNT]; // 用 于 保存 异常 的 名 六 
28 intr handler idt table[IDT DESC CNT]; 
// 定 义 中 断 处 理 程 序数 组 ， 在 kernel .Ss 中 定义 的 intrXxentry 

// 只 是 中 断 处 理 程序 的 入 口 ， 最 终 调 用 的 是 ide_table 中 的 处 理 程序 
29 extern intr handler intr entry table[IDT DESC CNT]; 


// 声 明 引用 定义 在 kernel.s 中 的 中 断 处 理 函数 入 口 数组 

















































































































.… 略 
71 /* 通用 的 中 断 处 理 函 数 ， 一 般 用 在 异常 出 现时 的 处 理 */ 
72 static void general intr handqler (uint8 t vec nr) { 




































































idt_table 
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了 3 if (vec nr == 0x27 | | vec nr == 0x2f) { 
//IRQ7 和 IRQ15 会 产生 伪 中 断 ( spurious interrupt )， 无 需 处 理 
//0x2f 是 从 片 8259A 上 的 最 后 一 个 IRQ 引 脚 ， 保 留 项 

74 return; 

了 5 } 

76 put st ("int veetor : ‘0x"™); 

A Put_int (vec nr); 

78 put_ char ('\n'); 

了 9 二 

80 








81 /* 完成 一 般 中 断 处 理 函 数 注 册 及 异常 名 称 注 册 */ 
82 static void exception _ init (voidq) { 

83 int i; 
84 for (i = 0; i < IDT DESC CNT; i++) { 

85 /* idt_table 数组 中 的 函数 是 在 进入 中 断后 根据 中 断 向 量 号 调用 的 






















































































































































































86 * 见 kernel/kernel.S 的 call [idt table + $1*4] */ 

87 idt table[i] = general intr handler; 

// 默认 为 general intr handler 

88 // 以 后 会 由 register_handler 来 注册 具体 处 理 函 数 
89 intr name[i] = "unknown"; // 先 统一 赋值 为 unknown 
90 } 

91 intr name[0] = "#DE Divide Error"; 

92 intr name[1] = "#DB Debug Exception"; 

93 intr name[2] = "NMI Interrupt"; 

94 intr name[3] = "#BP Breakpoint Exception"; 

95 intr name[4] = "#0F Overflow Exception"; 

96 intr name[5] = "#BR BOUND Range Exceeded Exception"; 
97 intr name[6] = "#UD Invalid Opcode Exception"; 

98 intr name[7] = "#NM Device Not Available Exception"; 
99 intr name[8] = "#DF Double Fault Exception"; 

4 intr name[9] = "Coprocessor Segment Overrun"; 

01 intr name[10] = "#TS Invalid TSS Exception"; 

102 intr name[11] = "#NP Segment Not Present"; 

利信 学 intr name [12] = "#SS Stack Fault Exception"; 

104 intr name[13] = "#GP General Protection Exception"; 
05 intr name[14] = "#PF Page-Fault Exception"; 

106 // intr name[15] 第 15 项 是 intel 保留 项 , 未 使 

107 intr name[16] = "#MF x87 FPU Floating-Point Error"; 
108 intr name[17] = "#AC Alignment Check Exception"; 

109 intr name[18] = "#MC Machine-Check Exception"; 

110 intr name[19] = "#XF SIMD Floating-Point Exception"; 
二 
112 
113 /* 完 成 有 关中 断 的 所 有 初始 化 工作 */ 
114 void idt init() 
































TS Dut ste(Tidb lini :start\nT)y 

116 idt desc init(); // 初始 化 中 断 描述 符 

117 exception init () ; /7 异常 名 初始 化 并 注册 通常 的 中 断 处 理 函 数 
pic init (); // 初始 化 8259A 
































代码 7-9 中 文件 开头 定义 了 中 断 异 常 名 数组 intr_ name， 它 的 数组 长 度 是 IDT_DESC_CNT， 用 来 记录 每 
项 异常 的 名 字 ， 这 是 将 来 在 调试 时 用 的 ， 主 要 是 方便 咱们 自己 ,后面 还 会 有 相关 叙述 。 
另外 还 定义 了 中 断 处 理 函 数 数组 idt_table， 元 素 个 数 为 IDT_DESC_CNT， 这 与 咱们 要 处 理 的 中 断 数量 对 
应 。 此 数组 中 的 元 素 即 目标 中 断 处 理 函数 地 址 先 由 函数 exception_init 初始 化 〈 之 所 以 是 “ 先 ” 这 是 因为 以 后 
会 在 初始 化 后 ， 再 由 专门 的 注册 函数 来 修改 )， 其 中 的 数组 元 素 将 由 intrXXentry 来 调用 ， 如 图 7-29 所 示 。 
exception_init 在 第 117 行 被 调用 ， 在 第 82 行 定 义 ， 我 们 先 看 exception_init 的 实现 。 
初始 化 是 由 第 84 一 90 行 的 for 循环 完成 的 ， 此 循环 遍历 IDT_DESC_CNT 个 中 断 ， 将 中 断 处 理 函数 数 
组 idt_table 中 的 所 有 元 素 初始 化 ， 先 都 指向 general_intr_handler 函数 。 这 个 函数 定义 在 第 72 行 ， 用 来 做 
未 处 理 的 中 断 或 通用 的 中 断 处 理 程 序 ， 意 指 默认 的 ， 将 来 咱们 设置 新 的 硬件 时 再 通过 注册 函数 更 新 它 ， 这 
是 后 话 。 一 会 儿 再 说 general intr handler， 回 来 继续 看 exception_init。 
在 第 89 行 ,我 们 初始 化 了 intr_name 数组 中 的 每 个 元 素 ， 此 数组 用 来 记录 异常 的 名 字 ， 因 为 在 编写 操 
作 系 统 的 过 程 中 ， 由 于 粗心 或 能 力 不 足 等 原因 ， 经 常会 导致 处 理 器 抛 异 常 ， 咱 们 在 这 里 将 相应 的 异常 名 定 
义 好 ， 将 来 在 异常 出 现时 ， 可 以 根据 中 断 向 量 号 在 intr_name 数组 中 检索 到 相应 的 异常 名 ， 这 样 就 能 帮助 
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7.6 编写 中 断 处 理 











3 们 排查 


























































































































































































































着 误 了 。 你 懂 的 ， 在 无 操作 系统 支持 下 写 程序 ， 排 错 有 时 候 并 不 是 那么 
用 来 记录 IDT DESC _CNT (33) 个 的 名 称 ， 
保证 


日 异常 只 有 20 个 ， 所 以 先 一 律 赋值 
E intr_name[20 一 32] 不 指 空 了 。 接 下 来 在 循环 体外 单独 为 0 一 19 这 
如 您 看 到 的 ， 这 就 是 第 91 一 110 行 所 做 的 事 。 











质 利 。 由 于 intr name 是 











为 “unknown”， 这 样 就 


























20 个 异常 赋予 正确 的 异 党 名 称 。 正 





































































































































































































现在 看 看 general_intr handler 函数 ， 此 函数 是 通用 的 中 断 处 理 函 数 ， 也 就 是 相关 中 断 若 没有 定义 具体 
的 中 断 处 理 函 数 时 将 调用 general_intr_handler。general_intr_handler 只 接受 一 个 参数 : 就 是 中 断 疝 量 号 。 

在 第 73~75 行 ， 是 为 了 单独 处 理 伪 中 断 (spurious interrupt)。 伪 中 断 顾 名 思 义 ， 并 不 是 真正 的 中 断 ， 属 于 某 
种 不 希望 发 生 的 硬件 中 断 。 产生 伪 中 断 的 原因 很 多 , 如 中 断 线路 上 电气 信号 异常 , 或 是 中 断 请 求 设备 本 身 有 问题 

在 咱们 的 实际 情况 中 ， 它 经 常 由 IRQ7 和 IRQ15 产生 , IRQ7 是 并 口 1，IRQ15 是 保留 的 。 由 于 它们 无 
法 通过 IMR 寄存 器 屏蔽 ， 所 以 在 这 里 单独 处 理 它们 。 这 里 的 处 理 规 则 是 直接 通过 return 返回 ， 无 视 它 。 

第 76 一 78 行 是 打印 中 断 向 量 号 ， 正 常情 况 下 将 会 打印 “int vector: 向 量 号 换行 >。 当 然 这 也 只 是 临时 
的 ， 完 全 是 为 了 演示 中 断 处 理 程序 正常 运行 。 一 会 儿 我 们 将 看 到 ， 时 钟 中 断 将 会 触发 0x20 的 中 断 向 量 ， 
我 们 通过 此 函数 去 验证 。 

interrupt.c 修改 就 到 这 了 ， 接 下 来 再 看 kernel.S 有 哪些 改进 的 地 方 ， 见 代码 7-10。 


与 BR idt table 
section .data 
global intr entry ta 
intr entry table: 


smacro VECTOR 2 
section .text 
intrsSlentry: 


whPeoo-ao 吕 


14 
5 $2 

16 ; 以 下 是 保存 上 下 文 环境 
17 

8 





push ds 
| push es 
19 push fs 
20 push gs 
2. pushad 














代码 7-10 


ble 











;idt_table 是 Cc 中 注册 的 中 断 处 理 


了 




















( project/c7/b/kernel/kernel.S ) 


程序 








压 











入 中 断 
































三 知道 E 












































中 断 若 有 错误 码 会 压 在 








eip 后 





所 以 一 个 中 断 类 型 一 个 中 断 处 理 程序 
己 的 中 断 向 量 号 是 多 少 











PUSHRAD 指 














令 压 入 32 位 寄存 器 ， 


; EAX, ECX, EDX, EBX,ESP,EBP,ESI,EDI,EAX 最 先入 栈 




















22 
23 ; 如果 是 从 片上 进入 的 中 断 
;除了 往 从 片上 发 送 EOI 外 ， 还 要 往 主 片上 发 送 EOI 
24 mov al, Ox20 和 中 断 结 束 命 令 EO 
25 out Oxa0,al ; 向 从 片 发 送 
26 out 0x20,al ; 向 主 片 发 送 
27 
28 push %1 :不管 iat table 中 的 目标 程序 是 否 需 
;都 一 律 压 入 中 断 向 量 号 ， 调 试 时 很 方便 
29 call [idt table + $1l*4] ; 调用 idt table 中 的 Cc 版 本 中 断 处 理 
30 jmp intr exit 
cae 
32 section .data 
33 dd intr%slentry ; 存储 各 个 中 断 入 口 程序 的 地 址 


34 Sendmacro 

35 

36 section .text 

37 global intr exit 
38 intr Exits 


39 ; 以 下 是 恢复 上 下 文 环境 


40 add esp, 4 
41 popad 
42 pop gs 
43 pop fs 


























入 栈 顺 序 是 





































































































; 形成 intr_entry table 数组 


; 跳 过 中 断 号 
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第 7 章 ”中断 
44 pop es 
45 pop ds 
46 add esp, 4 
47 iretd 
48 


49 VECTOR 0x00,ZERO 
.各 


81 VECTOR 0x20,2ZERO 














我 们 为 了 在 汇编 文件 kernel.S 中 调用 

















7 跳 过 error code 


码 7-10 中 开头 第 $ 行 ， 用 extern idt table 声明 。 
本 节 的 kernel.S 较 上 一 版 本 变化 较 大 的 是 多 了 第 17 一 21 行 保护 进程 上 下 文 的 代码 。 因 为 在 此 汇编 文 

















件 中 要 调用 
个 段 寄 存 器 ds、es、fs、gs 和 8 个 32 位 通 ) 
存 器 。 所 以 在 程序 中 先 把 ds、 
器 压 栈 有 点 特殊 ， 入 栈 后 要 占用 
节 )。 然 







































































es、fs 和 gs 这 4 个 16 位 段 寄存 器 














interrupt.c 中 定义 的 idt_table， 需 要 声明 idt_table， 所 以 在 代 












































序 是 EAX->ECX->EDX->EBX->ESP->EBP->ESI-> EDI， 最 先入 栈 的 是 EAX。 
为 了 更 形象 一 点 ， 我 们 看 下 此 时 栈 中 数据 分 布 的 情况 ， 如 图 7-30 所 示 。 








在 第 28 行 ， 又 把 %1， 即 中 断 向 量 号 
数组 中 某 元 素 所 指向 的 中 断 处 理 程序 的 参 


压 入 栈 












































中 作为 idt_ table 


数 。 我 们 知道 idt_table 























数组 中 记录 的 是 C 语言 下 编写 的 中 断 处 理 程序 ， 

















这 些 处 理 





程序 

















其 实 就 是 函数 ， 函 数 就 有 可 能 需要 参数 ， 但 









































到 














同 


























El 


数 体 中 还 要 中 断 向 量 干 吗 ? 如 果 您 这 样 想 ， 
确实 没有 实际 用 途 ， 但 在 出 现 异常 时 却 很 有 用 。 
的 通 
处 理 


一 口 



































在 interrupt.c 中 


作为 默认 的 中 断 


















































半 中 断 处 理 函数 general_intr handler 吗 ? 
函数 注册 到 了 idt_table 数组 中 ， 只 
有 新 的 中 断 处 理 函 数 履 盖 它 时 ， 它 才 会 有 效 ， 所 以 它 通 销 作 为 





大 伙 儿 知道 并 不 是 
所 有 的 函数 都 需要 参数 。 想 想 看 ， 一 个 中 断 对 应 一 个 中 断 向 量 ， 
里 一 个 中 断 向 量 对 应 一 个 中 断 处 理 函 数 ， 起 初 我 们 用 中 断 癌 
的 目的 是 找到 中 断 处 理 函 数 ， 已 经 进入 中 断 处 理 函 数 了 ， 那 
给 您 点 


























您 点 一 百 个 赞 。 
您 还 记得 我 们 
ee 


已 


有 当 没 















































没 人 理会 的 相关 中 断 的 处 理 



































程序 。 在 前 20 个 异常 中 , 除 pagefault 








可 以 利用 外 ， 其 他 异常 的 发 生 基本 属于 编程 出 和 
需要 排查 。 所 以 ， 在 我 们 的 系统 中 ， 对 于 大 多 


道 是 哪个 异常 引起 的 , 这 样 才 能 排查 问题 , 然而 



































数 


普 的 情况 ， 此 时 
























































C 程序 ,一定 会 使 当前 寄存 器 环境 破坏 ， 所 以 要 保存 当前 所 使 用 的 寄存 器 环境 。 我们 只 要 把 4 
寄存 器 保护 起 来 就 够 了 ， 这 已 经 包括 了 我 们 所 使 
压 栈 ， 虽 然 是 16 位 ， 但 在 32 
4 字 节 【而 位 于 其 他 寄存 器 和 内 存 中 的 值 若 为 16 位 ， 则 入 栈 后 只 
后 再 通过 pushad (push all double word register) 指令 压 入 8 个 通 | 




















的 全 部 寄 
位 下 段 寄 存 
占 2 字 














寄存 器 。 这 8 个 寄存 器 入 栈 顺 














无 特权 级 20a8s 
A - cs 此 部 分 是 处 理 器 
变化 时 i 自动 讨 和 的 
error_code 或 
0 
ds <— push ds 
es <— push es 
栈 < pushfs 
gs <— push gs 
地 EAX 
址 ECX 
扩 EDX 
展 EDX pushad 
ESP 
EBP 
ESI 
En < SS:eSsp 
4 图 7-30 ”执行 到 pushad 后 的 栈 中 情况 


























异常 我 们 也 不 做 处 理 ， 当 处 至 
这 必然 要 用 到 中 断 向 量 号 ， 然 后 ) 
























































该 向 














数组 的 索引 ， 这 样 就 能 找到 相应 异常 的 名 字 ， 知 
还 是 属于 后 话 ， 目 前 我 们 先 把 向 量 号 
` 影 响 编译 和 运行 ， 毕 苋 参数 入 栈 是 由 我 们 控 各 










































































| 的 ， 














在 第 29 行 , 通过 “call [idt_table + %1*4]” 便 i 
























































exception_init 函数 中 注册 过 


调 






































器 抛 出 异常 时 ， 我 们 需要 知 
量 号 作为 intr name 
道 发 生 了 哪 种 异常 ， 从 而 方便 我 们 调试 。 当 然 ， 调 试 这 块 
作为 参数 传 进来 再 说 ， 程 序 是 否 需 要 参数 ， 用 不 ) 
只 要 我 们 记得 将 向 量 号 出 栈 就 好 啦 。 


j 参 数 都 没关系 ， 这 

















用 了 对 应 的 C 语言 编写 的 中 断 处 理 程序 。 
+ %1*4]” 是 32 位 下 的 基 址 变 址 寻 址 ， 由 于 idt_table 中 的 每 个 元 素 都 是 32 位 地 址 ， 故 

















其 中 “[idt_table 





占用 4 字 节 大 小 ， 

















所 以 将 向 量 号 乘 以 4， 再 加 上 idt_table 数组 的 起 始 地 址 ， 便 得 到 了 下 标 为 中 断 向 量 号 %1 的 数组 元 素 地 址 ， 
再 对 该 地 址 通过 中 括号 [] 取 值 ， 便 得 到 了 该 数组 元 素 中 所 指向 C 语言 编写 的 中 断 处 理 程序 ， 


也 就 是 之 前 在 


























盘 、 硬 盘 )， 所 以 该 中 断 对 应 的 中 断 处理 程 序 将 
切中 












































j general_intr handler 处 理 


= 
总 -EE 























由 于 是 用 call 指令 调用 的 中 断 处 理 程序 ， 所 以 在 相应 的 中 断 处 理 程序 执行 完成 后 , 程序 流程 会 回 



































30 行 的 jmp intr_exit， 这 就 是 说 ， 中 晰 
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的 general intr_ handler。 将 来 某 些 外 设 需要 重 写 中 断 处 理 程序 〈 比 如 时 钟 、 键 
\ 会 是 general_intr_ handler， 这 是 后 话 ， 怕 大 家 误解 以 后 也 
断 才 多 说 了 两 句 。 























到 第 











处 理 程序 执行 完成 了 ， 现 在 该 恢复 程序 的 上 下 文 了 ， 这 里 所 说 的 上 





7.6 编写 中 断 处 理 程 














前 进入 中 断 入 








下 文 就 是 之 


intr_exit 定义 在 第 38 行 ， 其 实现 是 先 








口 程序 intrXXentry 时 保护 的 那 几 个 寄存 器 。 
用 add esp， 4 跳 过 在 第 28 行 压 入 的 ! 






































断 处 理 程序 的 参数 ， 中 














断 向 量 号 。 接 下 来 
之 前 用 pushad 一 次 性 压 入 8 个 





(pop all double word register), 
写 操作 ， 完 全 可 以 用 mov 操作 完成 ， 但 我 们 还 
的 作用 ， 但 这 样 很 


























再 以 寄存 器 入 栈 的 相反 





页 序 依次 弹出 栈 恢复 到 寄存 器 。 

通用 寄存 器 , 与 之 对 应 的 将 8 个 通用 寄存 器 一 次 性 出 栈 指 令 是 popad 
这 里 我 要 说 点 popad 的 注意 事项 。 我 们 知道 栈 也 是 内 存 ， 对 于 它 的 读 、 
得 自己 维护 栈 中 最 新 可 用 位 置 的 指针 ， 此 指针 相当 于 esp 






































| 




















杯 烦 。 











执行 时 自动 维 

















是 使 esp 








寄存 器 。 
好 











en 
以 popad 在 执行 弹 栈 时 ， 栈 中 esp 的 值 会 被 忽略 ， 栈 中 








8 个 操作 数 














所 以 需要 将 























图 7-32 是 运行 ! 









































E 护 栈 顶 指针 esp。pop 操作 都 会 让 esp 的 值 自 ; 














护 栈 顶 指 针 ， 处 理 器 提供 了 push 和 pop 指令 ， 这 两 个 指令 在 
成 一 个 操作 数 大 小 ，popad 也 是 一 样 ， 无 非 就 
若 栈 中 旧 esp 的 值 弹 到 esp 寄存 器 就 错 了 ， 所 
他 7 个 32 位 通用 寄存 器 的 值 会 被 弹 进 相应 的 








为 了 不 


已 








自 












































减 8*4=32 字 节 ， 





大 小 ，esp 会 E 


















































F 啦 popad 的 注意 事项 说 完了 ， 于 是 在 intr_exit 中 先 用 popad 指令 将 8 个 32 位 寄存 器 出 栈 ， 除 esp 

外 ， 其 余 7 个 都 恢复 到 各 自 寄存 器 中 ， 栈 中 esp 的 人 

次 出 栈 恢复 到 gs、fs、es、ds 寄存 器 中 。 

第 46 行 ， 此 时 栈 指针 指向 栈 ! 

跳 过 ， 这 样 后 

正确 的 值 到 各 寄存 器 。 跳 过 的 方法 
好 啦 ， 该 修改 的 都 改 完了 ， 现 在 上 机 测试 结果 ， 编 译 运行 还 是 之 








弹出 后 被 忽略 。 然 后 再 将 栈 中 gs、 全 、 


es、ds 的 值 依 
























































名 


sn 
》 





error_code 的 位 当然 若 中 断 无 错误 码 ， 此 处 是 0， 如 图 7-31 所 示 ， 
面 的 iretd 指令 执行 时 ， 栈 顶 指 针 esp 才能 指向 栈 中 eip，iretd 才能 在 栈 中 弹出 
同 跳 过 参数 中 断 号 一 样 ， 就 是 通过 add 指令 把 esp 加 4。 

前 那 一 套 ， 结 果 如 图 7-32 所 示 。 































































































1 












































无 特权 级 变化 时 

向 eflags 

低 cs 

扩 error_code 或 。 

展 0 _ 3993.Gobp 

4 图 7-31 准备 跳 过 错误 码 4 图 7-32 ”改进 后 的 中 断 处 理 程序 





































































































的 结果 ， 这 里 




















是 不 断 打 印 “int vector: 0x20”。 由 于 我 们 只 打开 了 时 钟 中 断 ， 并 且 时 




















































































































































































































钟 的 中 断 向 量 号 是 0x20， 效 果 还 是 符合 预期 的 ， 我 们 成 功 啦 。 
7.6.3 调试 实战 : 处 理 器 进入 中 断 时 压 栈 出 栈 完 整 过 程 

本 节 是 为 了 满足 部 分 读者 的 求知 欲 和 部 分 读者 的 好 奇 心 ,目的 是 帮助 大 家 揭 开 “中 断 发 生前 处 理 器 自 
动 压 栈 、 中 断 处 理 程 序 在 栈 中 保护 进程 上 下 文 ， 以 及 从 中 断 返 回 时 iret 指令 弹 栈 ” 这 三 个 阶段 所 使 用 的 栈 ， 
其 中 的 数据 是 怎样 变化 的 。 此 部 分 属于 老 知 识 的 实践 ， 不 属于 新 知识 ， 所 以 如 果 您 对 此 不 感 兴趣 ， 可 以 略 
过 ， 不 过 您 要 是 看 了 这 一 节 ， 一 定 会 了 解 到 我 的 恨 昔 用 心 。 

我 们 的 中 断 处 理 程序 虽然 成 功 了 ， 对 于 中 断 发 生 时 的 处 理 器 是 如 何 自动 压 入 eflags、cs、ip 等 寄存 器 ， 
以 及 从 中 断 返 回 时 iret 指令 是 如 何 将 数据 出 栈 的 ， 这 部 分 属于 黑 盒 子 ， 我 想 您 还 是 感 兴趣 的 。 要 不 咱们 趁 
热 打 铁 ， 看 看 处 理 器 进入 中 断 时 栈 中 的 变化 ， 顺 便 把 bochs 调试 练习 一 下 。 
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本 节 的 目的 是 跟 踩 处 理 器 进入 中 断 前 、 中 断 处 理 过 程 中 以 及 退出 中 断 时 ， 栈 中 数据 是 怎样 的 变化 。 所 
以 ， 我 们 得 知道 处 理 器 大 概 何 时 进入 中 断 ， 这 样 才 能 找到 调试 的 切入 点 。 
在 bochs 中 ， 当 执行 了 show int 指令 时 ， 当 有 中 断 发 生 时 ， 控 制 台 会 打印 出 中 断 发 生 的 相信 信息 ， 信 息 包括 。 

。 发 生 中 断 时 执行 了 多 少 条 指令 ， 即 指令 数 时 间 戳 。 

。 中 断 类 型 ， 即 硬件 中 断 ， 还 是 软 中 断 ， 或 是 iret 指令 引起 的 中 断 。 

bochs 中 提供 了 利用 指令 数 做 断 点 的 指令 ， 就 是 sba 或 sb， 这 两 个 断 点 指令 是 有 区 别 的 。 

sb 的 参数 是 指令 数 的 增 量 ， 即 以 当前 指令 为 准 ， 再 执行 多 少 个 指令 后 停 下 来 。 

sba 的 参数 是 指令 数 的 绝对 量 ， 也 就 是 指令 数 的 总 量 ， 即 从 处 理 器 加 电 后 总 共 执 行 多 少 条 指令 后 停 下 来 。 

我 们 可 以 利用 指令 sba 来 做 断 点 ， 这 样 便 能 准确 地 在 发 生 中 断 前 停 下 来 ， 之 后 就 可 以 再 慢 慢 观 察 啦 。 
可 以 利用 show int 指令 来 找到 中 断 发 生 时 的 总 指令 数 ， 过 程 如 图 7-33 所 示 。 

<bochs:1> b 0x1500 

<bochs:2> < 

(0) Breakpoint 1，0xc0001500 in ?? OO 

Next at t=18056006 

(0) [0x000000001500] 0008:c0001500 (unk. ctxt): push ebp 


<bochs:3> show int 
show interrupts tracing (extint/softint/iret): ON 































































































































































































































































































show mask is: softint extint iret 

<bochs:4> s 70000 

00018056007: softint 0008:c0001501 (Oxc0001501) 
00018056007: iret 0008:c0001501 (Oxc0001501) 


Next at t=18126006 

(0) [0x00000000151b] 0008:c000151b (unk. ctxt): jmp .-2 (Oxc000151b) 
<bochs:5> 

Next at t=18196006 

(0) [0x00000000151b] 0008:c000151b (unk. ctxt): jmp .-2 (Oxc000151b) 
<bochs:6> 

00018240478: exception (not softint) 0008:c0001d29 (Oxc0001d29) 
00018242755: iret 0008:c000151b (Oxc000151b) 

Next at t=18266006 

(0) [0x00000000151b] 0008:c000151b (unk. ctxt): jmp .-2 (0xc000151b) 
<bochs:7> 








4 图 7-33 ”找到 硬件 中 断 发 生 的 指令 数 时 间 戳 


我 们 先 让 程序 在 物理 地 址 0x1500 处 停 下 来 ， 在 第 1 行 用 b 0x1500 便 打 上 了 断 点 ， 第 2 行 的 指令 c 便 
继续 执行 ， 直 到 运行 到 0x1500 处 停 下 来 。 
第 6 行 执行 show int 指令 ， 这 样 当 虚拟 机 中 有 中 断 发 生 时 ， 控 制 台 便 会 WA 
中 断 是 在 指令 执行 过 程 中 发 生 的 ， 所 以 为 了 减少 等 待 时 间 ， 咱 们 尽 可 能 多 执行 一 些 指令 ， 这 里 可 以 用 
单 步 执行 指令 s 来 实现 , 指令 s 可 以 后 接 执行 的 指令 数 , 这 样 便 一 下 子 执行 多 条 指令 。 由 于 我 性 子 比较 急 ， 
所 以 在 第 9 行 用 单 步 指令 s 一 下 子 执行 了 70000 条 指令 。 果然 show int 生效 了 , 它 在 第 10 行 打印 了 softint 
中 断 信 息 ， 不 过 这 是 软 中 断 ， 不 是 外 设 的 ， 咱 们 是 为 了 找到 时 间 中 断 ， 所 以 忽略 它 。 
在 第 14 行 和 第 17 行 继续 按 回 车 ， 这 将 默认 执行 上 一 次 的 指令 ， 即 s 70000， 终 于 在 第 18 行 迎 来 了 外 
部 中 断 exception, 图 中 已 经 用 下 画 线 标 出 来 了 。 我 们 要 用 的 数据 是 冒号 左边 的 指令 数 时 间 惟 00018240478， 
这 表示 处 理 器 总 共 执行 了 18240478 条 指令 后 外 设 中 断 发 生 了 。 

当然 ， 这 是 发 生 中 断 时 的 指令 数 ， 我 们 最 好 是 在 中 断 发 生前 就 停 下 来 ， 所 以 我 们 用 18240478-1 来 做 
sba 的 参数 ， 即 让 处 理 器 执行 了 18240477 条 指令 后 停 住 。 其 实 减 多 少 都 可 以 ， 未 必 减 1， 减 得 越 少 ， 离 中 
断 发 生 越 接近 ， 看 您 的 脾气 快慢 了 。 

接 下 来 我 们 看 看 整个 中 断 发 生 到 退出 的 完整 过 程 ， 如 图 7-34 所 示 。 

我 们 在 第 1 行 通过 sba 指令 设置 了 指令 数 断 点 ， 这 个 数 是 中 断 发 生 时 的 指令 数 减 1。 
第 3 行 用 c 指令 执行 到 断 点 。 
于 马上 要 发 生 中 断 啦 ， 处 理 器 会 马上 在 栈 中 压 入 eflags、cs 和 eip 寄存 器 ， 所 以 在 中 断 前 先 查 看 下 栈 ， 
这 样 在 后 面 就 容易 对 比 啦 。 在 第 7 行 执行 print-stack 查看 栈 ， 默 认 显示 16 个 数据 单位 。 第 9 一 24 行 是 栈 中 
数据 ， 大 人 注意， 在 bochs 中 显示 出 来 的 栈 ， 上 面 是 栈 顶 ， 下 面 是 旧 数 据 。 中 间 那 列 是 栈 中 内 存 的 地 址 ， 所 
以 地 址 最 上 面 最 低 ， 其 是 栈 顶 。 在 本 例 中 最 上 面 ， 也 就 是 第 9 行 ， 是 栈 顶 ， 所 以 也 就 是 esp 当前 值 。 

为 了 检查 中 断 发 生 后 压 入 的 数据 ， 在 第 25 行 用 指令 r 查看 寄存 器 。 大 家 注意 ， 第 35 行 中 显示 eflags 
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再 通过 
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步 中 断 就 发 生 啦 ， 在 第 36 行 执行 指令 



































1 <bochs:1> sba 18240477 
Time breakpoint inserted. Delta = 18240477 
<bochs:2> c 
(0) Caught time breakpoint 
Next at t=18240477 
(0) [0x00000000151b] 0008:c000151b (unk. ctxt): jmp 
<bochs:3> print-stack 
Stack address size 4 
STACK 0xc009ffeg [Oxc0001d44] 
STACK 0xc009ffe4 [0x00000000] 
STACK 0xc009ffe8 [0x00000000] 
STACK 0xc009ffec [0x00000000] 
STACK 0xc009fff0 [0x00000000] 
STACK 0xc009fff4 [0x00000000] 
STACK 0xc009fff8 [0x00000000] 
STACK 0xc009fffc [0x00000000] 
STACK 0xc00a0000 [0Oxfffffff 作 
STACK 0xc00a0004 [Oxfffffff 们 
STACK 0xc00a0008 [9xfffffff 介 
STACK 0xc090a000c [Oxfffffff 作 
STACK 0xc00a0010 [Oxfffffff 作 
STACK 0xc00a0014 [Oxfffffff 作 
STACK 0xc00a0018 [9xfffffff 介 
STACK 0xc00a001c [0Oxfffffff 作 
<bochs:4> r 
: 0x20a00006 547356672 
: 0x00000000 0 
: 0x0000c000 49152 
: 0x00070094 458900 
: 0xc009ffe0 -1073086496 
0xc009fffc -1073086468 
i: Ox00070000 458752 


fs 0x00000282: 
36 <bochs;:5> s 
37 Next at t=18240478 


38 (0) [0x000000001d29] 0008:c0001d29 〈unk. ctxt): push ds 





^ 图 7-34 中断 调试 a 























行 的 显示 结果 。 这 说 明 此 时 已 经 发 生 了 中 断 。 


我 们 在 第 3 





39 <bochs:6> print-stack 
40 Stack address size 4 
| STACK Oxc009ffd0 [0x00000000] 
STACK 0xc009ffd4 [Oxc000151b] 
STACK 0xc009ffd8 [0x00000008] 
STACK 0xc009ffdc [0x00000282] 
STACK 0xc009ffeg [Oxc0001d44] 
STACK 0xc009ffe4 [0x00000000] 
STACK 0xc009ffe8 [0x00000000] 
STACK 0xc009ffec [0x00000000] 
STACK Oxc009fff0 [0x00000000] 
STACK 0xc009fff4 [Ox00000000] 
STACK 0xc009fff8 [0x00000000] 
STACK 0xc009fffc [0x00000000] 
STACK 0xc00a0000 [0Oxfffffff 介 
STACK 0xc00a0004 [Oxffffffff] 
STACK 0xc00a0008 [OQxffffffff] 
STACK 0xc00a000c [0Oxfffffff 保 
<bochs:7> s 
Next at t=18240479 
59 (0) [Ox000000001d2a] 0008:c0001d2a (unk. 
60 <bochs:8> 
61 Next at t=18240480 
62 (0) [0x000000001dzb] 0008: c0001d2b (〈unk. 
63 <bochs:9> 
64 Next at t=18240481 
65 (0) [0x000000001d2d] 0008:c0001d2d (unk. 
66 <bochs:10> 
67 Next at t=18240482 
2 


ctxt): push es 


ctxt): push fs 


ctxt): push gs 


ctxt): pushad 
4 图 7-35 中断 调试 b 




















行 查看 当前 栈 ， 果 然 处 














s 后 ， 果 然 下 一 


理 器 已 经 压 入 了 寄存 器 的 值 ， 


1 


中 断 的 状态 ， 也 就 是 外 设 


.-2 (OQxc000151b) 














ly 








条 指令 是 








7.6 ”编写 中 断 处 理 入 





断 允 许 发生 。 


id vip vif ac wm rf nt IOPL=0 of df IF tf SF zf af pf cf 


】 1e 

















push ds， 如 图 7-35 : 





用 44 行 是 eflags 的 值 ， 














第 43 
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行 是 cs 中 的 选择 子 0x8， 第 42 行 是 旧 eip 的 值 0xc000151b， 第 41 行 的 0x00000000 是 中 断 处 理 入 口 程 请 

















中 第 一 条 指令 “push 0” 压 入 的 。 您 可 以 和 图 7-34 中 的 栈 信 息 对 比 下 。 
































在 第 57 行 继续 用 s 指令 单 步 执行 ， 回 车 后 是 将 图 7-34 中 最 下 面 的 push ds 执行 完成 ， 接 着 又 


















































依次 执 


行 了 59 行 的 push es、62 行 的 push fs 和 65 行 的 push gs。 到 第 66 行 时 ， 下 一 条 要 执行 的 指令 是 第 68 行 的 








pushad， 在 执行 它 之 前 ， 我 们 先 查 看 下 栈 中 情况 。 


<bochs:11> print-stack 

Stack address size 4 
STACK 0xc009ffcg [Oxc0000018] 
STACK 0xc009ffc4 [0x00000000] 
STACK 0xc009ffc8 [0x00070010] 
STACK 0xc009ffcc [Oxc0000010] 
STACK Oxc009ffd0 [0x00000000] 
STACK 0xc009ffd4 [Oxc000151b] 
STACK 0xc009ffd8 [0x00000008] 
STACK 0xc009ffdc [0x00000282] 
STACK 0xc009ffe0 [Oxc0001d44] 
STACK 0xc009ffe4 [0x00000000] 
STACK 0xc009ffe8 [0x00000000] 
STACK 0xc009ffec [0x00000000] 
STACK 0xc009fff0 [0x00000000] 
STACK 0xc009fff4 [0x00000000] 
STACK 0xc009fff8 [0x00000000] 
STACK 0xc009fffc [0x00000000] 

<bochs:12> s 

Next at t=18240483 

(9) [0x000000001d30] 0008:c0001d30 (unk.ctxt): mov al，0x20 


4 图 7-36 中断 调 试 C 




































































示 的 中 























中 选择 子 的 值 为 0x10, 高 16 位 是 内 存 中 的 垃圾 数据 , 第 73 行 是 旧 es 的 选择 子 ， 















































第 72 行 是 旧 fs 中 选择 子 的 值 ， 我 们 没 使 用 它 ， 未 对 其 初始 化 ， 所 以 其 值 为 0。 
的 值 。 
在 第 87 行 ， 执行 了 s 指令 ， 所 以 此 时 执行 的 是 上 一 张 图 中 最 后 一 行 
的 pushad 指令 。 此 时 再 查看 一 下 栈 是 否 压 入 了 8 个 通用 寄存 器 。 

为 了 让 大 家 看 全 此 次 中 断 压 入 的 全 部 数据 , 我 们 在 图 7-37 的 第 90 行 
通过 print-stack 20 打印 了 20 个 栈 中 数据 。 对 比 图 7-36 中 的 栈 ， 旧 栈 顶 是 
0xc009ffc0。 现 在 的 栈 顶 是 0xc009ffa0， 增 加 了 从 第 99 一 92 行 之 间 的 8 个 
数据 ， 这 就 是 8 个 32 位 通用 寄存 器 的 值 。 按 照 压 栈 顺序 ， 从 第 99 一 92 行 
依次 是 eax，ecx，edx，ebx，esp，ebp，esi，edi。 它们 的 值 到 底 对 不 对 呢 ? 
1 于 从 进入 中 断后 到 现在 为 止 ， 我 们 未 改变 寄存 器 的 值 ， 只 是 一 直 在 做 
push 操作 ， 所 以 大 伙 儿 可 以 参考 图 7-34 中 通过 + 命令 显示 出 的 寄存 器 结 
果 ， 它 们 与 图 7-37 第 99 一 92 行 中 的 值 是 一 样 的 。 顺 便 说 一 句 ， 在 bochs 
中 指令 r 中 显示 的 通用 寄存 器 ， 它 们 从 上 到 下 的 顺序 ， 正 是 pushad 指令 
压 入 它们 的 顺序 。 
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的 是 发 送 EOI。 

















project/c7/b/kernel/kernel.S 的 实际 代码 是 push %1。 





如 图 7-38 所 示 ， 继 续 癌 下 执行 ， 这 次 改 用 了 指令 n， 因 为 一 会 儿 要 调用 函数 ， 不 想 单 步 跟 进去 。 
在 图 7-38 中 第 112 行 的 指令 n 是 执行 的 图 7-36 中 第 89 行 的 mov al，0x20。 这 是 在 准备 OCW2， 

















在 图 7-36 中 第 69 行 ， 通 过 print-stack 查看 当前 栈 ， 此 时 栈 顶 已 经 是 0xc009ffc0 啦 ， 就 是 第 71 行 所 
辣 那 列 ， 较 图 7-35 中 的 栈 多 了 4 个 数据 。 第 74 行 是 段 寄存 器 ds 的 值 ， 其 中 低 16 位 有 效 ， 即 旧 ds 


它 同 旧 ds 的 值 是 一 样 的 。 
第 71 行 是 旧 gs 中 选择 子 





<bochs:13> print-stack 20 
Stack address size 4 
STACK 0xc009ffag [0x00000000] 
STACK 0xc009ffa4 [0x00070000] 
STACK 0xc009ffa8 [0Oxc009fffc] 
STACK 0xc009ffac [Oxc009ffc0] 
STACK 0xc009ffb0 [Ox00070094] 
STACK 0xc009ffb4 [0x0000c000] 
STACK 0xc009ffb8 [0x00000000] 
STACK 0xc009ffbc [0x20a00000] 
STACK 0xc009ffcg [0xc0000018] 
STACK 0xc009ffc4 [Ox00000000] 
STACK 0xc009ffc8 [0x00070010] 
STACK 0xc009ffcc [0xc0000010] 
STACK 0xc009ffd0 [0x00000000] 
STACK 0xc009ffd4 [Oxc000151b] 
STACK 0xc009ffd8 [0x00000008] 
STACK 0xc009ffdc [0x00000282] 
STACK 0xc009ffe0 [0xc0001d44] 
STACK 0xc009ffe4 [0x00000000] 
STACK 0xc009ffe8 [0x00000000] 
STACK 0xc009ffec [0x00000000] 


4 图 7-37 中断 调试 d 
































在 第 114 和 第 117 分 别 是 向 主 片 和 从 片 发 送 OCW2， 也 就 是 发 送 EOI 信号。 
第 120 行 的 push 0x00000020 是 下 一 条 待 执行 的 指令 ， 表 示 压 入 中 断 向 量 号 0x20， 其 对 应 





第 123 行 中 的 call 指令 对 应 上 述 kemel.S 中 的 call [idt_table + %1*4]， 此 时 尚未 执行 此 函数 调用 。 
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第 124 行 查看 下 栈 ， 此 时 在 栈 顶 压 入 了 中 断 向 量 号 0x20， 如 第 126 行 所 示 。 
在 第 148 行 显示 的 是 即将 执行 的 跳 转 指令 ， 它 是 以 相对 跳 转 的 形式 给 出 的 ，jmp 的 操作 数 是 个 偏 移 量 ， 








目 





7.6 ”编写 中 断 处 理 各 


括号 中 的 是 jmp 所 转移 的 目标 绝对 地 址 0xc0019b0， 它 对 应 于 kernel.S 中 的 jmp intr_exit。 


























112 <bochs:14> n 
113 Next at t=18240484 
114 (0) [0x000000001d32] 0008:c0001d32 (unk. : out 0xa0，al 
115 <bochs:15> 
116 Next at t=18240485 
117 (0) [0x000000001d34] 0008:c0001d34 (unk. out 0x20，al 
118 <bochs:16> 
119 Next at t=18240486 
120 (0) [0x000000001d36] 0008:c0001d36 (unk. : push 0x00000020 ; 6a20 
121 <bochs:17> n 
122 Next at t=18240487 
123 (0) [0x000000001d38] 0008:c0001d38 (unk. call dword ptr ds:0xc00022e0 ; ff15e02200c0 
<bochs:18> print-stack 20 
Stack address size 4 
STACK 0xc009ff9c [0x00000020] 
STACK 0xc009ffag [0x00000000] 
STACK 0xc009ffa4 [0x00070000] 
STACK 0xc009ffag [0Oxc009fffc] 
STACK 0xc009ffac [0Oxc009ffc0] 
STACK 0xc009ffb0 [0x00070094] 
STACK 0xc009ffb4 [0x0000c000] 
STACK 0xc009ffb8 [0x00000000] 
STACK 0xc009ffbc [Ox20000000] 
STACK Oxc009ffcO [Oxc0000018] 
STACK 0xc009ffc4 [0x00000000] 
STACK 0xc009ffc8g [0x00070010] 
STACK 0xc009ffcc [0xc0000010] 
STACK 0xc009ffd0 [0x00000000] 
STACK 0xc009ffd4 [Oxc000151b] 
STACK 0xc009ffd8 [0x00000008] 
STACK 0xc009ffdc [0x00000282] 
STACK 0xc009ffe0 [Oxc0001d44] 
STACK 0xc009ffe4 [0x00000000] 
| STACK 0xc909ffe8 [Ox00000000] 
146 <bochs:19> n 
147 Next at t=18242746 














148 (0) [0x000000001d3e] 0008:c0001d3e (unk. ctxt): jmp .-915 (0xc00019b6) ; e96dfcffff 
4 图 7-38 中断 调试 e 








149 <bochs:20> 

150 Next at t=18242747 

151 (0) [0x0000000019b0] 0008:c00019b@ (unk. ctxt): add esp, 0x00000004 
152 <bochs:21> r 


0xc0909ff9c -1073086564 
0xc009fffc -1073086468 
0x00070000 458752 
0x00000000 0 
161 eip: 0xc00019b0 
162 eflags 0x00000016: id vip vif ac wm rf nt IOPL=0 of df if tf sf zf AF PF cf 
163 <bochs:22> n 
Next at t=18242748 
(0) [0x0000000019b3] 0008:c00019b3 (unk. ctxt): popad ; 61 
<bochs:23> print-stack 20 
Stack address size 4 
| STACK 0xc009ffa0 [0x00000000] 
| STACK 0xc009ffa4 [0x00070000] 
| STACK 0xc009ffa8 [Ooxc009fffc] 
| STACK 0xc009ffac [Ooxc009ffc0] 
| STACK 0xc009ffb6 [0x00070094] 
| STACK 0xc009ffb4 [0x0000c000] 
| STACK 0xc009ffb8 [0x00000000] 
| STACK 0xc009ffbc [0x20a00000] 
| STACK 0xc009ffco [Oxc0000018] 
| STACK 0xc009ffc4 [0x00000000] 
| STACK 0xc009ffc8 [0x00070010] 
| STACK 0xc009ffcc [Oxc0000010] 
| STACK OQxc009ffd0 [0x00000000] 
| STACK 0xc009ffd4 [Oxc000151b] 
| STACK 0xc009ffd8 [0x00000008] 
| STACK 0xc009ffdc [0x00000282] 
| STACK 0xc009ffe0 [Oxc0001d44] 
| STACK 0xc009ffe4 [0x00000000] 
| STACK 0xc009ffe8 [0x00000000] 
| STACK 0xc009ffec [0x00000000] 


4 图 7-39 ”中断 调试 ff 

第 151 行 通过 add esp，0x00000004 指令 跳 过 了 压 在 栈 中 的 中 断 向 量 号 (就 是 为 调用 idt_table 中 的 函 
数 所 赋 的 参数 )， 对 应 kernel.S 中 的 add esp，0x4。 
第 152 行 通过 T 指令 查看 寄存 器 的 值 ， 这 里 主要 是 看 esp， 它 目前 是 0xc009ff9c。 在 第 163 行 的 指令 n 
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是 执行 的 第 151 行 的 add esp，0x4， 此 时 esp 变 成 了 0xc009ffa0， 这 一 点 在 第 166 行 的 print-stack 20 便 可 
以 看 出 来 ， 第 168 行 是 栈 顶 ， 其 值 正 是 0xc009ffa0。 由 于 马上 要 执行 第 165 行 的 popad 了 ， 所 以 此 时 才 将 
栈 打印 出 来 给 大 伙 儿 做 对 比 用 。 















































<bochs:24> r 
: 0x00000020 32 
: 0x00000000 0 
: 0x0000c000 49152 
: 0x00070094 458900 
: 0xc909ffag -1073086560 
: 0xc909fffc -1073086468 
i: 0x00070000 458752 
i: 0x00000000 0 
ip: Oxc00019b3 
eflags 0x00000096: id vip vif ac wm rf nt IOPL-O of df if tf SF zf AF PF cf 
<bochs:25> s 
Next at t=18242749 
(9) [0x0000000019b4] 0008:c90019b4 (unk. ctxt): pop gs 
<bochs:26> r 
: 0x20a00000 547356672 
: 0x00000000 0 
: 0x0000c000 49152 
: 0x00070094 458900 
: 0xc909ffcg -1073086528 
: 0xc009fffc -1073086468 
i: 0x00070000 458752 
i: 0x00000000 0 
: 0xc00019b4 
[a 
<bochs:27> print-stack 
Stack address size 4 
STACK 0xc809ffco [Oxc0000018] 
STACK Oxc009ffc4 [0x00000000] 
STACK 0xc809ffc8 [9x00070010] 
STACK 0xc0909ffcc [9xc0000010] 
STACK Oxc009ffd0 [0x00000000] 
STACK 0xc009ffd4 [Oxc000151b] 
STACK 0xc809ffd8 [0x00000008] 
STACK 0xc809ffdc [9x00000282] 
STACK 0xc009ffeg [9xc9001d44] 
STACK 0xc809ffe4 [0x00000000] 
STACK Oxc009ffe8 [0x00000000] 
STACK 0xc009ffec [0x00000000] 
STACK Oxc009fff0 [0x00000000] 
STACK 0xc809fff4 [0x00000000] 
STACK 0xc009fff8 [0x00000000] 
STACK 6xc809fffc [9x00000000] 


和 图 7-40 ”中 断 调试 g 















































因为 马上 要 执行 popad 指令 啦 , 所 以 在 第 188 行 先 用 T 指令 查看 下 当前 寄存 器 的 值 , 可 以 在 执行 popad 
后 做 对 比 。 
第 199 行 执行 了 指令 s， 这 就 是 将 图 7-39 中 第 165 行 的 popad 执行 了 。 此 时 在 第 202 行 再 次 通过 二 
令 查 看 寄存 器 的 值 ， 其 中 eax 已 经 由 0x20 恢复 到 先前 的 旧 值 了 。 
在 第 213 行 执行 了 print-stack 指令 , 验证 下 popad 是 否 把 栈 指针 增加 了 8*4=0x20 字 节 。 之 前 esp 旧 值 
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是 图 7-39 中 的 0xc009ffa0， 现 在 已 经 是 0xc009ffc0， 其 正好 增加 了 0x20。 















































7-41 中 第 231 行 的 指令 s 是 执行 的 图 7-40 中 第 201 行 的 pop gs。 紧 接着 又 依次 将 栈 中 的 值 pop 到 
fs、es、ds。 

在 第 242 行 通过 add esp，4 指令 跳 过 了 栈 中 的 error_code 或 0， 不 过 这 是 下 一 条 待 执行 的 指令 ， 目 前 
尚未 执行 ， 所 以 先 在 第 243 行 查 看 栈 中 信息 ， 栈 顶 在 第 245 行 ， 栈 项 中 的 数值 是 0， 这 正 是 进入 中 断 前 执 
行 的 push 0。 

7-42 中 第 261 行 的 指令 s 是 执行 的 图 7-41 第 242 行 的 add esp，0x00000004， 这 样 便 跨 过 了 栈 中 的 
error_code 或 0， 此 时 栈 顶 指向 旧 eip 的 值 。 下 一 个 指令 是 第 263 行 的 iretd。 

在 第 264 行 查 看 栈 ， 此 时 栈 顶 较 图 7-41 中 的 栈 顶 增加 了 4 字 节 。 

由 于 马上 要 执行 iretd 指令 了 ， 这 意味 着 eflags、cs、eip 都 要 更 新 ， 所 以 在 第 282 行 打印 出 当前 寄存 
器 的 值 ， 用 来 在 iretd 执行 后 做 对 比 。 

在 第 293 行 通过 sreg 命令 打印 出 段 寄存 器 的 值 ，iretd 也 会 改变 段 寄存 器 cs 的 人 
入 时 未 涉及 到 特权 级 转移 ， 所 以 栈 中 旧 cs 的 值 和 当前 cs 的 值 肯定 是 一 样 的 。 









































































































































不 过 由 于 此 中 断 进 
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231 <bochs:28> s 


235 Next at t=18242751 
236 (0) [0x0000000019b8] 0008:c00019b8 (unk. 
237 <bochs:30> 
238 Next at t=18242752 
: pop ds 


Next at t=18242753 
(0) [0x0000000019ba] 0008:c00019ba (unk. : add esp, Ox00000004 
<bochs:32> print-stack 


Stack address size 4 

STACK Oxc009ffd0 [0x00000000] 
| STACK 6xc009ffd4 [9xc000151b] 
| STACK 0xc009ffd8 [Ox00000008] 
| STACK 6xc909ffdc [9x00000282] 
| STACK 60xc009ffe0 [Oxc0001d44] 
| STACK 0xc009ffe4 [Ox00000000] 
| STACK Oxc009ffe8 [Ox00000000] 
| STACK 0xc009ffec [0x00000000] 
| STACK @xc009fff0 [Ox00000000] 
| STACK 6xc009fff4 [Ox00000000] 
| 
| 
| 
| STACK Oxc00a0004 [OxffffffFfFA] 
| STACK @xc00a0008 [OxffffffFfFf] 
| STACK 0xc00a000c [9xffffffff] 


和 图 7-41 ”中断 调 试 h 
































第 309 行 的 指令 s 执行 了 图 7-42 中 263 行 的 iretd 指令 , 至 此 , 处 理 器 回 到 了 被 中 断 的 进程 , 在 第 312 
行 用 指令 了 查看 下 所 恢复 后 的 寄存 器 值 ， 如 图 7-43 和 图 7-44 所 示 。 
















































































<bochs:33> s 

Next at t=18242754 

(0) [0x0000000019bd] 0008:c00019bd (unk，ctxt): iretd 

<bochs:34> print-stack 

Stack address size 4 
STACK 0xc009ffd4 [0xc000151b] 
STACK 0xc009ffd8 [0x00000008] 
STACK 0xc009ffdc [0x00000282] 
STACK 0xc009ffeg [0xc0001d44] 
STACK 0xc009ffe4 [0x00000000] 
STACK 0xc009ffe8 [0x00000000] 
STACK 0xc009ffec [0x00000000] 
STACK 0xc009fffg [0x00000000] 
STACK 0xc009fff4 [0x00000000] 
STACK 0xc009fff8 [0x00000000] 
STACK 0xc009fffc [0x00000000] 


STACK 6xc00a0008 [Oxffffffff] 
STACK 6xc00a0004 [9xfffffff 介 
STACK @xc00a0008 [gxfffffff 俐 
STACK 6xc06a000c [gxfffffff 俐 
STACK 6xc80a0019 [gxfffffff 介 


: 0xc009ffd4 -1073086508 
: 0xc009fffc -1073086468 
i: 0x00070000 458752 








4 图 7-42 ”中断 调试 i 


由 于 未 涉及 特权 转移 , 所 以 栈 还 是 在 中 断 处 理 程序 中 用 到 的 那个 栈 , 此 时 栈 顶 已 经 恢复 为 0xc009ffe0， 
这 和 图 7-34 中 进入 中 断 前 的 栈 顶 是 一 样 的 值 。 
这 就 是 中 断 发 生 时 ， 处 理 器 自动 压 栈 、 中 断 处 理 程 序 中 保护 上 下 文 环境 以 及 中 断 退 出 时 iret 指令 弹 栈 
的 完整 过 程 。 
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<bochs:36> sreg 

es:0x0010，dh-=0x00cf9300，d1=0x0000ffff，valid=1 

Data segment, base=0x00000000, limit=Qxffffffff, Read/Write, Accessed 
cs:0x0008,，dh=0x00cf9900，d1l=0x0000ffff，valid=1 

Code segment ，base=0x00000000，Limit=-Oxffffffff，Execute-OnLty，Non-Conforming，Accessed，32-bit 
ss:0x0010,，dh=0x00cf9300，dl=0x0000ffff，valid=7 

Data segment, base=0x00000000, limit=Oxffffffff, Read/Write, Accessed 
ds:0x0010，dh-0x00cf9300，dL-0x0000ffff ，valLid=1 

Data segment ，base=0x00000000，Limit=Oxffffffff，Read/Write，Accessed 


fs:0x0000，dh=0x00001000，d1=0x00000000，valid=0 
gs:0x0018,，dh=0xc0c0930b，d1l=0x80000008，valid=1 <bochs:39> print-stack 
Data segment, base=0xc00b8000, limit=0x00008fff, Read/Write, Accessed Stack address size 4 


ldtr:0x0000，dh=0x00008200，d1=0x0000ffff，valid=1 [| 
tr:0x0000，dh-0x00008b00，d1-0x0000fFfff，valid=1 | STACK 0xc009ffe4 [0x00000000] 
gdtr:base=0xc0000900，Limit=Oxlf | STACK 0xc009ffe8 [0x00000000] 
idtr:base=0xc0002000，limit=0x107 | STACK 0xc009ffec [0x00000000] 
<bochs:37> s [| 
Nexct ct t=18242755 , | STACK QxcO09fff4 [Ox00000000] 
by ne 0008:c000151b (unk. ctxt): jmp .-2 (Oxc000151b) ~ | STACK Oxc009fff8 [Ox00000000] 

ep | STACK Qxc009fffc [Ox00000000] 
人 | STACK Oxc00a0000 [gxffffffff 
Gi [| 
ebx: | STACK xc00a0008 [@xfffffff 侨 
esp: 9xc009ffeg -1073086496 | STACK 0xc00a000c [Oxfffffff 保 ] 
ebp: 9xc809fffc -1073086468 | STACK 6xc00a0010 [OxffFfFFFFFA] 
esi: Ox00070000 458752 [| 
edi: 0x00000000 0 | STACK 6xc00a0018 [OxfffffFFFf] 
eip: 6xc000151b | STACK 6xc00a001c [OxffffFFFF] 

lg p bochs :40 














A 图 7-43 中断 调试 j 4 图 7-44 中断 调试 k 


可 编程 计数 器 < 定时 器 XX/ 简介 


剧 透 一 下 ， 我 们 打算 用 计数 器 /定时 器 8253 来 设置 时 钟 中 断 发 生 的 频率 ， 虽 然 单独 拿 一 节 来 介绍 它 ， 
但 用 到 的 并 不 多 ， 所 以 我 们 并 不 会 花 太 多 的 笔墨 。 另 外 为 叙述 方便 ， 凡 是 用 到 计数 器 /定时 器 的 地 方 ， 我 
都 用 定时 计数 器 来 代替 。 


7.7.1 时 钟 一 一 给 设备 打 拍 子 


尽管 上 一 节 中 我 们 做 了 两 个 中 断 的 例子 , 但 我 还 有 一 件 事 未 向 大 伙 儿 交待 清楚 : 中 断 是 哪 来 的 ? 由 谁 
发 出 的 ? 
在 揭晓 答案 之 前 ， 咱 们 先 看 看 计算 机 中 的 时 钟 到 底 是 用 来 干吗 的 。 
ee (就 是 一 堆 人 跳 同一 种 舞 )， 在 排练 过 程 中 ， 有 个 教练 或 领队 在 
直 咕 一、 二、 三 、 四 、 五 、 六 、 七 、 八 ， 二 、 二 、 三 、 四 …… 这 是 在 喊 拍子 ， 目 的 是 让 大 伙 儿 都 找到 
“点 儿 ” 这 样 队 员 们 跟着 这 同一 节奏 跳舞 ， 就 能 使 整体 上 步调 一 致 。 如 果 教 练 没有 喊 这 个 拍子 的 话 ， 由 
于 不 熟练 ， 集 体 舞 就 乱 七 八 粮 一 锅 粥 了 。 有 同学 会 不 会 “抬杠 ”上 台 表 演 的 那些 舞 者 也 没 喊 拍子 啊 ， 
不 是 也 照样 跳 得 很 齐 吗 ? 其实， 任何 时 候 和 舞蹈 都 离 不 开拍 子 ， 舞 者 在 表演 时 的 拍子 就 是 音乐 ， 随 时 都 在 
跟着 音乐 的 节奏 跳 ， 这 个 音乐 就 是 所 有 和 舞 者 共同 的 节奏 ， 舞 者 们 都 是 在 用 上 受 体 表达 音乐 。 看 我 说 的 是 不 
是 有 点 到 位 ? 
在 计算 机 系统 中 也 一 样 , 为 了 使 所 有 设备 之 间 的 通信 井然 有 序 ， 各 通信 设备 间 必 须 有 统一 的 节奏 ,不 能 各 
干 各 的 ， 这 个 节奏 就 称 为 定时 或 时 钟 。 所 以 ， 大 伙 儿 清楚 了 ， 时 钟 并 不 是 计算 机 处 理 速度 的 衡量 ， 而 是 一 种 使 
设备 间 相互 配合 而 避免 发 生 冲突 的 节拍 。 时钟 只 是 一 种 时 间 的 度量 ， 只 是 一 种 节奏 ,其 时 间 长 度 并 不 统一 ， 各 
种 设备 都 有 自己 的 时 钟 , 也 就 是 说 都 有 自己 的 工作 节拍 ,比如 处 理 器 的 时 钟 和 外 部 设备 的 时 钟表 定 不 是 一 个 数 
量 级 ， 让 处 理 器 这 种 高 速 设备 以 外 部 设备 低速 时 钟 工作 ， 处 理 器 肯定 会 觉得 很 闲 。 而 让 低速 的 外 部 设备 以 处 理 
器 的 时 钟 节拍 工作 ， 外 部 设备 也 许 会 急 得 不 知 所 措 ， 完 全 跟 不 上 节奏 。 大 伙 儿 现在 应 该 清楚 了 ， 时 钟 信号 并 不 
是 专 指 处 理 器 的 时 钟 ， 也 并 不 特 指 IRQ0 上 的 时 钟 ， 表 达 的 意思 仅仅 是 设备 自己 的 工作 节拍 、 频 率 。 
计算 机 中 的 时 钟 ， 大 致 上 可 分 为 两 大 类 : 内 部 时 钟 和 外 部 时 钟 。 
内 部 时 钟 是 指 处 理 器 中 内 部 元 件 ， 如 运算 器 、 控 制 器 的 工作 时 序 ， 主 要 用 于 控制 、 同 步 内 部 工作 过 程 
的 步调 。 内 部 时 钟 是 由 晶体 振荡 器 产生 的 ， 简 称 晶 振 ， 它 位 于 主板 上 ， 其 频率 经 过 分 频 之 后 就 是 主板 的 外 
频 ， 处 理 器 和 南北 桥 之 间 的 通信 就 基于 外 频 。Intel 处 理 器 将 此 外 频 乘 以 某 个 倍数 〈 也 称 为 倍 频 ) 之 后 便 称 
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为 主 频 。 处 


里 器 取 指令 、 








决定 的 ,在 出 广 时 就 设 定好 啦 ， 无 法 改变 。 处 理 器 内 癌 
位 粒度 比较 精细 ， 通 常 都 是 











悄 
| 


执行 指令 中 所 消耗 的 时 钟 周期 都 是 基于 主 频 的 。 内 部 时 钟 是 由 处 




















多 
在 A/D 转换 





悄 地 说 





























里 器 固件 结构 




















内 秒 (Cns) 级 的 。 
声 ， 内 部 定时 是 无 法 改变 的 ， 所 以 咱们 对 它 的 
部 时 钟 是 指 处 理 器 与 外 部 设备 或 外 部 设备 之 间 通 信 时 采用 的 一 种 








了 元件 的 工作 速度 是 最 快 的 ， 所 以 内 部 时 钟 的 时 间 单 























讨论 止步 于 此 。 
时 序 ， 比 如 IO 接口 和 处 理 器 之 间 

















时 的 工作 











于 处 到 
多 
器 通信 ， 
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钟 节 








来 解决 时 序 


器 来 说 就 很 慢 了 ， 
部 时 钟 和 内 部 时 钟 
它们 之 间 的 通 





个 计算 机 系统 后 , 我们 
3 下 的 设备 能 够 同步 








就 要 考虑 处 理 











设备 之 间 进 行 数 和 
所 以 其 时 钟 的 时 间 单 位 粒度 较 大 ， 一 般 是 毫秒 ms) 级 或 秒 〈s) 级 的 。 











传输 时 也 要 事先 同步 时 钟 等 。 外 部 设备 的 速度 对 
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是 两 套 独立 运行 的 定时 体系 ,它们 按照 自 





的 步调 协同 工作 。 外 部 设备 需要 与 处 


Ly 




















IO 接 














l=) 
百 和 二 














来 中 转 完成 的 。 问 题 来 啦 ， 当 外 部 设备 与 处 理 器 连接 ， 组 成 了 一 






































器 与 外 部 设备 间 同 步 数 据 时 的 时 序 配合 问题 ， 如 何 
通信 。 解决 这 个 问题 的 大 体 思 路 是 : 应 以 处 理 器 的 内 部 时 钟 为 依据 来 设计 外 部 设 


























如 何 保证 运行 在 不 同时 



































备 的 时 钟 ， 既 要 符合 处 理 器 内 部 运行 时 序 的 规定 ， 又 要 满足 外 部 设备 工作 时 序 的 要 求 。 定 时 计数 器 就 是 用 


























言 号 频率 过 





高 ， 因 


对 于 外 部 定时 ， 我 们 有 两 利 














int cycle cnt = 90000; 
while(cycle cnt-—- > 0); 


这 个 例子 是 让 处 到 
白 消 耗 时 








的 代价 是 
男 外 一 利 




















计时 器 





二 


Ph 是 用 硬 伯 
的 功能 就 


钟 周 期 ， 处 到 


器 执行 9 万 次 空 循环 ， 通 过 这 种 延迟 方式 达到 一 定 的 定时 作用 





























配合 问题 的 。 大 家 已 知道 处 理 器 的 内 部 时 钟 信号 由 唱 振 产生 ， 故 计时 精准 稳定 。 但 晶振 产生 的 
此 必须 将 其 送 到 定时 计数 器 分 频 ， 这 才 号 
实现 方式 。 一 种 是 用 软件 实现 ， 比 如 以 下 代码 ; 











能 产生 所 需要 的 各 种 定时 信号 。 



































E 兜 处理 器 









































三 
息 

















百 祥 


备 。 














向 处 理 器 发 出 中 出 
简单 地 说 ， 其 作 |/ 
和 软件 定时 相 比 ， 硬 件 定时 器 不 占 


ff， 这 样 处 型 





器 的 资源 是 很 宝贵 的 ， 可 不 能 随意 浪费 。 
实现 ， 这 一 类 硬件 称 为 定时 器 。 
定时 发 信号 。 当 到 达 了 所 计数 的 时 间 ， 计 数 器 可 以 自动 发 一 个 输出 
器 可 以 去 执行 相应 的 中 断 处 理 程序 。 或 者 用 该 信号 直接 启动 某 些 外 部 设 














言 号 ， 可 以 用 该 















































] 有 














原因 是 硬件 定时 器 是 独立 的 ， 可 以 

















间 。 处 理 器 给 定时 器 设置 好 计数 值 后 


























点 像 高 级 玫 





F 发 i 








口 





函数 。 


在 言 中 的 回调 




















j 处 理 器 ， 因 此 可 以 大 大 提升 处 理 器 利用 率 。 








口 
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处 理 器 并 行 工作 , 所 以 用 硬件 定时 器 定时 的 好 处 是 节省 处 理 器 时 




















口 





文 























以 去 做 别 的 啦 ， 接 下 来 的 计数 工作 由 硬件 计数 器 独立 完成 。 




















定时 器 可 分 为 不 可 编 
Programmable Interval Timer。 


常用 的 可 编程 定 


























时 器 及 


程 定 





时 计数 器 有 Intel 8253/8254/82C54A 等 ， 后 两 个 是 8253 的 加 
只 用 到 最 基础 的 东西 ， 所 以 咱们 
8253 在 名 字 上 既 称 为 定时 器 ， 又 称 为 计数 器 ， 看 上 去 像 是 两 种 功能 ， 它 到 











由 于 我 们 





实 属于 同一 类 物品 ， 时 间 本 质 上 就 是 个 没有 设 定 目标 终 1 





























| 数 ， 通 常 这 个 计数 的 单位 是 秒 。 











计数 器 是 为 别人 提供 工作 的 “节拍 ” 所 以 它 





意 说 的 词 ， 反 正 你 懂 的 )。 

是 一 回 事 。 
钟表 和 计数 器 

时 每 刻 都 在 不 停 地 计 

是 一 回 事 。 

为 了 让 计数 器 - 








变 计数 值 ( 





自 加 或 自 减 )， 此 节 











[ 作 时 不 紧 不 慢 ， 有 条 不 紊 ， 计 数 器 也 得 遵循 某 种 “节拍 ” 才 行 ， 
就 是 计数 器 的 时 钟 脉冲 信号 ， 也 称 为 计数 脉冲 信号 ， 每 一 次 时 钟 脉冲 信 




















号 到 来 时 就 会 修改 计数 值 。 


如 何 去 修 改 计数 值 呢 ? 这 得 看 定时 器 的 计数 Gi 
(1) 正 计 时 : 每 一 次 时 钟 脉冲 发 生 时 ， 将 当前 计数 值 

















间 已 到 ， 














型 的 例子 就 是 闹钟 。 
(2) 倒计时 : 先 设 定好 计数 器 的 值 ， 每 一 次 时 钟 脉 ; 


























型 的 例子 就 是 电 风扇 的 定时 。 


可 编程 定时 器 














天 种 ， 我 们 要 接触 的 是 第 三 种 可 编程 定时 器 PIC， 即 





强 版 和 更 强 版 (我 自己 随 
的 用 法 。 
底 是 什么 ? 答案 是 : 它们 




















只 介绍 8253 




















上 值 的 计数 器 ， 这 个 计数 器 每 
所 以 ， 时 间 就 是 计数 ， 计 数 也 称 为 定时 ， 它 们 本 质 上 





























EE 








己 必须 得 最 可 靠 ， 这 样 才 有 资格 作为 时 间 的 “基准 ”。 
这 种 节拍 用 来 控制 何 时 改 
























































十 时 ) 方式 了 。 硬 件 定时 器 一 般 有 两 种 计时 的 方式 。 
加 1， 直 到 与 设 定 的 目标 终止 值 相等 时 ， 提 示 时 







































































发 生 时 将 计数 值 减 1， 直到 为 0 时 提示 时 间 已 到 ， 
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我 们 的 8253 用 的 是 倒计时 的 方式 , 基本 上 我 们 对 它 的 编程 就 是 围绕 如 何 为 其 计数 器 赋 初 始 的 计数 值 。 

说 了 半天 ， 我 们 还 不 知道 为 什么 要 定时 呢 ， 计 算 机 中 哪些 事情 需要 定时 去 做 ? 
在 微型 计算 机 系统 中 定时 功能 是 不 可 少 的， 比如 为 防止 RAM 中 的 数据 丢失 ， 每 隔 一 段 时 间 就 要 对 
RAM 进行 充电 刷新 ， 或 者 定时 检测 菜 些 参数 ， 还 有 最 最 重要 的 ， 定 时 向 处 理 器 发 时 钟 中 断 ， 这 就 是 咱们 
马上 要 做 的 ， 通 过 设置 8253 来 调整 时 钟 中 断 发 生 的 频率 。 

好 啦 ， 更 多 精彩 请 见 下 一 节 。 
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7.7.2 8253 入 门 


前 面 啼 明 的 已 经 够 多 了 ， 咱 们 现在 正式 介绍 下 可 编程 定时 计数 器 8253， 其 内 部 逻辑 结构 如 图 7-45 所 示 。 

如 果 要 把 8253 完全 讲 清楚 ,肯定 要 涉及 到 微机 接口 、 电 平 信 号 方面 的 知识 ， 对 于 8253 的 介绍 咱们 也 
是 围绕 如 何 对 其 编程 来 展开 ， 如 果 大 伙 儿 有 深入 学 习 的 兴致 ， 可 以 参考 微机 接口 方面 的 资料 。 图 7-45 所 
示 只 是 逻辑 结构 简 图 ， 咱 们 对 照 着 它 ， 用 到 什么 就 介绍 什么 。 

8253 既然 是 计数 器 ， 那 么 它 的 价值 就 体现 在 计数 方 
在 8253 内 部 有 3 个 独立 的 计数 器 , 您 看 到 了 , 就 是 在 图 7-45 的 右 侧 的 3 个 计数 器 , 分 别 是 计数 器 0 一 
计数 器 2， 它 们 的 端口 分 别 是 0x40 一 0x42。 计 数 器 又 称 为 通道 ， 每 个 计数 器 都 完全 相同 ， 都 是 16 位 大 小 。 
既然 它们 是 独立 的 ， 也 就 是 这 三 个 计数 器 的 工作 是 不 依赖 的 ， 可 以 同时 工作 ， 各 干 各 的 。 原 因 是 各 个 计数 
器 都 有 自己 的 一 套 寄 存 器 资源 ， 工 作 时 自己 用 自己 的 ， 互 不 干涉 。 寄 存 器 资源 包括 一 个 16 位 的 计数 初 值 
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寄存 器 、 一 个 计数 器 执行 部 件 和 一 个 输出 锁 存 器 。 其 中 ,计数 器 执行 部 件 是 计数 器 中 真正 进行 计数 工作 的 
元 器 件 ， 其 本 质 是 个 减法 计数 器 ， 如 图 7-46 所 示 。 
数据 =—— CLKO 
ce 一 > < 二 计数 器 0 一 sAreo 
了 计数 器 内 部 结构 简 图 
人 < 一 CLK1 
基 dl gt 计数 祈 值 寄存 器 
| 
二 J&| [减法 计数 器 
搓 制 字 一 一 > 计数 器 2 [一 GATE2 
us 输出 锁 存 器 
A 图 7-45 8253 内 部 结构 简 图 A 图 7-46 计数 器 内 部 结构 
在 继续 之 前 ， 咱 们 先 大 体 看 下 计数 器 的 工作 原理 ， 这 样 有 助 于 大 伙 自 上 而 下 地 理解 。 

































































每 个 计数 器 都 有 三 个 引 脚 : CLK，GATITE，OUT。 

(1) CLK 表示 时 钟 输入 信号 ， 即 计数 器 自己 工作 的 节拍 ， 也 就 是 计数 器 自己 的 时 钟 频 率 。 每 当 此 引 
脚 收 到 一 个 时 钟 信 号 , 减法 计数 器 就 将 计数 值 减 1。 连 接 到 此 引 脚 的 脉冲 频率 最 高 为 10MHz, 8253 为 2MHz。 

(2) GATE 表示 门 控 输 入 信号 ， 在 某 些 工作 方式 下 用 于 控制 计数 器 是 否 可 以 开始 计数 ， 在 不 同 工 作 方 
式 下 GATE 的 作用 不 同 ， 到 时 候 同 工作 方式 一 同 介绍 。 

(3) OUT 表示 计数 器 输出 信号 。 当 定时 工作 结束 ， 也 就 是 计数 值 为 0 时 ， 根 据 计数 器 的 工作 方式 ， 
会 在 OUT 引 脚 上 输出 相应 的 信号 。 此 信号 用 来 通知 处 理 器 或 某 个 设备 : 定时 完成 。 这 样 处 理 器 或 外 部 设 
备 便 可 以 执行 相应 的 行为 动作 。 

计数 开始 之 前 的 计数 初 值 保存 在 计数 初 值 寄存 器 中 ， 计 数 器 执行 部 件 (减法 计数 器 ) 将 此 初 值 载 入 后 ， 
计数 器 的 CLK 引 脚 每 收 到 一 个 脉冲 信号 ， 计 数 器 执行 部 件 (减法 计数 器 ) 便 将 计数 值 减 1， 同 时 将 当前 计 
数值 保存 在 输出 锁 存 器 中 。 当 计数 值 减 到 0 时， 表示 定时 工作 结束 ， 此 时 将 通过 OUT 引 脚 发 出 信号 ， 此 信 
号 可 以 用 来 向 处 理 器 发 出 中 断 请 求 ， 也 可 以 直接 启动 某 个 设备 工作 。 
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下 面 简 要 说 下 计数 器 内 部 各 个 结构 的 功用 。 


计数 初 值 寄存 器 用 来 保存 计数 器 的 初始 值 ， 
就 保存 在 计数 初 值 寄存 器 。 它 的 作用 是 为 计数 器 执 
计数 器 选择 了 某 种 重复 计数 的 工作 方式 后 ， 比 如 工作 方式 2 和 工作 方式 3《〈 后 面 介 














它 是 16 位 宽 
行 部 件 准 




















备 初始 计数 值 ， 


度 , 我 们 对 8253 初始 化 时 写 入 的 计数 初始 值 
之 后 的 计数 过 程 与 它 无 关 。 当 














初 值 重新 装载 到 计数 器 执行 部 件 中 。 


计数 器 执行 
真正 实际 的 计数 器 。8283 是 个 倒计时 计数 器 ， 





部 件 是 计数 器 中 真正 “计数 ”的 部 件 


























， 计 数 的 工作 是 












































大 





原 











寄存 器 ! 














计数 值 ， 





输出 锁 存 器 也 称 为 当前 1 


拿 到 起 始 值 ， 载 入 到 上 


己 的 寄存 器 后 便 开 始 递 减 计数 。 























它 保 存在 执行 部 件 自 ; 











是 计数 器 执行 部 伯 











,的 寄存 器 中 ， 初 














让 外 界 可 以 


计数 值 。 


了 获取 计数 值 而 计数 器 停止 计数 。 
器 起 到 暂 存 寄存 器 的 作用 。 
计数 初 值 寄存 器 、 
以 单独 访问 。 我 们 之 后 为 其 
三 个 计数 器 都 有 自己 的 用 途 





原因 是 这 样 的 : 








十 数值 
随时 获取 当前 计数 值 。 
计数 器 的 使 
































计数 器 中 的 计数 值 











为 了 获取 任意 时 刻 






































这 样 处 到 
计数 器 执行 部 件 和 输出 锁 存 器 
武子 初始 计数 值 时 就 












































未， 它们 的 作用 见 表 7-4。 





表 7-4 


计数 器 名 称 


8253 计数 器 


值 寄存 器 中 的 值 











不 受 影响 。 








锁 存 器 , 用 于 把 当前 减法 计数 器 中 的 
是 不 断 变 化 的 ， 处 
EE 命 就 是 通过 计数 的 方式 实现 定时 功 外 
的 计数 值 ，8253 只 有 将 它 送 到 输 
器 便 能 够 从 输出 锁 存 器 中 获取 瞬间 
都 是 16 位 宽 






































+ 绍 )， 还 需要 将 此 计数 





计数 器 执行 部 件 完成 的 ， 所 以 它 才 是 
F 是 个 16 位 的 减法 计数 器 ， 它 从 初 值 
注意 ， 计 数 过 程 中 不 断 变化 的 值 称 为 当 
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一 | 








计数 值 保存 下 来 ， 其 





的 就 是 为 了 





























取 当 前 














里 器 无 法 直接 从 计数 器 中 性 
E， 必 须要 求 精 准 ， 所 以 绝 不 能 为 




















计数 值 。 


作 用 








出 锁 存 器 ， 此 锁 存 


度 的 寄存 器 ， 所 以 高 8 位 和 低 8 位 都 可 
分 为 高 8 位 和 低 8 位 分 别 操 作 。 





数 器 0 


i 

















在 个 人 计算 机 中 ， 计 数 器 0 专 | 
时 则 为 最 大 计数 值 65536 


于 产生 实时 时 钟 信号 。 




















巴 采 用 工作 方式 3， 往 此 计数 器 写 入 0 





上 数 器 1 








在 个 人 计算 机 中 ， 计 数 器 1 专 
次 的 刷新 ，PC/AT 规定 在 4ms 

















进行 256 





于 DRAM 的 定时 刷新 控制 。 


次 的 刷新 


PC/XT 规定 在 2ms 内 i 











行 128 














计数 器 2 


表 7-4 中 简单 介 


可 是 咱 个 


计数 器 0 的 作用 是 产生 时 钟 信号 ， 
信号 的 发 生 频率 。 
芷 就 是 以 计数 的 形式 实现 定时 功能 , 讨 
期 后 就 会 发 出 时 钟 ! 


器 0 决定 时 钟 中 时 
解 , 计数 器 的 工 
号 可 以 向 处 理 器 发 中 断 。 
| 脚 IRQ0 有 中 断 信和 号 


我 介 
此 信 
会 感知 3 





] 的 重点 ， 给 大 伙 儿 介 


] 已 经 了 























7.7.3 8253 控制 字 





在 图 





绍 了 3 个 计数 器 的 作用 ， 后 两 个 咱们 不 用 
































在 个 人 计算 机 中 ， 计 数 器 2 专 
同 频率 的 方 波 








于 内 部 扬声器 发 出 不 同音 调 的 声 


音 ， 原 理 是 给 扬声器 输送 不 






































深究 了 ， 毕 竟 











头 就 是 为 了 讲 





绍 8253 计数 器 0 




















这 个 时 钟 是 指 连接 到 主 片 [RQ0 引 脚 J 
































， 这 里 1 


























忆 此 ， 计 数 器 0 的 计时 到 
到 来 。 











7-45 中 左下 角 





是 控 


判 字 寄 存 器 ， 


3 








前 用 不 着 它们 。 
3 们 多 说 两 句 。 
上 的 那个 时 钟 ， 也 就 是 说 计数 


| 数 时 间 到 达 后 就 会 发 一 


计数 器 0 


个 输出 信号 ， 


























断 信 号 ， 中 断代 到 





E 8259A 就 














操作 端口 是 0x43， 

















它 是 8 位 大 小 的 寄存 器 。 控 各 














模式 控制 








寄存 器 ， 在 控 币 





方式 、 读 写 格式 及 数 制 ， 





上 字 寄存 器 中 保存 的 
为 方便 叙述 ， 我 人 


内 容 称 为 控 仙 











上 字 ， 控 融 
] 把 计数 器 的 “工作 方式 、 读 写 格式 及 数 和 


上 字 用 来 设置 所 指定 的 计数 器 〈 通 道 ) 的 





上 | 字 寄 存 器 也 称 为 
工作 
| 模式 。 























上 ”和 暂 称 为 控 上 











































































































三 个 计数 器 是 独立 工作 的 ， 每 个 计数 器 都 必须 明确 自己 的 控制 模式 才 知道 该 怎样 去 工作 (计数 )， 它 
们 各 自 的 控制 模式 都 要 以 控制 字 的 形式 在 同一 个 控制 字 寄 存 器 中 设 定 ， 所 以 , 控制 字 中 有 相关 的 字段 来 选 
定 操作 哪个 计数 器 。 

咱们 先 看 看 控制 字 的 结构 ， 如 图 7-47 所 示 。 

控制 字 由 8 位 三 进 制 组 成 ， 咱 们 从 最 高 位 开始 介绍 
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SC1 和 SC0 位 是 选择 计数 器 位 ， 即 Select Counter， 或 者 叫 选 择 通 道 位 ， 即 Select Channel。 在 8253 
内 部 有 3 个 独立 的 计数 器 ， 每 个 计数 器 都 有 自己 的 

















































































































控制 模式 ， 但 是 这 三 个 计数 器 的 控制 字 是 共用 同一 本 
个 控制 字 寄 存 器 写 入 的 ， 所 以 此 处 用 SC1 和 SC0 00 | 选择 计数 器 0 0 二进制 
这 两 位 去 选择 待 操作 的 计数 器 ， 也 就 是 此 控制 字 用 01 | 选择 计数 器 1 1 | BCD 码 
来 设置 哪个 计数 器 。 这 有 点 像 之 前 操作 显卡 时 的 寄 。 || 10 | 选择 计数 器 2 






























































































































































































































































存 器 那样 ， 需 要 指定 寄存 器 索引 。 这 两 位 可 组 合 4 “| 了 | 未 定义 
个 寄存 器 名 称 ， 二 进 制 00b 一 10b 分 别 对 应 计数 器 6 
0 一 计数 器 2， 上 有 具体 选择 值 如 图 7-47 所 示 。 SC1 | SCO | RW1 | Rw0 | M2 | M1 | MO | BCD 
RW1 和 RW0 位 是 读 / 写 / 锁 存 操作 位 ， 即 一 一 一 ”一 一 一 一 、 -一 7 
Read/Write/Latch， 用 来 设置 待 操 作 计 数 器 (通道 ) 的 透 择 读 写 方式 了 
读 写 及 锁 存 方式 ， 有关 锁 存 可 以 参看 前 面 介 绍 的 输出 销 存 数据 000 方式 0 
锁 存 器 。 计 数 器 是 16 位 宽度 ， 当 我 们 往 计数 器 中 写 “| ”| ” 供 cpu 读 001 | 方式 1 
入 计数 初 值 时 ， 或 者 读 取 计 数 器 中 的 数值 时 ， 可 以 指 。 |_01 | 只 读 写 低 字 节 X10 人 
定 读 写 低 8 位 ， 还 是 高 8 位 。RW1 和 RW0 这 两 位 组 。 外语 电 下 字 才 上 
合成 4 种 读 写 方式 ， 有 具体 选择 值 如 图 7-47 所 示 。 11 | 后 读 写 高 字 节 101 | 方式 5 
M2 一 M0 这 三 位 是 工作 方式 〈 模 式 ) 选择 位 ， 
即 Method 或 Mode。 每 个 计数 器 有 6 种 不 同 的 工作 8253 控 制 字 格 式 








方式 ， 即 方式 0 一 方式 $S， 后 面 专 门 介绍 

8253 的 各 个 计数 器 都 有 两 种 计数 方式 : 二 进 制 
方式 和 十 进 制 方式 ， 其 中 十 进 制 方式 就 是 用 BCD 码 来 表示 。 即 Binary-Coded Decimal， 称 为 “二 
进 制 码 的 十 进 制 数 ” 十 进 制 最 大 数 为 9， 也 就 是 需要 用 4 位 二 进 制 数 来 表示 1 位 十 进 制 数 。 

BCD 位 是 数 制 位 ， 用 来 指示 计数 器 的 计数 方式 是 BCD 码 ， 还 是 二 进 制 数 。 

当 BCD 位 为 1 时 ， 则 表示 用 BCD 码 来 计数 ， 如 0x1234， 则 表示 十 进 制 数 1234。BCD 码 的 初始 值 范围 是 
0 一 0x9999， 也 就 是 说 BCD 码 所 表示 的 十 进 制 范 围 是 0~9999。0 值 则 表示 十 进 制 10000。 

当 BCD 位 为 0 时 ， 则 表示 用 二 进 制 数 来 计数 ， 如 0x1234， 则 表示 十 进 制 4660。 二 进 制 数 的 初始 值 范 
逢 是 0 一 0xFFFF， ee 上 0 值 表示 65536。 

控制 字 部 分 到 此 结束 ， 转 战 下 一 


7.7.4 8253 工作 方式 
介绍 完了 控制 字 ， 咱 们 花 点 时 间 介 绍 下 工作 方式 。8253 一 共有 6 种 方式 ， 大 伙 儿 见 表 7-5。 











4 图 7-47 ”8253 控制 字 及 部 分 说 明 





























































































































































































































表 7-5 8253 工作 方式 
工作 方式 描 述 

方式 0 计数 结束 中 断 方式 〈Interrupt on Terminal Count) 
方式 1 硬件 可 重 触 发 单 稳 方式 (Hardware Retriggerable One-Shot ) 
方式 2 比率 发 生 器 (Rate Generator) 
方式 3 方 波 发 生 器 (Square Wave Generator) 
方式 4 软件 触发 选 通 (Software Triggered Strobe) 
方式 5 硬件 触发 选 通 (Hardware Triggered Strobe) 




















8253 提供 了 多 种 工作 方式 ， 就 说 明 支 持 多 种 用 途 ， 每 种 工作 方式 中 ， 计 数 器 的 计数 过 程 、 启 动 停止 
方式 都 有 所 不 同 。 因 此 ， 咱 们 要 根据 实际 用 途 来 选择 工作 方式 。 

计数 器 的 计数 过 程 在 何 时 发 生 呢 ? 将 计数 初 值 写 入 计数 器 后 就 开始 计数 了 吗 ? 不 完全 是 。 开 始 计数 的 
时 机 与 工作 方式 相关 ， 计 数 器 开始 计数 需要 两 个 条 件 。 
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(1) GATE 为 高 电 平 ， 即 GATE 为 1， 这 是 由 硬件 来 控制 的 。 
(2) 计数 初 值 已 写 入 计数 器 中 的 减法 计数 器 ， 这 是 由 软件 out 指令 控制 的 。 
当 这 两 个 条 件 具 备 后 ， 计 数 器 将 在 下 一 个 时 钟 信号 CLK 的 下 降 沿 开始 计数 。 
介绍 点 相关 知识 ， 不 知道 大 伙 儿 是 否 都 学 过 微机 接口 ， 在 数字 电路 中 ， 电 压 的 高 低 用 逻辑 电 平 来 表示 。 把 
高 于 3.5V 的 电压 规定 为 高 电 平 ， 用 数字 1 表示 。 低 于 0.3V 的 电压 规定 为 低 电 平 ， 用 数字 0 表示 。 把 电 平 数 全 
10 变 成 1 的 一 瞬间 称 为 上 升 沿 ， 把 电 平 数字 由 1 变 成 0 的 一 瞬间 称 为 下 降 沿 。 
以 上 这 两 个 条 件 ， 按 照 “ 哪 个 未 完成 ”来 划分 ， 可 分 为 软件 启动 和 硬件 启动 。 
。 软件 启动 
软件 启动 是 指 上 面 硬件 负责 的 条 件 1 已 经 完成 ， 也 就 是 GATE 已 经 为 1， 目 前 只 差 软件 来 完成 条 件 2， 
即 尚 未 写 入 计数 初 值 ， 只 要 软件 负责 的 条 件 准 备 好 ， 计 数 器 就 开始 启动 。 当 处 理 器 用 out 指令 往 计 数 器 写 入 
计数 初 值 ， 减 法 器 将 此 初 值 加 载 后 ， 计 数 器 便 开 始 计数 。 工 作 方式 0、2、3、4 都 是 用 软件 启动 计数 过 程 。 
。 硬件 启动 
硬件 启动 是 指 上 面 软件 负责 的 条 件 2 已 经 完成 ， 即 计数 初 值 已 写 入 计数 器 。 目 前 只 差 硬 件 来 完成 条 件 
1 了 ， 也 就 是 门 控 信 号 GATE 目前 还 是 低 电 平 ， 即 目前 GATE=0， 只 要 硬件 负责 的 条 件 准备 好 ， 计 数 器 就 
开始 启动 。GATE 引 脚 是 由 外 部 信号 来 控制 的 ， 只 有 当 GATE 由 0 变 1 的 上 升 沿 出 现时 ， 计 数 器 才 开始 启 
动 计 数 。 工 作 方式 1、5 都 是 用 硬件 启动 计数 过 程 。 
以 上 是 说 明 计 数 器 是 如 何 启 动 的 ， 那 计数 是 如 何 停止 的 呢 ? 根 据 不 同 的 工作 方式 , 分 为 强制 终止 和 自 











































































































































































































































































































































































































































































































动 终 





。 强制 终止 

有 些 工作 方式 中 ， 计 数 器 是 重复 计数 的 ， 当 计时 到 期 (计数 值 为 0) 后 ， 减 法 计数 器 又 会 重新 把 计数 初 值 寄 
存 器 中 的 值 重新 载 入 ,继续 下 一 轮 计数 ， 比 如 工作 方式 2 和 工作 方式 3 都 是 采用 此 方式 计数 ， 此 方式 常见 于 需要 
周期 性 发 信号 的 场合 。 对 于 采用 此 类 循环 计数 工作 方式 的 计数 器 ， 只 能 通过 外 加 控制 信号 来 将 其 计数 过 程 终止 ， 
办 法 是 破坏 启动 计数 的 条 件 : 将 GATE 置 为 0 即 可 。 































































































































































































。 自动 终止 

有 些 工 作 方式 中 ， 计 数 器 是 单 次 计数 ， 只 要 定时 《计数 ) 一 到 期 就 停止 ， 不 再 进行 下 一 轮 计 数 ， 所 以 
计数 过 程 自 然 就 自动 终止 了 。 比 如 工作 方式 0、1、4、5 都 是 单 次 计数 ， 完 成 后 自动 终止 。 如 果 想 在 计数 
过 程 中 将 其 终止 怎么 做 呢 ? 还 是 用 那个 简单 粗暴 可 依赖 的 方法 ， 将 GATE 置 0。 
























































下 面 给 大 伙 简 单 说 下 计数 器 的 六 种 工作 方式 。 

1. 方式 0: 计数 结束 中 断 方式 (Interrupt on Terminal Count) 

方式 0 也 称 为 “计数 结束 输出 正 跳 变 信号 ”方式 ， 其 典型 应 用 是 作为 事件 计数 器 。 

在 方式 0 时, 对 8253 任意 计数 器 通道 写 入 控制 字 ， 都 会 使 该 计数 器 通道 的 OUT 变 为 低 电 平 ， 直 到 计 

数值 为 0。 当 GATE 为 高 电 平 (条 件 1 )， 并 且 计 数 初 值 已 经 被 写 入 计数 器 (条 件 2) 后 ， 注 意 ， 此 时 计数 

器 并 未 开始 计数 ， 大 伙 儿 知道 ， 计 数 器 有 自己 的 工作 节奏 ， 就 是 时 钟 信号 CLK。 计 数 工 作 会 在 下 一 个 时 

钟 信号 的 下 降 沿 开始 。 方 式 0 下 的 计数 工作 由 软件 启动 ， 故 当 处 理 器 用 out 指令 将 计数 初 值 写 入 计数 器 ， 

然后 到 计数 器 开始 减 1， 这 之 间 有 一 个 时 钟 脉冲 的 延迟 。 之 后 ，CLK 引 脚 每 次 收 到 一 个 脉冲 信号 ,减法 计 

数 器 就 会 将 计数 值 减 1。 
当 计 数值 递减 为 0 时 ，OUT 引 脚 由 低 电 平 变 为 高 电 平 ， 这 是 个 由 低 到 高 的 正 跳 变 信号 ， 此 信号 可 以 

接 在 中 断代 理 蕊 片 8259A 的 中 断 引 脚 IR0 上 ， 所 以 此 信号 可 以 用 来 向 处 理 器 发 出 中 断 ， 故 称 为 计数 结束 

“中 断 ” 方 式 。 

方式 0 进行 计数 时 ， 计 数 器 只 是 单 次 计数 ， 计 数 为 0 时 ， 并 不 会 再 将 计数 初 值 寄存 器 中 的 值 重新 载 入 。 此 方 

， 门 控 信 号 GATE 用 于 人 允许 或 禁止 计数 ， 当 GATE=1 时 人 允许 计数 ，GATE=0 时 则 禁止 计数 。 

2. 方式 1: 硬件 可 重 触发 单 稳 方 式 〈Hardware Retriggerable One-Shot ) 

方式 1 的 典型 应 用 是 作为 可 编程 单 稳 态 触发 器 ， 其 触发 信号 是 GATE， 这 是 由 硬件 来 控制 的 ， 故 此 方 

式 称 为 硬件 可 重 触发 单 稳 方 式 。 

































































































































































































































































































































































式 
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在 方式 1 下 ， 





























型 















































BB 平 , 还 是 低 
这 是 由 硬件 启动 














EF 理 器 将 计数 初 值 写 入 计数 器 后 ，OUT 引 脚 变 为 高 电 了 
BE 平 ， 计数 器 都 不 会 局 动 计数 , 而 是 等 待 外 部 门 控 脉 冲 信 号 GATE 由 低 到 高 的 上 升 沿 出 现 ， 
的 , 之 后 才 会 在 下 一 个 时 钟 信号 CLK 的 下 降 沿 开 





昌平 。 此 后 ， 每 
OUT 引 脚 的 


当 CLK 引 脚 收 到 一 个 时 钟 脉 六 
“状态 一 直 保 持 到 计数 为 0， 当 计数 为 0 时 ，OUT 引 脚 产 4 
3. 方式 2: 比率 发 生 器 (Rate Generator) 
方式 2 是 比率 发 生 器 方式 ， 即 按照 比率 来 分 频 ， 其 : 
们 的 应 用 中 ， 也 将 选用 | 
分 频 器 的 作用 是 把 输 
过 里 面 各 种 齿轮 相互 本 
























































b 合 ， 另 一 六 输出 的 转 如 就 很 慢 。 举 个 生活 














工人 A Bs 车 前 |， 了 

















为 了 方便 统计 ， 每 当 工 人 A 











物 ， 一 分 钟 搬 10 次 ， 工 
件 ， 一 分 钟 搬 $ 次 。 此 过 程 ! 
它 将 工人 C 的 搬 货 频率 降低 。 工 
































当 于 输入 脉 六 
当 于 输出 信号 OUT， 了 





























当 处 里 器 把 挖 甫 





1 时 ，OUT 端 


数 为 0 时 ，OUT 端 
周而复始 地 循环 庄 

此 方式 的 特 点 是 计数 器 计数 到 达 
工作 。 当 计数 初 值 为 N 时 ,每 N 个 CLK 
OUT 的 关系 是 N: 1， 故 其 作用 就 是 个 分 频 器 。 综 











CLK 和 输出 信号 



















































































信号 时 ， 在 3 





局 






















































































[人 C 负责 把 货 ee 
， 他 才 通 知 工人 B 来 往 车 上 搬 。 候 
货物 计数 ， 只 要 一 满 2 件 他 就 通知 工人 C1 











上 字 写 入 到 计数 器 后 ，OUT 端 变 为 高 电 平 。 
数 初 值 写 入 后 ， 在 下 一 个 CLK 时 钟 脉冲 的 下 降 沿 ， 计 数 器 开始 


























自动 重新 载 入 计数 初 值 , 不 需要 重 
时 钟 脉冲 ， 








4. 方式 3: 方 波 发 生 器 (Square Wave Generator ) 


计数 器 在 方式 3 下 工作 ， 就 相当 了 




















当 处 理 器 把 控 和 于 
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| 字 写 入 到 计数 器 后 ， 
计数 初 值 写 入 计数 器 后 的 下 一 个 CLK 时 钟 脉 六 
有 有数 ， 在 每 一 个 CLK 时 钊 






































下 








高 电 平 变 为 低 电 















































0 时 ，OUT 端 又 会 变 成 高 电 

如 果 计 数 初 值 为 奇数 ， 
所 以 在 之 后 的 每 个 时 钟 脉冲 ， 
， 同 时 动人 计数 初 值 寄存 器 中 载 入 计数 初 值 开始 下 一 轮 计数 。 注意 ， Ca 轮 计数 中 ， 第 一 个 时 钟 脉冲 
将 计数 值 减 2。 当 计数 值 又 减 为 0 


























会 将 计数 值 减 3， 这 样 剩 下 
































一 个 方 波 发 生 器 。 
OUT 端 输出 























并 且 OUT 端 为 高 





























时 ，OUT 端 又 重 
方式 3 和 方式 2 类 化 
5. 方式 4: 各 
当 处 理 器 把 控制 字 乞 
初 值 写 入 计数 器 后 的 下 一 个 CLK 时 钟 脉 ; 
当 计 数值 为 1 时 ，OUT 端 
又 回 到 高 电 平 
新 写 入 计数 初 值 下 























E 





Im 
a 





新 回 到 高 昌平 同时 











也 为 偶数 ， 之 后 的 每 个 时 钟 及 
自 动 从 计数 初 值 寄存 器 中 埠 入 计数 初 人 





， 都 是 软件 启动 ， 并 且 






































牛 触 发 选 通 (Software Triggered Strobe ) 




















不 过 ， 无 论 此 时 GATE 是 




















始 启动 计数 ,同时 会 将 OUT 引 脚 变 为 低 
征 沿 ， 减 法 计数 器 便 开始 对 计数 值 减 1。 
E 由 低 到 高 的 正 跳 变 信号 。 








型 应 用 就 是 分 频 器 ， 故 也 称 为 分 频 器 方式 。 在 我 
ee 
的 输出 频率 ， 其 ee ， 本 来 在 一 端 接 入 的 转速 很 快 ， 经 


用 器 原理 , 比如 往 货 车 上 装 货物 ， 














[人 了 B 负责 统计 搬 上 和 车 的 货物 总 数 ， 


役 如 工人 A 一 次 从 仓库 搬 1 件 货 





股 货 ， 也 就 是 说 工人 C 每 次 搬 2 
信号 CLK， 其 频率 是 10 次 分钟， 工人 B 相当 于 分 频 器 ， 

其 频率 是 5 次 /分 钟 。 这 就 是 分 频 的 道理 。 
在 GATE 为 高 电 平 的 前 提 下 ， 处 理 器 将 计 
这 属于 软件 启动 。 当 计数 值 为 
昌平 的 状态 一 直到 计数 为 0， 也 就 是 持续 一 个 CLK 周期 。 当 计 
司 时 ， 计 数 初 值 又 会 被 载 入 减法 计数 器 ， 重 新 开始 下 一 轮 计 数 ， 从 此 

































































新 写 入 控制 字 或 计数 初 值 便 能 连续 














高 电 3 








计数 值 均 减 2， 当 计数 值 为 0 时 ，OUT 端 
重新 载 入 计数 初 值 ， 开 始 下 一 轮 计数 。 在 新 的 一 轮 计 数 中 ， 当 计数 值 再 次 为 
， 同 时 再 次 载 入 计数 初 值 ， 又 开始 一 
昌平， 则 在 第 一 个 时 有 的 下 隆 泊 失 计数 1， 这 样 剩 下 的 
数值 变 为 0 时 ，OUT 端 又 变 成 低 电 











计数 值 都 被 减 2。 
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OUT 端 都 是 











就 会 在 OUT 端 产生 一 个 输出 信号 ， 这 样 一 来 ， 输 入 信号 
述 , 方式 2 主要 用 在 循环 分 频 的 场合 。 




















FF。 在 GATE 为 高 电 平 的 前 提 下 ， 在 处 理 器 把 
FP 的 下 降 沿 ， 计 数 器 开 
脉冲 发 生 时 ， 


























6 新 的 计数 。 























开始 又 一 轮 循环 计数 。 





期 性 脉冲 ， 用 在 循环 计数 的 场合 。 























，OUT 端 变 成 高 电 平 。 
的 下 降 沿 
日 高 电 平 变 为 低 上 
， 此 时 计数 器 停止 计数 。 此 方式 和 







































































6. 方式 $， 硬 从 
此 方式 与 方式 4 类 似 ， 莉 


352 






























































F} 触 发 选 通 (Hardware Triggered Strobe) 
































高 电 平 的 前 提 下 ， 在 处 理 器 把 计数 
， 计 数 器 开始 计数 ， 所 以 是 软件 启动 。 
有 平 ， 当 计数 值 为 0， 即 持续 一 个 CLK 时 钟 周期 后 ，OUT 
方式 0 类 似 ， 都 是 单 次 计数 ， 只 有 在 重新 写 入 控制 字 或 





























是 一 次 计数 ， 区 别 是 计数 启动 的 方式 不 同 ， 方 式 5 是 硬件 启动 。 


方式 5 中 ， 当 处 理 器 把 控制 字 写 入 到 计数 器 后 ，OUT 端 变 成 高 电 平 。 处 理 器 把 计数 初 值 写 入 计数 器 后 














数 工作 要 等 到 外 部 门 控 脉 冲 信号 GATE 


























当 计数 值 为 1 时 ，OUT 端 由 高 
变 为 高 电 平 ， 同 时 停止 计数 。 














各 工作 模式 就 介绍 到 这 啦 ， 可 能 您 感到 有 点 迷糊 ， 不 过 请 大 伙 儿 放心 , 嘎 











时 候 看 看 表 7-6 的 总 结 就 行 了 。 
表 7-6 


平 变 为 低 电 3 








低 到 高 的 上 升 沿 出 现时 才 开启 ， 这 是 
F， 保持 一 个 CLK 周 























I 硬件 启动 的 。 

















期 |， 









































8253 工作 模式 总 结 





ez 


即 计数 值 变 为 0 时 ，OUT 端 又 


们 用 不 着 了 解 大 细致 ， 用 的 



































































































































工作 方式 计数 启动 方式 终止 计数 方法 ns 特 点 
(自动 重 装 初 值 ) 
0 写 入 计数 初 值 〈 软 件 ) GATE=0 否 来 实现 定时 器 或 对 外 部 事件 计数 
1 GATE 上 升 党 (硬件 ) a 否 来 产生 单 稳 脉 冲 
2 写 入 计数 初 值 (软件 ) GATE=0 是 来 实现 对 时 钟 脉冲 CLK 的 N 分 频 
3 写 入 计数 初 值 (软件 ) ”| GATE=0 是 es 来 实现 对 时 钟 脉 证 
4 写 入 计数 初 值 〈 软 件 ) GATE=0 否 一 
5 GATE 上 升 沿 《硬件 ) 否 二 
当 控制 字 写 入 计数 后 ， 在 方式 0 中 ， 计 数 器 的 OUT 端 都 会 变 成 低 电 平 ， 而 在 另外 5 个 工作 方式 中 ， 计 数 器 的 OUT 端 都 会 变 成 高 














YIZ 
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坦 
责 产生 
断 信号 呢 ? 






































说 ， 我 们 介绍 8253 的 目的 就 是 为 了 提升 时 钟 中 断 信 号 的 频率 ， 而 时 钟 中 断 信 号 是 





的 。 在 介绍 完 6 种 工作 方式 后 ， 不 知道 大 伙 儿 是 否 


























己 能 解决 这 个 问题 : 
































其 实 这 是 利用 了 分 频 器 的 原理 ， 将 


是 时 钟 

















高 频 的 输入 脉 ; 





断 信 号 。 这 与 计数 器 的 工作 方式 有 关 ， 您 已 经 入 


! 信 号 CLK 转换 为 低频 的 输 























计数 器 0 负 














计数 器 0 多 久 会 发 




















性 地 发 出 中 断 信号 ， 假 设计 数 器 0 工作 在 方式 2 下， 下 





CLK 引 脚 上 的 时 钟 脉冲 信号 是 计数 器 的 了 
每 发 生 一 次 时 钟 脉冲 


一 秒 内 会 有 1193180 次 脉冲 信号 。 


























二 


言 号 用 于 向 处 理 器 发 出 时 钟 中 断 信 和 号。 












































一 秒 内 会 发 出 多 少 个 输 + 











是 取决 于 计数 初始 值 是 多 少 。 











默认 情况 下 计数 器 0 的 初 值 寄存 器 信 


[ 作 频 率 节拍 ， 

















音 号 ， 计 










































































信号， 此 输出 


个 : 





出 信号 OUT， 此 信号 就 
If 道 了 ， 并 不 是 所 有 的 工作 方式 都 能 让 计数 器 周期 
而 介绍 下 中 断 信 号 产生 的 原理 。 
个 计数 器 的 工作 频率 均 是 1.19318MHz， 即 
数 器 就 会 将 计数 值 减 1， 也 就 是 1 秒 内 会 
将 计数 值 减 1193180 次 1。 当 计数 值 递减 为 0 时 ， 计 数 器 就 会 通过 OUT 引 脚 发 出 一 个 输 昌 
信号 ， 取决 于 计数 值 变 成 0 的 速度 ， 也 就 
是 0， 即 表示 65536。 计 数值 从 65536 





变 成 0 需要 修改 65536 次 ， 所 以 ， 一 秒 内 发 输出 信号 的 次 数 为 1193180/65536， 约 等 于 18.206， 即 一 秒 内 
发 的 输出 信号 次 数 为 18.206 次 ， 时 钟 中 断 信 号 的 频率 为 18.206Hz。1000 毫秒 / (1193180/65536) 约 等 于 




















54.925， 这 样 相当 于 每 隅 55 
输出 字符 为 
目的 就 是 重 

总 结 一 下 ， 因为 : 



































也 








2 秒 就 发 一 次 中 断 。 这 也 解释 了 前 
十 么 显得 有 些 慢 ， 当 然 大 伙 不 做 实验 的 话 是 看 不 到 的 ,我 当 
新 设 定 中 断 发 生 的 频率 ， 让 中 断 发 生得 快 一 些 ， 后 面 有 








而 所 









































一 











的 两 个 中 断 例子 中 ， 中 断 处 
时 没 说 而 已 。 不 过 没关系 ， 本 节 的 
3 们 大 展 身手 的 机 会 。 











1193180/ 计 数 器 0 的 初始 计数 值 = 中 断 信 号 的 频率 


所 以 : 


1193180/ 中 断 信 号 的 频率 = 计数 器 0 的 初始 计数 值 
很 简单 是 吧 ? 只 是 除数 和 商 换 了 个 位 置 ， 


7.7.5 8253 初始 
让 8253 开始 工 


上 步骤 
























































会 儿 


芷 的 方法 很 简单 ， 只 要 我 们 通过 控制 字 选 择 


们 就 用 到 这 个 结论 啦 。 

















j 哪 个 计数 器 ， 

















再 为 该 计数 器 写 入 计数 初 值 就 行 了 。 下 












































用 我 们 说 下 初始 化 8253 的 步 又。 














里 程 月 














# 定 该 计数 器 的 控制 模式 ， 
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1. 往 控制 字 寄存 器 端口 0x43 中 写 入 控制 字 
用 控制 字 为 指定 使 用 的 计数 器 设置 控制 模式 ， 控 制 模式 包括 该 计数 器 工作 时 采用 的 工作 方式 、 读 写 格 
式 及 数 制 。 
2. 在 所 指定 使 用 的 计数 器 端口 中 写 入 计数 初 值 
计数 初 值 要 写 入 所 使 用 的 计数 器 所 在 的 端口 ， 即 若 使 用 计数 器 0， 就 要 把 计数 初 值 往 0x40 端口 写 入 ， 
若 使 用 的 是 计数 器 1， 就 要 把 计数 初 值 往 0x41 端口 号 入 ， 依 次 类 推 。 计 数 初 值 寄存 器 是 16 位 ， 高 8 位 和 
低 8 位 可 单独 使 用 ， 所 以 初 值 是 8 位 或 16 位 皆 可 。 若 初 值 是 8 位 ， 直 接 往 计数 器 端口 写 入 即 可 。 若 初 值 
为 16 位 ， 必 须 分 两 次 来 号 入 ， 先 写 低 8 位 ， 再 写 高 8 位 。 
好 啦 ， 至 此 8253 中 咱们 用 到 的 部 分 已 经 介绍 完了 ， 下 面 要 来 点 真 格 的 了 ， 你 懂 的 。 


提高 时 钟 中 断 的 频率 ， 让 中 断 来 得 更 猛烈 一 些 


坦白 说 ， 我 们 学 习 8253 的 目的 就 是 为 了 给 IRQ0 引 脚 上 的 时 钟 中 断 信 号 “提速 ” 使 其 发 出 的 中 断 信 
号 频率 快 一 些 。 它 默认 的 频率 是 18.206Hz， 即 一 秒 内 大 约 发 出 18 次 中 断 信 号 。 我 们 嫌 它 有 点 慢 ， 本 节 我 
们 将 对 8253 编程 ， 使 时 钟 一 秒 内 发 100 次 中 断 信 号 ， 即 中 断 信 号 频率 为 100Hz。 

在 开始 之 前 ， 我 们 先 梳 理 下 要 做 的 工作 。 

。 IRQ0 引 脚 上 的 时 钟 中 断 信 号 频率 是 由 8253 的 计数 器 0 设置 的 ， 我 们 要 使 用 计数 器 0。 

e 时 钟 发 出 的 中 断 信 号 不 能 只 发 一 次 , 必须 是 周期 性 发 出 的 , 也 就 是 我 们 要 采取 循环 计数 的 工作 方式 ， 
可 选 的 工作 方式 为 方式 2 和 方式 3， 这 里 咱们 就 选择 方式 2， 这 是 标准 的 分 频 方式 ， 这 正 是 咱们 所 需要 的 。 

。 计数 器 发 出 输出 信号 的 频率 是 由 计数 初 值 决定 的 ， 所 以 我 们 要 为 计数 器 0 赋予 合适 的 计数 初 值 。 

好 ， 综 上 所 述 ， 我 们 的 结论 是 : 编程 8253， 通 过 控制 字 指 定 使 用 计数 器 0， 工 作 方式 咱们 选择 方式 2， 即 
比率 发 生 器 ， 并 且 为 计数 器 0 赋予 合适 的 计数 初 值 。 这 个 初 值 是 多 少 呢 ? 还 记得 前 面 咱们 所 说 的 公式 吧 ? 
1193180/ 中 断 信号 的 频率 = 计数 器 0 的 初始 计数 值 

咱们 要 设置 的 中 断 信 号 的 频率 为 100Hz, 直接 代入 公式 即 可 ,计数 器 0 的 初始 计数 值 = 1193180/100 约 
等 于 11932。11932 就 是 计数 器 0 的 计数 初 值 。 

好 啦 ， 这 一 刻 等 得 太 久 了 ， 见 代码 7-11。 

代码 7-11 (project/c7/c/device/timer.c ) 


































































































































































































































































































































































































































































































































































































1 #include "timer.h" 

2 #include "io.h" 

3 #include "print.h" 

4 

5 #define IRQO FREQUENCY 100 

6 #define INPUT FREQUENCY 1193180 
7 #define COUNTERO VALUE INPUT FREQUENCY / IRQO FREQUENCY 
8 #define CONTRERO PORT 0x40 

9 #define COUNTERO NO 0 

0 #define COUNTER MODE 2 

1 #define READ WRITE LATCH 3 

12 #define PIT CONTROL PORT 0x43 

13 

4 





/* 把 操作 的 计数 器 counter_no、 读 写 锁 属性 rwl1、 计 数 器 模式 
counter_mode 写 入 模式 控制 寄存 器 并 赋予 初始 值 counter value */ 

15 static void frequency set (uint8 t counter port, \ 

16 uint8 t counter no \ 

7 

8 











uint8 t rwl, \ 
uint8 t counter mode, \ 









































19 uint16 七 counter value) { 

20 /* 往 控 制 字 寄存 器 端口 0x43 中 写 入 控制 字 */ 

21 outb (PIT_ CONTROL PORT, \ 

(uint8 t) (counter no << 6 | rwl << 4 | counter mode << 1)); 
22 /* 先 写 入 counter value 的 低 8 位 */ 

23 outb (counter port, (uint8 t)counter value); 

24 /* 再 写 入 counter value 的 高 8 位 */ 

25 outb (counter port, (uint8 t)counter Value >> 8); 


354 





28 /* 初始 化 PIT8253 */ 
29 void timer init() { 
30 put str("timer init start\n"); 











31 /* 设置 8253 的 定时 周期 ， 也 就 是 发 中 断 的 周 其 











说 fredquency_set (CONTRERO PORT, \ 
COUNTERO NO, \ 
READ WRITE LATCH,\ 
COUNTER MODE, \ 
COUNTERO VALUE); 

33 put_str("timer init done\n"); 

34 } 











您 看 ， 前 面 介 绍 的 基础 还 是 亚 多 的 ， 这 里 的 实际 代码 却 非常 少 。 
却 那么 少 ， 真 是 浪费 时 间 …… 您 的 心情 我 明白 ， 但 我 在 这 得 和 大 伙 儿 说 点 掏 心 窝 子 的 话 。 完 成 一 本 书 其 实 很 






































SC 









































容易 ， 可 是 把 书写 好 并 不 容易 。 知 识 是 有 相关 性 的 ， 


容 , 我 不 能 把 所 有 人 都 当成 各 方 盏 


pA 























导 努 力 让 大 多 数 人 明白 我 在 说 什么 。 写 书 确实 很 累 ， 














也 许 有 同学 会 抱怨 ， 讲 了 那么 多 ,用 的 






























































当 学 习 某 一 方面 的 知识 时 ， 必 然 要 涉及 到 周边 相关 的 内 
i 都 精通 的 学 者 ,我 必须 得 站 在 那些 基础 相对 薄弱 的 同学 的 立场 上 思考 才 行 ， 
有 是 为 了 写 好 这 本 书 ， 累 点 我 也 愿意 ， 这 就 是 我 写 书 的 良 





























心 。 明 知 很 昧 也 要 去 做 ， 此 时 我 的 心情 非常 符合 老 罗 的 那 句 话 : 天 生 骄 做 。 让 大 伙 儿 见笑 了 ， 咱 们 继续 。 


设备 代码 都 会 放 在 此 目录 中 。 


3 





我 们 把 初始 化 8253 的 代码 写 在 了 文件 tmerc 










































































， 它 在 device 目录 下 ， 这 是 新 建 的 目录 ， 我 们 今后 的 


8253 的 设置 是 在 timer init 函数 中 完成 的 ， 不 过 ， 最 终 做 初始 化 工作 的 是 frequency_set 函数 ， 它 在 第 
2 行 被 调用 ， 其 定义 在 第 1$ 行 ， 此 函数 定义 了 五 个 参数 。 






































(1) counter_port 是 计数 器 的 端口 号 ， 用 来 指定 初 
(2) counter_no 用 来 在 控制 字 中 指定 所 使 用 的 计数 器 号 码 ， 对 应 于 控 人 

















(3 ) rwl 用 来 设置 计数 器 的 读 / 写 / 锁 存 方式 ， 对 应 于 控 人 















































值 counter_value 的 目的 端口 号 。 
出 字 中 的 SC1 和 SC2 位 。 
出 字 中 的 RW1 和 RWo0 位 。 


(4) counter mode 用 来 设置 计数 器 的 工作 方式 ， 对 应 于 控制 字 中 的 M2 一 M0 位 。 























(5) counter value 用 来 设置 计数 器 的 计数 初 值 ， 














上 于 此 值 是 16 位 ， 所 以 我 们 用 






































此 函数 的 功能 是 把 操作 的 计数 器 counter_no、 





式 控 M 






































IRQ0_FREQUENCY 是 我 们 要 设置 的 时 钟 中 断 的 频率 ， 我 们 要 将 它 设 为 100Hz。 
INPUT_FREQUENCY 是 计数 器 0 的 工作 脉冲 信号 频率 ， 前 面 介 绍 过 。 


宏 来 计算 啦 ， 所 以 COUNTER0 VALUE 的 
CONTRER0_ PORT 是 计数 器 0 的 端口 号 0x40。 


形 




















COUNTER0_VALUE 是 计数 器 0 的 计数 初 值 ， 这 是 由 之 前 的 公式 算出 来 的 ， 当 然 了 咱们 为 医 






































了 uint16 t 来 定义 它 。 

读 写 锁 属 性 rwl、 计 数 器 工作 模式 counter mode 写 入 模 
站 寄存 器 并 赋予 计数 器 的 计数 初 值 为 counter_value。 
frequency_set 是 在 第 32 行 调用 的 ， 使 用 的 实 参 都 是 一 些 预 4 





t 定 义 好 的 宏 ， 在 timer.c 的 文件 开头 是 这 


























| 
上 
四 
小 



































值 为 INPUT_FREQUENCY /IRQO FREQUENCY。 


COUNTER0_NO 是 用 在 控制 字 中 选择 计数 器 的 号 码 ， 其 值 为 0， 代表 计数 器 0， 它 将 被 赋值 给 函数 的 











很 简 和 
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攻 参 counter no。 











COUNTER_MODE 是 工作 模式 的 代码 ,其 值 为 2， 即 方式 2， 这 是 我 们 选择 的 工作 方式 : 比率 发 生 器 。 








READ WRITE LATCH 是 读 写 方式 ， 其 值 为 3， 



































位 和 高 8 位 分 别 写 入 计数 器 0 的 端口 。 


第 20 一 25 行 是 frequency_set 函数 中 初始 化 8253 的 步骤 ， 先 写 入 控制 字 ， 











疆 


结合 图 7-47， 这 表示 先 读 写 低 8 位 ， 再 读 写 高 8 位 。 原 因 








和 ， 我 们 要 写 入 的 初 值 是 16 位 ， 按 照 8253 的 初始 化 步骤 ， 必 须 先 写 低 8 位 ， 后 写 高 8 位 。 
PIT_CONTROL PORT 是 控制 字 寄存 器 的 端口 。 

















将 16 位 的 计数 初 值 的 低 











咽 ，timer.c 就 说 完 啦 ， 接 下 来 再 把 timer_init 函数 加 在 文件 init.c 中 就 好 啦 ， 如 代码 7-12 所 示 。 


代码 7-12 (proj 
1 #include "init .hn 
2 #include "print.h" 








ect/c7/c/kernel/init.c ) 
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#include "interzupt .hn 
#include "../device/timer.h" // 用 相对 路 径 演示 头 文件 包含 




















号 

4 

5 

6 /* 负 责 初始 化 所 有 模块 */ 
7 void init all() { 
8 
9 
0 
1 





but str("init aLlIN\Nn™.)y 
idt init(); // 初始 化 中 断 
timer init(); // 初始 化 PIT 





} 

















大 伙 儿 看 到 了 ，timer init 函数 加 在 了 第 10 行 ， 这 样 在 main.c 中 调用 init_all 时 就 会 完成 PIT8253 的 
初始 化 。 

另外 ， 我 在 第 4 行 中 包含 头 文件 timer.h 是 用 相对 路 径 的 方式 ， 这 只 是 为 了 演示 用 相对 路 径 包 括 文件 
也 是 没 问题 的 ， 并 不 是 一 定 得 #include "timerh" 才 行 。 像 前 三 行 没 有 用 相对 路 径 的 方式 ， 是 因为 在 编译 时 
我 们 用 了 -I 来 指定 头 文件 目录 。 以 后 咱们 不 再 用 相对 路 径 的 形式 了 ， 仅 此 演示 一 次 。 

文件 都 准备 齐 了 ， 编 译 链接 ， 这 里 只 增加 了 timer.c 文件 ， 其 他 文件 编译 及 链接 方式 不 变 。 编 译 、 链 
接 、 写 入 bochs 磁盘 过 程 如 下 。 

/* 编译 c 程序 ,生成 目标 文件 */ 

gcc -I lib/kernel -c -o build/timer.o device/timer.c 

gcc -I lib/kernel/ -I lib/ -I kernel/ -c -fno-builtin -o build/main.o kernel/main.c 

gcc -I lib/kernel/ -I lib/ -I kernel/ -c -fno-builtin -o build/init.o kernel/init.c 


gcc -I lib/kernel/ -I lib/ -I kernel/ -c -fno-builtin -o build/interrupt.o \ 
kernel/interrupt.c 














kr 





a 
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/* 编译 汇编 程序 , 生成 目标 文件 */ 
nasm -f elf -o build/kernel.o kernel/kernel.s 
nasm -f elf -o build/print.o lib/kernel/print.s 









































/* 链接 所 有 目标 文件 , 在 build 目录 下 生成 kernel.bin */ 

ld -Ttext 0xc0001500 -e main -o build/kernel.bin \ 
build/main.o build/init.o build/interrupt.o \ 
build/print.o build/kernel.o build/timer.o 





























/xxxx 将 kernel .bin 用 dd 命令 写 入 虚拟 机 磁盘 ， 

of 指定 的 是 您 机 器 上 实际 虚拟 磁盘 路 径 x***/ 

dd if=build/kernel.bin of=/your path/bochs/hd60M.img \ 
bs=512 count=200 seek=9 conv=notrunc 


在 bochs 中 运行 后 ， 结 果 如 图 7-48 所 示 。 


























IT| Bochs x86 emulator 


nit done 
done 








A 图 7-48 中断 频率 为 100Hz 


虽然 图 上 看 不 出 中 断 频 率 增加 了 ， 但 我 这 明显 感觉 到 快 了 ， 大 伙 儿 有 机 会 试 试 。 
本 章 介 绍 了 有 关中 断 的 内 容 ， 对 于 咱们 来 说 已 经 够 用 了 ， 整 个 章节 到 这 就 结束 了 。 
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第 8 董 内 存 管 理 系统 


全 DSS 简介 


随 着 文件 越 来 越 多 ， 咀 们 要 编译 的 文件 也 越 来 越 多 ， 每 次 都 要 手动 逐个 编译 ， 然 后 再 手动 链接 到 
一 起 ， 有 没有 觉得 好 麻烦 。 在 上 一 章 结 尾 咱 们 增加 了 timerc 后 ， 要 用 gcc 编译 4 个 c 文件 ， 用 nasm 
编译 2 个 汇编 文件 ， 然 后 再 通过 1d 命令 将 目标 文件 链接 起 来 ， 通 过 dd 命令 写 入 ， 这 些 够 麻烦 的 。 俗 
话说 ， 工 欲 善 其 事 ， 必 先 利 其 器 ， 没 有 好 的 编译 工具 咱们 怎么 能 把 精力 放 在 编码 上 ? 考虑 再 三 ， 还 是 
花 点 时 间 给 大 家 介绍 一 下 makefile， 它 是 Linux 下 编译 大 型 程序 的 工具 ， 有 了 它 ， 模 块 再 多 咱们 也 不 
会 嫌 麻 烦 。 


8.1.1 makefile 是 什么 


通常 一 个 大 型 程序 是 由 多 个 程序 模块 文件 构成 的 , 按照 其 功能 划分 , 模块 文件 会 分 布 在 不 同 的 目录 中 。 
模块 文件 之 间 有 包含 头 文件 、 调 用 函数 的 情况 ， 它 们 之 间 存 在 依赖 关系 。 大 多 数 情况 下 ， 我 们 编写 程序 只 
是 修改 了 某 些 文件 ， 肯 定 不 是 同时 更 新 所 有 文件 ， 按 理 说 只 要 把 那些 有 过 改动 的 文件 ， 并 且 依 赖 于 这 些 文 
件 的 相关 文件 编译 即 可 ， 用 不 着 编译 全 部 文件 。 如 果 编 译 所 有 文件 的 话 ， 对 于 上 千 万 行 的 大 型 程序 ， 通 党 
要 编译 十 几 个 小 时 不 止 。 这 让 我 想起 了 曾经 编译 全 部 文件 的 情景 ， 下 班 前 点 一 下 Visual C++ 的 rebuild all 
按钮 ， 第 二 天 早上 来 上 班 的 时 候 再 看 编译 结果 。 显 然 ， 全 部 编译 的 时 间 成 本 还 是 蛮 大 的 ， 最 好 还 是 有 针对 
性 的 编译 部 分 文件 。 因 此 ， 我 们 要 知道 哪些 文件 之 间 存 在 依赖 ， 这 样 当 某 个 文件 发 生变 化 时 ， 我 们 才能 找 
出 那些 受 影响 的 文件 ， 并 且 只 编译 它们 。 

既然 编译 全 部 文件 过 于 耗 时 ， 那 么 问题 来 了 ， 有 没有 办 法 自动 针对 那些 有 过 改动 的 文件 编译 呢 ， 这 样 不 
就 高 效 了 吗 ? 这 个 问题 实际 上 分 为 两 个 小 问题 。 

(1) 目标 文件 依赖 哪些 文件 

(2) 依赖 的 文件 是 否 更 新 ? 

解决 了 这 2 个 问题 ， 自 然 就 可 以 找 了 相关 的 部 分 文件 单独 编译 了 。 

对 于 第 2 个 问题 , 倒是 可 以 根据 文件 修改 时 间 来 解决 ， 只 要 其 修改 时 间 比 目标 文件 要 新 , 就 认为 该 文件 
有 过 更 新 。 
对 于 第 1 个 问题 ， 如 果 光 靠 人 工 来 维护 文件 间 的 依赖 关系 ， 当 程序 规模 不 大 时 还 好 ， 若 是 模块 很 多 
的 时 候 ， 这 些 依赖 关系 简直 会 让 人 发 狂 ， 为 了 省 心 ， 我 宁可 编译 所 有 文件 ， 有 时 候 只 好 这 么 任性 。 

好 在 万 能 的 Linux 提供 了 make 命令 ， 它 可 以 帮助 我 们 自动 找 出 变更 的 文件 ， 并 根据 依赖 关系 ， 找 出 
受 变更 文件 影响 的 其 他 相关 文件 ， 然 后 对 这 些 文件 按照 规则 进行 单独 处 理 ， 此 处 的 规则 一 般 都 是 指 编译 ， 
如 调用 gcc， 但 也 可 以 是 删除 文件 等 其 他 行为 。 

上 述 的 规则 、 依 赖 关 系 是 定义 在 一 个 名 叫 makefile 的 文件 中 的 ， 一 看 此 文件 名 便 知 道 它 是 为 make 命令 准备 
的 ，makefile 文件 是 make 程序 的 搭档 ， 这 两 哥们 儿 的 使 命 主要 就 是 : 发 现 某 个 文件 更 新 后 ， 只 编译 该 文件 和 受 
该 文件 影响 的 相关 文件 ， 其 他 不 受 影响 的 文件 不 重新 编译 ， 从 而 提高 了 编译 效率 。 

make 命令 和 makefile 文件 ， 它 们 之 间 是 什么 关系 呢 ? 

这 关系 类 似 脚 本 解析 器 和 脚本 语言 文件 ， 如 bin/python 和 .py 文件 、bin/php 及 .php 文件 等 。makefile 相当 于 
脚本 语言 文件 ， 其 中 所 写 的 内 容 必须 遵循 make 所 定义 的 语法 ， 写 makefile 相当 于 在 写 脚本 程序 。make 
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程序 是 文件 makefile 的 解析 器 ， 





关键 字 包含 其 他 makefile。 
这 里 给 大 伙 儿 强调 一 
根据 依赖 关系 找 出 受 影 响 的 文件 
译 ， 也 有 情况 是 执行 rm 
他 命令 。 总 之 ， 通 过 make 和 makefile 来 做 什么 ， 这 是 由 您 来 决定 的 。 
说 到 这 您 也 明白 了 ， 其 实 make 程序 只 是 在 makefile : 

为 make 就 是 在 shell | 


且 
数 情况 是 调用 























对 这 些 文件 进行 处 理 。 


Prd 
[一 
这 











之 后 








定义 了 各 种 关键 
make 程序 解析 makefile 中 的 内 容 ， 从 而 产生 出 不 同 的 行为 。 

















下 











gcc 或 nasm 进行 编 

















大 














都 是 shell 命令 。 





总 疆 


EN 二 口 


: 依赖 关系 是 定义 在 文 
件 以 及 依赖 此 变更 文 伯 








们 要 做 的 就 是 把 makefile 写 好 。 

















能 是 Windows 程序 员 。 




















妃 
全 











删除 系统 文件 ), 这 恰 ' 
想方设法 限制 用 户 ，| 
必须 清楚 地 知道 模块 文件 间 的 依赖 ，> 
程序 “家 ”“ 做 ”程序 “了 
是 1d 链接 命令 ， 大 伙 儿 有 兴趣 自己 了 解 一 





于 Windows 的 易 
因为 Windows 下 的 集成 开发 环境 IDE (如 
这 无 疑 是 个 双 刃 剑 ， 一 方 
开发 人 员 无 法 对 程序 做 到 完全 控 人 
Windows 程序 员 常 常 感到 力不从心 啊 ， 有 木 有 
虽然 Linux 下 编程 相对 来 说 比 Windows 入 





的 相关 文件 ， 然 后 对 所 有 




















性 ， 对 村 


















































户 却 挖 空 


























8.1.2 ”makefile 基本 语法 


坦白 说 ，makefile 的 内 容 真 心 不 少 ， 多 


的 命令 行 参数 就 能 够 领略 一 二 了 。 


小 弟 在 此 














另 一 方 国 














- 国 . 
里 








助 工 具 ， 所 以 大 伙 儿 放心 
先 看 一 下 makefile 的 基本 语法 。 



































然后 执行 事先 在 makefile 中 定义 好 的 命令 规则 。5 





























ez 


子 、 

















语法 结构 、 隙 数 、 误 由 二 至 可 以 用 include 























下 ，make 和 makefile 并 不 是 用 来 多 


下 执行 的 ， 所 以 在 makefile 


坏 昌 
到 尿 











有 译 程序 的 ， 它 只 负责 找 出 哪些 文件 有 变化 ，; 
是 该 命令 规则 大 多 
中 执行 其 









































命令 删除 文件 ， 当 然 也 可 以 在 命令 规则 






































更 新 的 文件 ， 然 后 调用 其 他 命令 
， 位 于 命令 规则 里 的 那些 命令 ， 








找 出 习 


p 些 需要 























牛 makefile 中 ，make 程序 通过 解析 makefile 文件 ， 自 动 找 出 变更 的 文 











响 的 相关 文件 执行 事先 定义 好 的 命令 规则 。 所 以 ， 目 




















9 























FE” 的 机 会 。 


-LE 和 zz 人 日 


月 下 与 从 


也 许 有 同学 会 说 ,我 从 来 没 写 过 makefile， 不 是 也 照样 好 端 端 


Windows 程序 员 来 说 ， 他 们 3 
Visual C++) 
下 确实 简化 了 操作 复杂 度 ， 使 开发 变 得 容易 ， 但 另 一 方面 
央 ， 即 使 有 的 IDE 提供 了 相关 设置 ， 也 不 


门 难 一 点 ， 
丛 是 Linux 的 魅力 。 人 家 Linux 给 


心思 想 绕 过 屏障 ， 哈 哈 ， 





地 写 出 了 程序 吗 ? 那 我 打 断 您 一 下 ， 您 可 


























不 需要 自己 维护 模块 文件 间 的 依赖 关系 ， 
已 经 隐 含 地 帮 我 们 做 了 这 些 。 不 过 对 于 开发 者 来 说 ， 
却 隐 藏 了 内 部 细节 ， 使 
能 彻底 控制 每 个 细节 ， 让 
















































































但 人 家 Linux 给 咱们 完全 的 控制 力 啊 (甚至 允许 
户 彻底 的 权利 , 用 户 反 而 对 其 小 心 呵护 , Windows 
有 点 扯 远 了 。 总 之 ， 要 想 成 为 专业 的 程序 员 ， 就 

































































上 





下 。 


能 够 全 程 把 控 编译 过 程 ，makefile 正 是 为 此 而 生 , 给 
另外 说 一 下 ，Linux 


们 过 下 省 






































下 还 有 控制 力 更 强大 的 链接 脚本 ， 它 的 解释 器 














4 








AP 


容 ， 









































们 

















导 都 可 以 成 衣 了， 您 可 


只 打算 把 makefile 给 大 家 简单 介绍 下 ， 一 方面 
中 若 总 是 插入 一 些 “ 看 似 离 题 ”的 内 
1|， 有 关 makefile 的 全 部 内 容 要 想 写 好 的 话 ， 怎 么 也 得 写 个 一 
makefile 的 专业 资料 ， 我 
就 介绍 什么 ， 我 想 这 也 是 大 伙 儿 期 待 
建议 不 要 从 本 书 中 学 习 , 1 


真是 让 人 很 “恼火 ”。 


以 通过 man make 命令 看 一 下 有 多 少 make 

















的 原因 乍 系 统 » 在 此 过 程 





是 我 们 的 初衷 是 学 习 操 























两 百 页 ， 何 况 网 上 有 大 



































不 如 人 家 详细 ， 所 以 咱们 依然 本 着 “ 够 用 ”的 原则 ， 用 到 了 什么 
的 。 说 实在 的 ， 要 想 把 makefile 的 知识 全 部 学 完 ， 出 于 良知 ， 我 
























































机 











Tab] 节令 


makefile 基本 语法 包括 三 部 分 ， 这 三 部 分 加 在 一 起 称 
(1) 目标 文件 是 指 此 规则 ， 


示 文 件 : 依赖 文件 
公公 


























以 是 个 伪 目 


标 ， 后 面 会 介绍 伪 
(2) 依赖 文件 是 指 要 生成 此 规则 中 的 目 




















个 依赖 文件 的 列表 。 
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想 要 生成 的 文件 ， 可 以 是 .o 结 
标 。 


的 内 容 真 的 是 名 副 其 实 的 简介 ， 只 能 带 您 入 门 。makefile 毕竟 只 是 咱们 的 辅 
， 本 书 一 定 不 会 用 到 复杂 难 懂 的 内 容 。 








为 一 组 规则 ， 下 面 解释 下 各 部 分 的 意义 。 
尾 的 目标 文件 ， 也 可 以 是 可 执行 文件 ， 也 可 






































标 文 伯 
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Ef HE 


而 女 








哪些 文件 。 通 常 依赖 文件 不 是 1 个 ， 所 以 此 处 是 


8.1 makefile 简介 
命令 。 命 令 可 以 有 多 个 ， 但 一 个 命令 


(3) 命令 是 指 此 规则 中 要 执行 的 动作 ， 这 些 动作 是 指 各 种 shell 










































































标 文 件 ， 需 要 提前 准备 好 依赖 文件 ， 如 果 依赖 文件 列表 中 任意 一 个 文 





要 单独 占用 一 行 ， 在 行 首 必 须 以 Tab 开头 。 这 是 make 规定 的 用 法 ， 这 样 make 在 解析 到 以 Tab 开头 的 行 
时 便 知 道 这 是 要 执行 的 命令 。 

注意 ,“ 目 标 ” 与 “依赖 文件 列表 ”之 间 的 冒号 不 可 少 。 

以 上 规则 的 意义 是 : 要 想 生成 目 
件 比 目标 文件 新 ， 就 去 执行 规则 中 的 命令 。 

make 程序 是 怎样 判断 文件 有 过 更 新 呢 ? 先 来 点 基础 知识 。 

















在 Linux 中 ， 文 件 分 为 属 ! 
据 相 关 的 时 间 ， 这 三 个 时 间 分 别 是 














(1) atime， 即 access time， 表 示 访 问 文件 数据 部 分 时 间 ， 每 次 读 取 文人 
是 读 取 文 件数 据 (内容) 时 改变 atime， 比 如 cat 或 less 命令 查看 文件 就 可 








生 和 数据 两 部 分 ， 每 个 文件 

















寺 间 ， 





有 三 种 














atime、mtime、ctime。 


Wh 








分 别 用 于 记录 与 文件 属性 和 文件 数 




















数据 部 分 时 就 会 更 新 atime， 强 调 下 ， 

















以 更 新 atime， 而 ls 命令 则 不 会 。 











(2) ctime， 即 change time， 表 示 文 件 属性 或 数据 的 改变 时 间 ， 每 当 文 件 的 属性 或 数据 被 修改 时 ， 就 


更 新 ctime， 也 就 是 说 ctime 
(3) mtime, Bl modify time， 
在 上 面 
这 三 个 时 间 可 以 用 stat 命令 查 


办 
2 





同时 

















所 示 





修 \ 








表 


mtime，Change 表示 ctime。 


以 上 三 个 时 间 中 最 主要 的 就 是 mtime 和 ctime， 





其 中 mtime 只 记录 文件 数 
记录 的 是 文件 属 1 
的 更 新 必然 伴 





是 部 分 变化 























重 














图 中 的 方 框 中 ，Access 表示 atime，Modify 


着 ctime 的 更 新 。 单 纪 


= 





跟踪 文件 








看 ， 如 图 8-1 








File: "1 


:0 
ice: fd00h/64768d 


盟 性 和 文件 数据 变化 的 时 间 。 
表示 文件 数据 部 分 的 修改 时 间 ， 每 次 文件 的 数据 被 修改 时 就 会 更 新 mtime。 
说 过 啦 ，ctime 也 跟踪 数据 变化 时 间 ， 所 以 ， 当 文件 数据 被 修改 时 ，mtime 和 ctime 一 同 更 新 。 

Blocks: 0 


Inode: 823447 
: (0664/-rw-rw-r--) Uid: ( 501/ 
6 














[work@localhost makefile]$ stat 1 


I0 Block: 4096 
Links: 1 
work) 


普通 空 文件 


Gid: ( 501/ work) 


: 2014-12-16 14:14:30.463236005 
ify: 2014-12-16 14:14:30.463236005 +0800 











Al 冬 





的 时 间 ，ctime 





























对 于 文件 来 说 ， 我 们 主要 关注 





的 是 其 数据 部 分 ， 所 以 只 





mtime， 对 比 依赖 文件 的 mtime 是 否 比 








标 文 

















令 通 常 是 编译 目 

















是 上 











标 文件 ， 但 大 伙 儿 一 
们 来 决定 的 ， 未 必 都 是 编译 命令 。 








于 法 
要 清楚 ， 


定 


给 大 伙 儿 举 个 例子 ， 以 下 是 makefile 的 内 容 。 


cat -n makefile 


1 
2 


echo "makefile tes 


此 例子 中 makefile 就 两 行 ， 足 够 简单 了 。 第 1 行 中 ， 





是 要 执行 的 命令 。 


区 区 








耳 








此 makefile 的 意义 是 如 果 文 伯 


“makefile test ok ”。 


为 配合 此 例子 ， 提 前 用 touch 命令 生成 了 文件 1 和 文件 2。touch 命令 


F 2 的 mtime 比 文件 1 的 mtime 






































当前 时 间 ， 如 果 该 文件 不 存在 ， 则 会 





对 





中 标 下 画 线 的 部 分 是 mtime， 











要 新 ， 按 理 说 ， 此 时 执行 make 命令 


自动 生成 该 文件 。 现 在 














stat 命令 查看 一 下 它们 的 mtime， 如 


ge: 2014-12-16 14:14:30.463236005 +0800 
8=1 


atime、mtime、ctime 





生 及 数据 这 两 部 分 的 变化 时 间 ， 其 中 任意 部 分 有 改变 ， 都 会 更 新 ctime， 所 以 说 ，mtime 
考察 文件 数据 部 分 改变 时 间 的 话 还 

要 make 程序 
牛 的 mtime 新 ， 就 知道 是 否 
make+makefile 的 使 命 











是 mtime 最 准确 。 

别 获 取 依 赖 文件 和 目标 文件 的 
执行 规则 中 的 命令 ， 尽 管 此 命 
执行 规则 中 的 命令 ， 此 处 的 命令 


























i 
分 
要 

















不 
= 
候 








目标 文件 是 文件 1， 依 赖 文 件 是 文件 2。 第 2 行 


更 新 ， 就 调用 echo 命令 打印 字符 串 


女 卫 








用 来 把 文件 的 mtime 和 atime 更 新 为 
图 8-2 所 示 。 

















我 们 看 到 ， 由 于 文件 2 是 后 被 touch 的 ， 所 以 文件 2 的 mtime 比 文件 1 











Ar cb 


字符 哩 





“makefile test ok ”。 


会 打印 














好 啦 ， 
除了 妇 








HM 咀 们 的 预期 ， 成 功 打 印 





可 以 执行 make 啦 ， 效 果 如 图 8-3 所 示 。 


下 


J 





符 串 “makefile test ok” 以 外 ， 



































令 本 身 也 打印 出 来 了 。 这 样 的 效果 确 
@'， 这 样 就 不 会 输出 命令 


信心 A 


方法 ， 可 以 在 命令 之 前 加 个 字符 





实 不 太 好 ， 了 中 


























还 附带 了 “赠品 ” 把 echo 这 条 命 
































们 只 想 看 到 命令 执行 的 结果 。 好 在 make 给 咱们 





提供 了 



































“@echo off” 的 意思 ， 如 图 





8-4 所 示 。 


本 身 信 息 了 ， 




















点 像 DoS 的 批 处 理 命令 中 











这 
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[work@localhost makefile]$ touch 1 
[work@localhost makefile]$ touch 2 
[work@localhost makefile]$ stat 1 
i 
:0 Blocks: 0 I0 Block: 4096 普通 空 文件 
: fd00h/64768d Inode: 823447 Links: 1 
OD Uid: ( 501/ work) Gid: ( 501/ work) 


: 2014-12-16 14:14:30.463236005 10800 


Change: 2014-12-16 14:14:30.463236005 10800 
[work@localhost makefile]$ stat 2 
:0 Blocks: 0 IO Block: 4096 普通 空 文件 
: fd00h/64768d Inode: 823464 Links: 1 
: (0664/-rw-rw-r--) Uid: ( 501/ work) Gid: ( 501/ work) 


: 2014-12-16 14:14:33.000170845 +0800 [work@localhost makefile]$ make 


echo "makefile test ok" 


ET EN makefile test ok 
[work@localhost makefile]$ 目 [work@localhost makefile]$ 目 


4 图 8-2 文件 1 和 2 的 mtime A 图 8-3 第 一 个 makefile 示意 


您 看 ， 这 下 不 打印 命令 了 。 通 过 这 个 例子 您 也 看 出 ，make 和 makefile 确实 并 不 是 专门 用 来 编译 或 
生成 文件 的 ， 它 仅仅 是 执行 规则 中 的 命令 
makefile 的 文件 名 也 并 非 固 定 ， 可 到 人 国体 make 时 用 -f 参 数 来 指定 。 如 果 未 用 -f 指定 ， 默 认 情 况 
下 ，make 会 先 去 找 名 为 GNUmakefile 的 文件 ， 若 该 文件 不 存在 ， 再 去 找 名 为 makefile 的 文件 ， 若 makefile 
也 不 存在 ， 最 后 去 找 名 为 Makefile 的 文件 。 图 8-5 只 是 演示 最 高 优先 级 的 GNUmakefile， 其 他 两 个 大 伙 
儿 有 兴趣 的 话 自己 试 试 吧 。 
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[work@localhost makefile]$ ls 
1 2 GNUmakefile makefile Makefile 
[work@localhost makefile]$ cat -n GNUmakefile 
1 
2 eecho “GNUmakefile test ok" 
[work@localhost makefile]$ cat -n makefile 
Le 
2 @echo "makefile test ok" 
[work@localhost makefile]$ cat -n Makefile 
,4 
2 eecho “Makefile test ok"” 
[work@localhost makefile]$ make 
GNUmakefile test ok 


[work@localhost makefile]$ cat -n makefile 
各 浊 2 
2 @echo "makefile test ok" 
[work@localhost makefile]$ make 
makefile test ok 
[work@localhost makefile]$ 目 


4 图 8-4 makefilek @ 的 作 和 图 8-5 ”GNUmakefile 优先 级 最 高 
8.1.3” 跳 到 目标 处 执行 

makefile 中 有 很 多 目标 时 ， 我 们 可 以 用 目标 名 称 作为 make 的 参数 ， 采 用 “make 目标 名 称 ” 的 方 
ts 单独 执行 标 名 称 处 的 规则 o 注意 忆 ， 这 种 方式 只 会 执行 目 标 名 称 处 [work@localhost new]$ cat -n makefile 


了 这 : 























































































































的 规则 , 之 后 就 退出 了 ， 后 面 即 使 存在 其 他 的 目标 也 不 会 执行 ,如 图 8-6 本 eecho "target1" 
所 示 。 4 二 @echo "target2" 








makefile 中 只 有 2 个 目标 ，tl 和 也 。 通 过 “maketl1” 的 方式 解析 makefile， sd 上 
make 直接 执行 目标 tl 处 的 命令 echo “targetl ”， 输 出 了 字符 串 targetl ， 然 “Eesti 
后 就 退出 了 。 接 着 通过 “make {2” 输 出 了 字符 串 target2。 Eee 
当 make 后 面 没有 目标 名 称 做 参数 时 ，make 会 在 makefile 中 第 一 个 出 现 的 。 。 ^ 力 8-6 make 执行 目标 
目标 处 开始 执行 ， 如 图 8-7 所 示 。 
一 般 情况 下 ,命令 能 否 执 行 是 要 看 所 依赖 文件 的 mtime 是 否 比 目标 文件 要 新 。 如 果 依 赖 文件 的 mtime 
比 目 标 文件 旧 的 话 ， 说 明 目 标 文件 已 经 是 最 新 的 ， 根 本 不 需要 更 新 ， 所 以 按理 说 ， 此 种 情况 下 规则 中 的 命 
令 是 不 会 执行 的 ， 事 实 也 正 是 如 此 ， 如 图 8-8 所 示 。 
文件 1 的 时 间 已 经 变 成 了 12-17 号 ， 比 文件 2 的 时 间 更 新 ， 所 以 make 提示 : “1” 是 最 新 的 ， 未 执行 


echo 命令 。 
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[work@localhost makefile]$ cat GNUmakefile 
1:2 


[2 
[work@localhost makefile]$ stat 1 
File: “1” 
Size: 0 Blocks: 0 IO Block: 4096 普通 空 文件 
Device: fd00h/64768d Inode: 823447 Links: 1 
Access: (O664/-rw-rw-r--) Uid: ( 501/ work) Gid: ( 501/ work) 


Access: 2014-12-17 16:19:22.714540085 +0800 
Modify: 2014-12-17 16:19:22.714540085 +0800 
Change: 2014-12-17 16:19:22.714540085 +0800 
[work@localhost makefile]$ stat 2 
Fles “2° 
Size: 0 Blocks: 0 IO Block: 4096 ”普通 空 文件 
Device: fd00h/64768d Inode: 823464 Links: 1 
Access: (0664/-rw-rw-r--) Uid: ( 501/ work) Gid: ( 501/ work) 
Access: 2014-12-16 14:14:33.000170845 +0800 
Modify: 2014-12-16 14:14:33.000170845 +0800 
Change: 2014-12-16 14:14:33.000170845 410800 


[work@localhost new]$ make [work@localhost makefile]$ make 





























































































































target1 make: “1" 是 最 新 的 。 
[work@localhost new]$ work@localho akefile]5 
A 图 8-7 make 从 第 1 个 目标 处 执行 4 图 8-8 目标 文件 较 新 ， 命 令 不 执行 
8.1.4 ” 伪 目 标 
通过 上 面 的 例子 您 看 到 了 , 规则 中 的 命令 并 不 总 是 被 执行 ,有 时 候 我 们 并 不 关心 是 否 产生 真实 的 目标 
文件 ， 我 们 只 希望 make 不 要 考虑 mtime， 而 是 总 能 去 执行 一 些 命令 。 





























对 于 这 个 需求 还 是 有 办 法 的 ，make 规定 ， 当 规则 中 不 存在 依赖 文件 时 ， 这 个 目标 文 














伪 目 标 ， 顾名思义 ， 也 就 是 不 产生 真实 的 目标 文件 ， 所 以 当然 也 就 不 需要 依赖 文件 了 。 于 是 , 伪 目 标 所 在 
的 规则 就 变 成 了 纯粹 地 执行 命令 ， 只 要 给 make 指定 该 仿 目 标 名 做 参数 ， 就 能 让 伪 目 标 规 则 中 的 命令 直接 执行 。 
举 个 例子 ， 以 下 是 makefile 内 容 。 


1 | 玫 
2 Qecho "test ok" 










































































t 


由 于 makefile 中 仅 有 这 一 个 目标 al， 所 以 如 果 此 时 执行 make all 或 make， 程 【RED ET 


| test ok 


























序 只 会 输出 test ok， 如 图 8-9 所 示 。 [work@localhost new]$ make all 
yy a 、 test ok 
注意 ， 伪 目标 不 能 和 真实 目标 文件 同名 ， 否 则 就 失去 伪 目 标的 意义 了 ， 为 了 btu | 



















































































避免 伪 目 标 和 真实 目标 文件 同名 的 情况 ， 可 以 用 关键 字 “.PHONY ”来 修饰 伪 4 图 8-9 ” 伪 目 标 演示 
标 ， 格 式 为 “PHONY: 伪 目标 名 ” 这 样 不 管 与 伪 目 标 同名 的 文件 是 否 存在 ， make 其 有 样 执行 伪 目 标 处 的 命令 。 

通常 需要 显 式 用 PHONY 修饰 伪 目 标的 场合 是 删除 编译 过 程 中 的 .o 文件 ， 这 是 为 了 避免 因 旧 的 .o 文件 
已 存在 而 影响 编译 。 如 果 您 在 Linux 下 有 过 编译 源码 的 经 验 ， 就 会 了 解 make clean 的 作用 了 ， 通 常 clean 
就 是 伪 目 标 ， 用 来 删除 编译 过 程 中 的 .o 文件 ， 如 : 

1 .PHONY:clean 

2 clean: 

3 rm /BULLld/* .oO 

伪 目 标的 命名 并 没有 固定 的 规则 ， 用 户 可 以 按照 自己 的 意愿 定义 成 自己 喜欢 的 名 字 。 不 过 ， 由 于 
makefile 已 经 流传 很 广泛 了 ， 对 于 伪 目 标的 命名 ， 业 界 内 已 经 有 了 一 些 约定 俗 成 的 规则 ， 大 伙 儿 把 类 似 功 
能 的 伪 目 标定 义 成 了 同一 个 名 字 。 比 如 上 面 提 到 的 clean， 这 个 盆 目 标 名 称 也 是 大 伙 儿 公认 的 ， 它 的 功能 
通常 就 是 清空 目标 文件 ， 当 然 了 ， 相 应 的 命令 部 分 还 得 是 rm 等 清除 相关 的 命令 。 这 里 再 列举 一 些 其 他 公 
认 的 伪 目 标 名 ， 见 表 8-1。 



























































































































































































































































































































































































































































表 8-1 约定 俗 成 的 伪 目 标 名 称 

伪 目 标 名称 功能 描述 
all 通常 用 来 完成 所 有 模块 的 编译 工作 ， 类 似 于 rebuild all 
clean 通常 用 于 清空 编译 完成 的 所 有 目标 文件 ， 一 般 用 rm 命令 实现 
dist 通常 用 于 将 打包 文件 后 的 tar 文件 再 压缩 成 gz 文件 
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伪 目 标 名 称 功能 描述 
Install 通常 将 编译 好 的 程序 复制 到 安装 目录 下 ， 此 目录 是 在 执行 configure 脚本 通过 一 prefix 参数 配置 的 
printf 通常 用 于 打印 已 经 发 生 改变 的 文件 
tar 通常 用 于 将 文件 打包 成 tar 文件 ， 也 就 是 所 谓 的 归档 文件 
test 通常 用 于 测试 makefile 流程 
8.1.5 make: 递归 式 推导 目标 
在 makefile 中 的 目标 ， 是 以 递归 的 方式 逐 层 向 上 坦 找 目标 的 ， 就 好 像 是 从 迷 富 的 出 口 往 回 技 来 时 的 路 一 样 











大 





9 





| 果 寻 

































































[work@1 














逐个 向 上 推导 。 这 一 点 尤其 体现 在 多 个 目标 相互 依赖 的 避 


ocalhost new]$ cat -n testl.c 


.void my PELint (ea 


2 void main() 


3 
4 


[work@1 


1 


2 void my print (char* str) 


3 
4 
[work@] 


以 上 是 testl.c 和 test2.c 的 代码 ，testl 
系统 函数 printf 实现 打印 。 代 码 没 法 再 简 
现在 想 把 这 两 个 文件 编译 成 testbin， 
F 小 试 身 手 。 内 容 如 下 。 








小 文 从 


中 tes 


2 


{ 
my_print ("hello, 


ocalhost new]$ cat 
include <stdio.h> 





入 了 革 十 站 臣下 人 全 已 瑟 ) 光 





localhost new]$ 





t2.0:test2.c 
gee 6: es EE 


3 testl.o:testl.c 


4 


JCC 0 ie 和 区 = 


world\n"); 
-n test2.c 


{ 


和 况 下 。 举 例子 之 前 ， 乡 














E 看 两 个 例子 文件 


o 




















调用 test2.c 中 
再 解释 了 。 








日 


单 了 ， 没 法 



































st2.0 test2 .c 


stl.o testl.c 


5 test.bin:testl.o test2.0 


6 


gcc -o test. 


7 all:test.bin 


8 


此 makefile 还 是 于 


第 
[7 


本 


test.bin。 





中 找到 all 


(2) make 发 现 all 的 依赖 文件 test.bin 不 存在 ， 于 是 就 去 找 以 test.bin 为 目 


Qecho "compi 


单 的 ， 


US 
屋外 




















bin test1.o test2.0 


le done" 





第 


2 


第 1 一 4 行 都 是 在 准备 .o 目标 文件 





» 





所 在 的 规则 。 





(3) 在 第 


在 ， 于 是 4 





本 身 不 存在， 所 以 不 用 








上 去 找 以 testl.o 为 目 









































7 行 的 目标 al 是 为 了 编译 testbin， 咱 们 要 执行 的 
(1) make 未 找到 文件 GNUmakefile， 便 继续 找 文 但 


那 咱 们 为 它们 写 个 makefilg， 一 会 儿 用 make 这 把 


5 一 6 行 是 将 .o 文件 生成 二 进 








人 人 日 








命令 是 make all， 信 











F makefile, 




















成 testl.o 的 规则 ， 但 它 的 


















































找到 后 ， 根 和 





依赖 文件 





于 =] 
人 EE 


的 函数 my_print 实现 打印 字符 ， 而 my_print 用 





F 思 ”对 这 两 个 


岂 文 件 





此 分 析 下 make 的 执行 流程 。 


时 命令 


的 参数 all， 从 文件 


标 文 件 的 规则 。 

5 行 终于 找到 了 testbin 的 规则 ， 但 make 发 现 ，test.bin 的 依赖 文件 testl.o 和 test2.o 都 不 存 
标 文 件 的 规则 。 
(4) 同样 经 过 于 辛 万 苦 ， 在 第 3 行 找到 了 4 
了 查看 testl.c 的 mtime， 直 接 执行 此 规则 的 命令 ， 即 第 4 行 的 gcc -c -o testl.o testl.c， 








1 于 testl.o 








testl.c, 





用 testl.c 来 编译 test1.0。 
(5) 生成 testl.o 后 ， 执 行 流程 返回 到 test.bin 所 在 的 规则 ， 即 第 5 行 ， 此 时 make 发 现 test2.o 也 不 存 
在 ， 于 是 继续 递归 查找 目标 test2.0。 

















(6) 同样 , 在 第 1 行 发 现 test2.o 所 在 的 规则 ， 
直接 执行 规则 中 的 纺 


的 mtime， 
(7) 站 





362 





















































于 test2.o 本 身 不 存在 ， 也 不 再 
































译 命令 gcc -c -0 test2.0 test2.c 生成 test2.0。 














成 test2.0 后 ， 此 时 执 


























\ 行 流程 又 回 到 了 第 $ 行 ，make 发 现 两 个 依赖 文 伯 








仿 查 


F testl.o 和 test2.o 都 准 
F 是 执行 本 规则 的 命令 ， 即 第 6 行 的 gcc -o testbin testl.o test2.0， 将 这 两 个 目标 文件 生成 可 执行 文件 testbin。 


所 依赖 文件 test2.c 





备 齐 了 ， 




















《8) test.bin 终于 生成 了 ， 此 时 回 到 了 第 2 步 目 标 all 所 在 的 规则 ， 于 是 执行 所 在 规则 中 的 命令 @echo 
"compile done"， 打 印字 符 串 表示 编译 完成 。 提 醒 一 下 ， 虽 然 all 被 当 作 了 真实 目标 文件 来 处 理 ， 但 我 们 





给 出 的 命令 并 不 是 为 了 生成 它 ， 










































































所 以 它 同 伪 目 标的 作用 类 似 ， 大 伙 儿 不 要 感到 奇怪 。 因 为 在 前 面 我 们 已 



































经 解释 过 啦 ，make+makefile 并 不 是 为 了 编译 或 生成 文件 ， 它 们 只 是 为 了 执行 规则 中 的 命令 ， 无 所 谓 命 





令 是 什么 。 





所 示 。 

















图 8-10 中 ,最 上 面 先 用 1s 查看 下 








就 这 两 个 test 文件 和 makefile。 
































好 啦 ， 执行 下 make all, 以 事实 说 话 ， 效果 如 图 8-10 [work@localhost new]$ 1s 


makefile test1.c test2.c 
[work@localhost new]$ make all 
gcc -Cc -0 test1.0 test1.c 














Ik 











前 孙 下 的 文件 ， gcc -c -0 test2.0 test2.c 


gcc -0 test.bin test1.0 test2.0 











compile done 


接着 如 大 伙 儿 所 愿 执行 了 make all， 程 序 打印 了 三 行 [iptpqhunbiphat 拉 ?| 


makefile test1.c test1.0 test2.c test2.0 








gcc 的 编译 命令 ， 我 故意 没 在 gcc 











前 加 字符 @， 这 样 方便 [work@localhost new]$ ./test.bin 














大 伙 儿 查看 确实 执行 过 编译 。 











大 家 看 ， 先 输出 的 是 “gcc -c -0 testl.o testl.c”， 这 与 4 图 8-10 make 递归 查找 目标 











hello,world 
[work@localhost new]$ 有 






































我 们 前 面 描述 的 相符 ， 在 生成 test.bin 的 过 程 中 ， 先 去 找 生 成 依赖 文件 testl.o 的 规则 。 接 着 是 输出 “gcc -c -o 

















test2.0 test2.c”， 完 成 了 test2.0 的 生成 ， 最 后 输出 的 是 “gcc -o test.bin testl.o test2.0”， 说明 递归 查找 目标 结 
束 ， 此 时 有 具备 了 生成 test.bin 的 条 件 。 























生成 了 test.bin 后 ， 最 后 输 昌 















































H compile done， 编 译 完成 。 











按理 说 在 执行 make 后 ， 目 标 下 会 多 出 testl.o、test2.o 和 test.bin 这 三 个 文件 ， 于 是 如 您 所 愿 ， 我 又 执 




















行 了 一 次 1s 命令 ， 果 然 目录 下 有 了 这 三 个 文件 。 











8.1.6 自 定 义 变量 与 系统 变量 





在 图 8-10 的 最 后 执行 了 test.bin， 输 出 hello,world， 编 译 执行 成 功 。 

















makefile 既然 可 称 为 编程 ，* 
变量 。 


























它 必然 就 具备 程序 语言 的 必须 的 基本 功能 ， 比 如 ， 可 以 在 makefile 中 定义 







































































变量 定义 的 格式 :变量 名 = 值 (字符 串 )， 多 个 值 之 间 用 空格 分 开 。make 程序 在 处 理 时 会 用 空格 将 值 打 散 ， 














然后 遍历 每 一 个 值 。 另 外 ， 值 仅 支 持 字 符 串 类 型 ， 即 使 是 数字 也 被 当 作 字 符 串 来 处 理 。 





































































































变量 引用 的 格式 : $( 变 量 名 )。 这 样 ， 每 次 引用 变量 时 ， 变 量 名 就 会 被 其 值 〈 字 符 串 ) 蔡 换 。 



























































注意 ， 虽 然 变量 的 值 会 被 当 









































作 字 符 串 类 型 处 理 ， 但 不 能 将 其 用 双 引 号 或 单 引号 括 起 来 ， 否 则 双 引 号 或 

















单 引 号 也 会 被 当 作 变量 值 的 一 部 分 。 比 如 var = 'file.c', var 的 值 并 不 是 filel.c, 而 是 'file.c'。 当 引用 变量 $(var) 做 
依赖 文件 时 ，make 会 去 找 名 为 file.c 的 目标 ， 而 不 是 file.c。 





举 个 例子 ， 在 makefile 中 用 


test2.0:test2.c 











testl.o:test1l.c 


objfiles = testl.o test2 
test.bin:$ (objfiles) 


all:test.bin 


‘OO OOODP 


























图 8-11 所 示 。 
效果 一 样 ， 执 行 成 功 。 

















除了 用 户 自 定义 的 变量 外 ,make 还 自行 定义 了 一 些 系 统 级 的 变量 , 按 其 用 途 可 分 为 命令 相关 的 变量 




















变量 定义 目标 文件 名 。 








ge ~& -0 test2.6 test2 .8 


Oy = -=0 estls testlar 


.O 


gcc -o test.bin $ (objfiles) 


Qecho "compile done"™ 


























在 第 5 行 ， 定 义 了 变量 objfiles， 其 值 为 test1l.o test2.o， 此 变量 应 用 在 第 6~7 行 。 执 行 make all， 效 果 如 















































参数 相关 的 变量 。 这 两 种 系统 变量 见 表 8-2。 
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[work@localhost 
[work@localhost 
makefile test1. 
[work@localhost 
1 test2.0; 


new]$ rm *.0 test.bin 
new]$ 1s 

EC test2.c 

new]$ cat -n makefile 
test2.c 


gcc -Cc -0 test2.0 test2.c 
test1.c 

gcc -c -0 test1.0 test1.c 
objfiles = test1.0 test2.0 


test1 .0: 


test.bin:$Cobjfiles) 
gcc -0 test.bin $Cobjfiles) 
alLL:test.bin 
eecho "compile done" 
[work@localhost new]$ make all 


gcc -Cc -0 test1.0 test1.c 

gcc -Cc -0 test2.0 test2.c 

gcc -0 test.bin test1.0 test2.0 
compile done 

[work@localhost new]$ ./test.bin 
hello,worlLd 

[work@localhost new]$ 目 














































































































4 图 8-11 make 中 定义 变量 
表 8-2 命令 相关 及 参数 相关 的 系统 变量 一 命令 相关 的 系统 变量 ( 部 分 ) 
变 量 名 描 述 
AR 打包 程序 ， 默 认 是 “a 
AS 汇编 语言 编译 器 ， 默 认 是 “a 
CC C 语言 编译 器 ， 默 认 是 “ec 
CXX C++ 语言 编译 器 ， 默 认 是 “g++?” 
CPP C 预 处 理 器 ， 默 认 是 “$(CC) -E”， 如 gcc -E 
FC Fortran 的 编译 器 和 预 处 理 器 ，Ratfor 的 编译 器 ， 默 认 是 “f77” 
GET 从 SCCS 文件 中 提取 文件 程序 ， 默 认 是 “get” 
PC Pascal 语言 编译 器 ， 默 认 是 “pc” 
MAKEINFO 将 texinfo 文件 转换 为 info 文件 ， 默 认 是 “makeinfo” 
RM 删除 命令 ， 默 认 是 “rm -f” 
TEX 从 TeX 源 文件 中 创建 TexDVI 文件 的 程序 ， 默 认 是 “t 
WEAVE 将 Web 转换 为 TeX 的 程序 ， 默 认 是 “weave” 
YACC 处 理 C 程序 的 Yacc 词法 分 析 器 ， 默 认 是 “yacc?” 
YACCR 处 理 Ratfor 程序 的 Yacc 词法 分 析 器 ， 默 认 是 “yacc -r” 
参数 相关 的 系统 变量 〈 部 分 )， 几 乎 都 无 默认 值 
ARFLAGS 打包 程序 $(AR) 的 参数 ， 默 认 值 为 rv 
ASFLAGS 汇编 语言 编译 器 参数 
CFLAGS C 语言 编译 器 参数 
CXXFLAGS C++ 编 译 器 参数 
CPPFLAGS C 预 处 理 器 参数 
FFLAGS Fortran 语言 编译 器 参数 
LDFLAGS 链接 器 参数 
PFLAGS Pascal 语言 编译 器 参数 
YFLAGS Yacc 词法 分 析 器 参数 














在 命令 相关 的 系统 变量 是 有 默认 值 的 ， 们 在 makefile 中 将 它们 打 
出 来 看 看 是 不 是 这 样 ， 如 图 8-12 所 示 。 
图 8-12 左边 是 自 定 义 的 makefile 名 称 le， 里 面 定义 了 个 伪 目 标 all， 就 是 为 了 执行 echo 
吾 句 打 印 变量 名 及 其 值 。 图 中 右边 的 是 执行 结果 ， 在 make 执行 时 要 用 -f 参数 指定 my_makefile， 这 样 make 


得 序 才 不 会 自动 去 找 那 三 个 标准 的 文件 名 。 您 看 到 了 ,命令 相关 的 系统 变量 是 有 值 的 ， 但 参数 相关 的 系统 
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一 般 参 数 相关 的 变量 没有 默认 值 。n 
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eecho AR $CAR) 

eecho AS $CAS) 

eecho CC SCCC) 

eecho OX SCCOO 

eecho CPP $CCPP) 

eecho FC $CFC) 

@echo GET $CGET) 

eecho PC $CPC) 

@echo MAKEINFO $CMAKEINFO) 
eecho RM $CRM) 

eecho YACC $CYACC) 
[| 
@echo ARFLAGS $CARFLAGS) 
@echo ASFLAGS $CASFLAGS) 
@echo CFLAGS $CCFLAGS) 
eecho CXXFLAGS $CCXXFLAGS) 
@echo CPPFLAGS $CCPPFLAGS) 
@echo FFLAGS $CFFLAGS) 
eecho LDFLAGS $CLDFLAGS) 
eecho PFLAGS $CPFLAGS) 
@echo YFLAGS $CYFLAGS) 
@echo "~ para var end 


[work@localhost new]$ make -f my_makefile 


MAKEINFO makeinfo 
RM rm -f 
YACC yacc 
一 cnd var end 
ARFLAGS rv 
ASFLAGS 
CFLAGS 
CXXFLAGS 
CPPFLAGS 
FFLAGS 
LDFLAGS 
PFLAGS 
YFLAGS 
para var end. 





[work@localhost new]$ 目 [work@localhost new]$ 目 















































































































































4 图 8-12 打印 系统 变量 
这 些 系 统 变 量 的 值 并 不 是 固定 的 ， 可 以 通过 重新 为 其 赋值 的 方式 修改 。 
8.1.7 ” 隐 含 规则 
在 编写 规则 时 ， 若 一 行 写 不 下 ， 可 以 在 行 尾 添加 反 和 斜 杜 字符 ， 这 样 下 一 行 的 内 容 便 被 认为 是 同一 行 ， 
其 实 这 是 很 多 编译 器 和 解释 器 都 支持 的 功能 ， 不 仅 是 make 才 这 样 。 
makefile 中 另 一 个 必须 的 功能 是 注释 ， 如 同 shell 脚本 一 样 ，makefile 中 用 # 来 单行 注释 ， 只 要 各 行 第 















































一 个 非 空 字符 〈 除 空格 、tab) 是 将， 本 行内 容 便 被 注释 了 。 如 果 在 行 尾 是 反 斜 杠 字 符 \， 这 表示 下 一 行 
也 应 被 处 理 为 当前 行 ， 所 以 ， 连 同 下 一 行 也 被 注释 掉 。 
把 刚才 的 makefile 修改 下 ， 将 前 两 个 .o 文件 的 规则 注释 ， 内 容 如 下 。 


























#test2.0:test2.c 

# gcc -cc -o test2.0 test2.c 
#testl.o:testl.c 

# gcc -c -oO testl.o testl.c 
objfiles = testl.o test2.0 


test.bin:$ (objfiles) 
gcc -o test.bin $ (objfiles) 
all:test.bin 
Qecho "compile done" 


先 把 当前 目录 下 的 *.o 和 test.bin 删除 ， 再 次 执行 make all 
看 看 有 什么 不 同 ， 如 图 8-13 所 示 。 
大 伙 儿 看 ， 我 们 原本 已 经 在 makefile 中 注释 掉 了 前 两 个 .o 
文件 的 gcc 编译 命令 ,但 在 图 ! 
-c -0 test[12].o test[12].c”， 就 是 图 8-13 中 方 框 中 
的 部 分 。 也 就 是 说 , make 帮 我 们 自动 生成 了 testl.o 和 test2.0， 
有 没有 觉得 make 还 是 蛮 人 性 化 的 ?顿时 感到 皇 因 浩荡， 哈哈 。 
makefile 中 的 编译 命令 是 gcc， 此 处 输出 的 编译 命令 是 cc， 
所 以 makefile 中 的 gcc 真 的 是 注释 掉 了 ， 这 一 点 请 大 伙 儿 放心 。 另 外 ，cc 其 实 就 是 gcc 的 软 链接 ， 这 两 个 是 同一 
个 程序 ， 都 是 指向 srbin/gcc。 

make 之 所 以 如 此 宅 心 仁厚 ， 是 因为 它 有 一 些 隐 含 规则 。 

什么 是 隐 含 规则 ? 对 于 一 些 使 用 频率 非常 高 的 规则 ，make 把 它们 当成 是 默认 的 ， 不 需要 显 式 地 写 
出 来 ， 当 用 户 未 在 makefile 中 显 式 定义 规则 时 ， 将 默认 使 用 隐 含 规则 进行 推导 。 

隐 含 规则 对 于 不 同 的 程序 语言 是 不 同 的 ， 是 根据 一 般 的 依赖 关系 来 自动 推导 ， 属 于 重建 目 


MD 0 ~ 中 性 PR 上 哺 




















[work@localhost new]$ rm *.0 test.bin 
[work@localhost new]$ 1s 

makefile my_makefile test1.c test2.c 
[work@localhost new]$ make all 
CC -C -0 test1.0 test1.c 


执行 了 make all 后 ,make 还 是 区 















































make 自 动用 cc 命令 
编译 .c 为 .o 文 件 





























-C -0 test2.0 test2.c 

gcc -0 test.bin test1.0 test2.0 
compile done 

[work@localhost new]$ ./test.bin 
hello,world 

[work@localhost new]$ 



































A 图 





8-13 make 隐 含 规则 
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用 方法 。 

隐 含 规则 只 限于 那些 编译 过 程 中 基本 固定 的 依赖 关系 ， 比 如 C 语言 代码 文件 扩展 名 为 .c， 编 译 生成 的 
目标 文件 扩展 名 是 .o,， 这 一般 是 一 对 一 的 。 而 一 个 可 执行 程序 可 能 是 由 多 个 .o 文件 共同 链接 生成 的 , 所 以 ， 
从 可 执行 程序 到 .o 文件 的 关系 有 可 能 是 一 对 多 ， 这 种 不 确定 性 无 法 使 之 成 为 隐 含 的 规则 。 所 以 ， 对 于 C 
语言 的 依赖 关系 是 : 文件 名 .o 依赖 于 文件 名 .c， 仅 限于 源 文件 生成 .o 目标 文件 ， 不 存在 .o 文件 生成 可 执行 
程序 的 隐 含 规则 。 

总 的 说 来 ， 针 对 不 同 的 编程 语言 依赖 关系 ，make 程序 通过 除 扩展 名 之 外 的 文件 名 部 分 ， 再 根据 隐 含 规则 ， 
可 以 推导 出 最 终 的 可 执行 文件 。 也 就 是 说 ， 若 想 通 过 隐 含 规则 自动 推导 生成 目标 ， 存 在 于 文件 系统 上 的 文件 ， 除 
扩展 名 之 外 的 文件 名 部 分 必须 相同 。 比 如 x.o 的 C 源 文 件 必 须 名 为 xc， 这 样 通过 隐 含 规则 才能 成 功 生 成 x.o。 

隐 含 规则 是 用 系统 变量 来 实现 的 ， 比 如 咱们 例子 中 用 到 了 命令 变量 CC 及 参数 变量 CFLAGS 及 CPPFLAGS， 
变量 CC 的 值 为 cc， 所 以 这 里 用 CC 来 编译 C 源码 文件 。 

下 面 列 出 了 常见 的 部 分 语言 程序 的 隐 含 规则 。 

e。 C 程序 

“x.o” 的 生成 依赖 于 “x.c”， 生 成 x.o 的 命令 为 : 


| “$(CC) -ec $ (CPPFLAGS) $ (CFLAGS)"。o 





































































































































































































































































































。 C++ 程序 

“x.0” 的 生成 依赖 于 “x.cc” 或 者 “x.C”， 生成 x.o 的 命令 为 : 
| “$(CXX) -c $ (CPPFLAGS) $ (CFLAGS)” 

e Pascal 程序 

“x.0” 的 生成 依赖 于 “x.p”， 生成 x.o 的 命令 为 : 


| “$(PC) -c $ (PFLAGS)"。 





8.1.8 自动 化 变量 


make 还 支持 一 种 自动 化 变量 ， 此 变量 代表 一 组 文件 名 ， 无 论 是 目标 文件 名 ， 还 是 依赖 文件 名 ， 此 变量 
值 的 范围 属于 这 组 文件 名 集合 ， 也 就 是 说 ， 自 动 化 变量 相当 于 对 文件 名 集合 循环 遍历 一 遍 。 对 于 不 同 的 文 
件 名 集合 ， 有 不 同 的 自动 化 变量 名 ， 下 面 列举 一 些 。 

$@， 表 示 规 则 中 的 目标 文件 名 集合 ， 如 果 存 在 多 个 目标 文件 ，$@ 则 表示 其 中 每 一 个 文件 名 。 助 记 ，'@)， 
很 像 是 at，aim at， 表 示 瞄 准 目 标 。 

$<， 表 示 规 则 中 依赖 文件 中 的 第 1 个 文件 。 助 记 ，“<” 很 像 是 集合 的 最 左边 ， 也 就 是 第 1 个 。 

$^， 表 示 规 则 中 所 有 依赖 文件 的 集合 ， 如 果 集 合 中 有 重复 的 文件 ，$^ 会 自动 去 重 。 助 记 ，? 很 像 从 上 往 下 
童 的 动作 ， 能 日 住 很 大 的 范围 ， 所 以 称 为 集合 。 

$?， 表 示 规 则 中 ， 所 有 比 目 标 文 件 mtime 更 新 的 依赖 文件 集合 。 助 记 ，”?' 表 示 疑 问 ，make 最 大 的 疑 
问 就 是 依赖 文件 的 mtime 是 否 比 目标 文件 的 mtime 要 新 。 
举 个 例子 ， 更 改 makefile 如 下 。 


test2.0:test2.c 

gcc -cec -Oo test2.0 test2.c 
testl.o:testl,.c 

yco =0 £0 testl.o testl..o 
objfiles = testl.o test2.0 
test.bin:$ (objfiles) 

gcc -Oo $@ $^ 

all:test.bin 
Qecho "compile done"™ 


我 们 在 第 7 行 用 $@ 人 代替 了 testbin， 用 $^ 代 蔡 了 所 有 依赖 文件 。 所 以 第 7 行 就 相当 于 gcc -o testbin testl.o 
test2.0。 执 行 make all 后 ， 编 译 过 程 正常 ，test,bin 运行 也 正常 ， 和 之 前 的 图 类 似 ， 所 以 不 再 占 版 面 贴 图 了 。 
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8.1.9 模式 规则 
模式 ， 即 
匹配 ， 


% 月 






































pattem， 其 实 就 是 指 字 符 串 模 (mid， 二 声 ) 子 ， 正 则 表达 式 中 用 此 概念 表示 字符 或 字符 串 

把 符合 此 模子 的 字符 串 找 出 来 ，make 中 也 支持 这 种 字符 串 匹 配 用 法 。 

来 匹配 任意 多 个 非 空 字符 。 

为 结尾 的 文件 ，make 会 拿 
% 通 常用 在 规则 中 的 

因为 目标 文件 才 是 要 生成 的 文件 ， 所 以 当 % 用 在 依赖 文件 中 时 ， 其 所 匹配 的 文件 名 要 以 目 











%.o:%.c 为 例 ， 假 如 | 








ee 


all:test.bin 


OPODP 











j%.o 匹配 到 了 目标 文件 ao 和 b.o， 那 么 依赖 文件 ! 
举 个 例子 ， 现 将 makefile 更 新 如 下 。 
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比如 %.o 代表 所 有 以 .o 为 结尾 的 文件 ，g%s.o 是 以 字符 g 开头 的 所 有 以 .0 
这 个 字符 串 模 式 去 文件 系统 上 查找 文件 ， 默 认为 当前 路 径 下 。 

标 文件 中 ， 以 用 来 匹配 所 有 目标 文件 ，% 也 可 以 用 在 规则 中 的 依赖 文件 中 ， 
标 文件 为 准 。 拿 
的 %.c 将 分 别 匹配 到 ac 和 b.c。 














































































































yet = = S@ 8* 
objfiles = testl.o test2.0 
test.bin:$ (objfiles) 

yue =0 HE RS 


Qecho "compile done™ 


























相 比 上 一 个 makefile， 这 个 版 本 中 修改 了 前 2 行 ， 在 规则 的 目标 文件 中 用 %.o 匹配 所 有 的 .o 文件 ， 当 
录 下 也 就 是 testlo 和 test2.o。 在 依赖 文件 中 用 %.c 匹配 所 有 “合适 ”的 .c 文件 ， 这 个 


然 ， 目 前 当前 目 
























































“合适 ”是 指 : 要 以 目标 文件 中 % 所 匹配 到 的 testl 和 test2 为 主 ， 也 就 是 会 匹配 到 testl.c 和 test2.c， 即 使 当 
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标 下 还 有 其 他 .c 文件 也 不 会 受 影响 匹配 结果 。 
为 了 演示 ， 我 在 当前 目录 下 生成 了 1.c、2.c 和 3.c 这 三 个 干扰 文件 ， 看 看 makefile 规则 中 的 %.c 是 否 





























会 受 此 影响 而 出 错 ， 如 图 8-14 所 示 。 


[work@localhost new]$ 1s 

1.c 2.c 3.c makefile my_makefile testi.c test2.c 
[work@localhost new]$ make all 

gcc -Cc -0 test1.0 test1.c 

gcc -Cc -0 test2.0 test2.c 

gcc -0 test.bin test1.0 test2.0 

compile done 


[work@localhost new]$ ./test.bin 

hello,world 

[work@localhost new]$ 1s 

1.c 2.c 3.c makefile my_makefile testi.c test1.0 test2.c test2.0 
[work@localhost new]$ 








A 图 





8-14 模式 匹配 











您 看 ， 在 图 中 先 
















































































实 多 了 








上 面 所 说 的 干扰 文件 : [123].c。 

















] ls 命令 查看 下 当前 目录 下 的 文件 ， 确 































































































































































































执行 make all 后 ，make 程序 的 输出 是 正常 的 ，test.bin 执行 结果 也 是 对 的 。 最 后 又 用 了 ls 命令 查看 当 
前 目录 下 的 文件 ， 一 切 正 常 ， 并 未 生成 多 余 的 文件 。 

今后 我 们 将 有 makefile 来 编译 程序 了 ， 有 关 makefile 的 内 容 还 是 挺 多 的 ， 比 如 条 件 判 断 、 变 量 操作 、 
内 内 函 数 等 内 容 咱 们 还 没 讲 ， 不 过 大 伙 儿 放心 ， 没 讲 的 都 是 咱们 用 不 到 的 。 还 是 那 句 话 ， 如 果 您 有 兴趣 的 
话 还 是 自己 学 习 下 吧 ， 这 里 就 不 占用 大 伙 儿 的 时 间 了 ， 咱 们 把 时 间 放 在 后 面 的 内 核 代 码 上 。 

大 伙 儿 辛苦 了 ， 下 节 再 见 。 











0 实现 UW 断言 


随 着 模块 越 来 越 多 ,程序 出 错 的 概率 将 越 来 越 大 ， 为 了 方便 调试 ， 























个 好 的 习惯 是 在 程序 中 的 关键 部 

















分 设置 “哨兵 ”让 它 来 监督 数据 的 正确 性 。 这 一 节 我 们 将 介绍 断言 的 实现 。 


























8.2.1 




















实现 开 、 关 中 断 的 函数 
断言 是 什么 ?其实 就 是 咱们 在 C 语言 中 学 过 的 assert， 想 当初 刚 接触 此 概念 时 ， 我 还 不 清楚 为 什么 把 
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它 称 为 “断言 ”。 
断 ， 即 断定 ， 言 ， 即 说 ， 所 以 断言 在 表面 的 意思 是 断定 地 说 ， 我 断定 它 一 定 会 怎样 怎样 。 程 序 中 断言 
的 意思 也 是 如 此 ， 程 序 员 断 定 程序 运行 在 此 处 时 ， 某 数据 的 值 一 定 为 多 少 多 少 。 
在 我 们 系统 中 ， 我 们 实现 两 种 断言 ， 一 种 是 为 内 核 系 统 使 用 的 ASSERT， 另 一 种 是 为 用 户 进程 使 用 的 
assert， 用 户 进程 离 现在 还 早 ， 咱 们 本 节 先 实现 专 供 内 核 使 用 的 ASSERT。 
方面 ， 当 内 核 运行 中 出 现 问题 时 ， 多 属于 严重 的 错误 ， 着 实 没 必 要 再 运行 下 去 了 。 另 一 方面 ， 上 断言 
在 输出 报错 信息 时 ， 屏 幕 输出 不 应 该 被 其 他 进程 干扰 ， 这 样 咱们 才能 专注 于 报错 信息 。 综 上 两 点 原因 ， 
ASSERT 排查 出 错误 后 ， 最 好 在 关中 断 的 情况 下 打印 报错 信息 。 
内 核 运 行 时 ， 为 了 通过 时 钟 中 断定 时 调度 其 他 任务 ， 大 部 分 情况 下 中 断 是 打开 的 ， 如 何在 开 中 断 的 情 
况 下 把 中 断 关 闭 呢 ? 这 就 是 本 节 要 解决 的 问题 了 ， 咱 们 马上 实现 两 个 自由 开关 中 断 的 函数 。 
之 前 咱们 已 经 建立 好 了 文件 interruptc， 现 在 咱们 要 去 更 新 它 了 ， 在 原 有 的 基础 上 ， 加 入 了 以 下 内 容 ， 
大 伙 儿 请 见 代 码 8-1。 







































































































































































































































































































































































代码 8-1 (project/c8/a/kernel/interrupt.c ) 























































































































… 略 

4 #define EFLAGS IF 0x00000200 // eflags 寄存 器 中 的 if 位 为 1 
5 #define GET EFLAGS (EFLAG VAR) asm Volatile("pushf1l;y popl $0" : "=g" (EFLAG VAR)) 
6 
… 略 

18 /* 开 中 断 并 返回 开 中 断 前 的 状态 */ 

19 enum intr status intr enable() { 

20 enum intr status old status; 

pe if (INTR ON == intr get status()) { 

2 old status = INTR_ ON; 

23 return old status; 

24 } else { 

25 old status = INTR OFF; 

26 asm volatile ("sti"); // 开 中 断 ，sti 指令 将 IF 位置 1 
2 return old status; 

28 } 

29 于 

30 

31 /* 关中 断 ， 返回 关中 断 前 的 状态 */ 

32 enum intr status intr disable() { 

3 enum intr_ status old status; 

34 if (INTR ON == intr get status()) { 

23 old status = INTR_ ON; 

36 asm volatile("cli"m : : : "memory"); // 关中 断 ，cli 指令 将 IF 位 置 0 
return old status; 

38 下 Se 人 

39 old status = INTR OFF; 

40 return old status; 

41 } 

42 } 

43 

44 /* 将 中 断 状态 设置 为 status */ 

45 enum intr status intr set status (enum intr status status) { 
46 return status & INTR ON ? intr enable() : intr disable(); 
47 

48 ! 

49 /* 获取 当前 中 断 状态 */ 

50 enum intr status intr get status() { 

51 uint32 t eflags = 0; 

52 GET_EFLAGS (eflags); 

93 return (EFLAGS IF & eflags) ? INTR ON : INTR OFF; 

54 } 








尺码 8-1 中 的 内 容 是 在 上 一 版 本 的 基础 上 新 增 的 部 分 。 

第 14 一 15 行 定义 了 两 个 宏 ， 用 来 获取 中 断 状态 。 

其 中 第 14 行 的 EFLAGS _IF 表示 开 中 断 时 eflags 寄存 器 中 的 正 的 值 ， 由 于 IF 位 于 eflags 中 的 第 9 位 ， 
故 EFLAGS IF 的 值 为 0x00000200。 
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EFLAG VAR 


AAA 


条 



































为 了 管 
心急 的 朋友 可 





EFLAGS 来 获 


量 efla 











] pushfl 将 eflags 寄存 器 的 值 











15 行 的 宏 GET_EFLAGS 





] 来 获取 eflags 寄存 器 的 值 。 它 就 是 段 内 风 汇 编 代码 ， 





















































压 入 栈 ， 
eflags 的 值 。 














C 变量 EFLAG VAR 获得 









































[以 先 去 看 看 该 绰 





吉 构 很 简单 ， 就 





然后 

















再 用 popl 指 














断 状态 

















区 eflags 寄存 器 的 值 
gs 的 值 进行 按 不 














里 








INTR_ON 或 INTR_OFF。 














是 








回 





- 旦 . 


位 与 运算 ， 判断 变量 


来 看 第 119 行 定 义 的 函数 intr_enable， 








站 > 
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的 功能 是 把 中 断 打开 ， 这 高 














eflags 中 。 接 下 来 再 












































这 个 词 
IF 位 置 
































有些 高 大 上 )， 再 把 执行 开 : 











时 觉得 
1。 









































那 就 直 














接 返 


口 

































































断 前 的 ! 
此 函数 先 调用 intr_get status 函数 获取 当前 的 中 断 状态 ， 



































返回 。 开 中 断 的 原 理 就 是 执行 sti 指 




















再 执行 一 次 汇编 指令 sti。 如 果 当 


， 就 执行 内 联 汇编 
























































































































































态 。 它 就 是 先 利 


接 下 来 判断 : 如 果 当 前 已 经 是 开 ， 
前 是 关中 断 状 态 



































asm volatile("sti"), 




















EC 代码 中 用 来 存储 eflags 值 的 变量 ， 它 用 寄存 器 约束 g 来 约束 EFLAG VAR 可 以 放 在 内 存 中 或 寄存 器 中 ， 
令 将 其 弹出 到 与 EFLAG VAR 关联 的 约束 中 ， 





理 中 断 状 态 ， 在 头 文件 interrupt.h 中 定义 了 enum intr_status 枚 举 结构 ， 它 在 代码 8-2 中 列 出 ， 
是 INTR_OFF 值 为 0 表示 关中 断 ，INTR_ON 值 为 1 表示 开 中 断 。 
先 看 看 第 150 行 定 义 的 intr_get status 函数 ， 它 的 作用 是 获取 当前 的 ! 
并 存 到 第 151 行 的 变量 
eflags 中 IF 位 的 值 


了 宏 GET 
利用 EFLAGS IF 
是 否 为 1， 从 而 返回 不 同 的 中 断 状态 ， 虹 

是 所 谓 的 “ 开 中 断 ”( 初 次 接触 
令 将 eflags 中 的 
断 的 状态 ， 


\ 孟 、 


通过 


















































































































































































































































sti 指令 将 中 断 打 开 。 最 后 ， 无 论 程 序 走 哪 个 分 文 ， 都 要 将 操作 前 的 中 断 状 态 old_status 返回 。 也 许 您 考虑 应 
该 把 返回 指令 “return old_status” 放 在 分 支 判 断 的 外 层 ， 也 就 是 放 在 函数 结束 前 ， 这 样 两 个 分 支 就 共同 使 用 
这 一 行 代码 了 。 其 实 也 未 尝 不 可 ， 只 是 每 个 分 支 中 都 有 return 语句 时 ， 能 够 避免 将 C 编译 为 汇编 代码 时 因为 
共用 一 行 代码 而 额外 添加 jmp 语句 ， 虽 然 程 序 因此 而 大 了 一 点 ， 但 也 因此 而 快 了 一 点 ， 空 间 换 时 间 。 

接 下 来 是 第 132 行 定 义 的 函数 intr_disable， 它 的 功能 是 把 中 断 关 闭 ， 就 是 关中 断 。 关 中 断 的 原理 就 是 
执行 cli 指令 将 eflags 中 的 正 位 置 0。 此 函数 的 原理 也 是 先 通 过 intr_get status 获取 当前 的 中 断 状态 ， 若 当 
前 已 经 是 关中 断 状态 ， 则 直接 把 INTR_OFF 返回 ， 否 则 就 通过 内 联 汇编 “asm volatile("cli" : : : "memory")” 
将 中 断 打 开 ， 然 后 返回 旧 中 断 状态 。 

第 145 行 定义 了 函数 intr_set_status， 它 的 作用 是 把 中 断 设置 为 参数 status 的 状态 ， 参 数 status 的 值 通 
常 是 调用 intr disable 和 intr enable 之 后 的 返回 值 old_status， 故 一 般 情况 下 intr_set_ status 用 来 配合 
intr_disable 和 intr enable， 以 恢复 之 前 的 中 断 状态 。 

有 关 代 码 8-1 的 介绍 就 这 么 多 了 ， 现 在 看 下 头 文件 interrupt.h， 请 见 代 码 8-2。 

代码 8-2 (project/c8/a/kernel/interrupt.h ) 

1 #ifndef KERNEL INTERRUPT H 

2 #define KERNEL INTERRUPT H 

3 #include "stdint.h™ 

4 typedef void* intr handler; 

Svolrd idt irnitvolid} 

6 

7 /* 定义 中 断 的 两 种 状态 : 

8 * INTR_OFF 值 为 0， 表 示 关 中 断 

9 * INTR_ON 值 为 1， 表 示 开 中 断 */ 

0 enum intr status { // 中 断 状态 

1 INTR_OFF, // 中 断 关闭 

2 INTR_ON // 中 断 打 

3 4 

4 

5 enum intr status intr get status (void) : 

6 enum intr status intr set status (enum intr status); 

7 enum intr status intr enable (void); 

8 enum intr status intr disable (void); 

9 #endif 

头 文件 中 的 内 容 很 少 ， 就 是 之 前 说 过 的 枚 举 类 型 enum intr status， 它 用 来 管理 中 断 ， 定 义 了 中 断 的 两 
种 状态 。INTR_OFF 表示 中 断 关闭 ， 其 值 为 0。INTR_ON 表示 中 断 打开 ， 基 值 为 1。 

在 文件 尾 是 代码 8-1 中 介绍 的 四 个 函数 的 声明 。 

好 啦 ， 本 节 就 到 这 里 ， 下 一 节 咱 们 实现 ASSERT。 
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8.2.2 ”实现 ASSERT 











































































































































































































































































































































































































































































































ASSERT 是 用 来 辅助 程序 调试 的 ， 所 以 通常 是 用 在 开发 阶段 。 如 果 程 序 中 的 某 些 地 方 会 莫名 其 妙 地 出 
错 ， 而 我 们 又 无 法 短 时 间 内 将 其 排查 出 来 ， 这 时 我 们 可 以 在 程序 中 安排 个 “哨兵 ” 这 个 哨兵 就 是 ASSERT。 
我 们 把 程序 该 有 的 条 件 状 态 传 给 它 ， 让 它 帮 咱 们 监督 此 和 条件， 一旦 条 件 不 符合 就 会 报错 并 将 程序 挂 起 。 

我 们 在 C 语言 中 这 样 使 用 ASSERT: 
| ASSERT (条 件 表 达 式 ) ; 

括号 中 的 条 件 表达 式 就 是 上 面 所 说 的 条 件 状 态 。 

在 C 语言 中 ASSERT 是 用 宏 来 定义 的 ， 其 原理 是 判断 传 给 ASSERT 的 表达 式 是 否 成 立 ， 知 表达 式 成 立 
则 什么 都 不 做 ， 否 则 打印 出 错 信息 并 停止 执行 ， 我 们 仿照 它 来 实现 自己 的 版 本 。 

本 节 将 利用 上 一 节 的 成 果 intr_disable 函数 辅助 实现 ASSERT， 请 见 代 码 8-3。 

代码 8-3 (project/c8/a/kernel/debug.h ) 

1 #ifndef KERNEL DEBUG H 

2 #define KERNEL DEBUG H 

3 void panic spin(char* filename, int line, const char* func, const char* condition); 

4 

号 /大 大 痰 炎炎 火炎 痰 大 痰 大 交大 大 火炎 交火 炎 痰 大 火炎 交大 大 天 _VA ARGS _ 大 大 类 类 类 类 类 大 大 大 大 类 大 类 类 类 类 类 大 大 大 大 大 大 类 类 类 类 类 类 大 

6 * VA ARGS 是 预 处 理 器 所 支持 的 专用 标识 符 。 

7 * 代表 所 有 与 省 略 号 相对 应 的 参数 。 

8 * "..." 表 示 定 义 的 宏 其 参数 可 变 。* / 

9 #define PANIC(...) panic spin (_FILE , _LINE , _func , _VA RARGS ) 

0 / 认 灿 光 光 诡 交 训 交 风光 次 次 次 次 光 光 奖 交 次 风光 凡 交 次 交 次 炎 尖 次 次 次 训 交 训 交 宙 次 克 交 凡 罗 次 奖 砍 次 炎 交 次 次 风 六 庙 光 次 奖 克 交 太 交 六 妆 次 克 克 交 丸 次 交 交 / 

六 

2 #ifdef NDEBUG 

3 #define ASSERT (CONDITION) ((void) 0) 

4 #else 

5 #defineASSERT (CONDITION)\ 

6 if (CONDITION) {}elsef{ \ 

7 /* 符号 # 让 编译 器 将 宏 的 参数 转化 为 字符 串 宁 村 AN 

8 PANIC (#CONDITION); \ 

91} 

20 #endif /* NDEBUG */ 

2 

22 #endif /* KERNEL DEBUG H*/ 

代码 8-3 是 咱们 此 次 新 创建 的 文件 debug.h, 它 只 是 实现 ASSERT 的 一 部 分 , 在 文件 开头 的 panic_spin 
定义 在 debug.o 中 。 

第 12 一 20 行 貌似 都 是 在 定义 ASSERT， 其 实 真正 有 效 定义 的 部 分 只 是 第 15 行 。 

第 15 行 用 #define 定义 ASSERT(CONDITION)， 由 于 定义 的 是 多 行 宏 ， 所 以 各 行 结尾 用 反 斜 杠 来 续 行 。 

第 16 行 判断 CONDITION 条 件 为 真 时 ， 其 后 的 大 括号 中 为 空 ， 即 如 前 所 述 ， 什 么 都 不 做 。 否 则 条 
件 为 假 时 ， 在 第 18 行 调用 另外 一 个 宏 PANIC(#CONDITION)， 此 宏 是 ASSERT 采取 行动 的 部 分 ， 大 伙 儿 
暂且 移 步 到 其 定义 所 在 的 第 9 行 。 
| “#qefine PANIC(...)panic spin (FILE , LINE ， func  ， VA ARGS )” 

上 面 的 预 处 理 命 令 define 是 将 PANIC(...) 定义 为 panic_spin 函数 ， 此 函数 定义 在 debug.o 中 ， 一 会 
咱们 再 看 它 。 

大 伙 儿 一 定 早已 注意 到 了 ，PANIC 后 面 是 (...)， 我 们 知道 括号 中 应 该 是 形 参 ， 其 实 这 是 C 预 处 理 器 所 文 


持 的 一 种 用 法 ， 它 允许 宏 支 持 个 数 不 固 























宏 ， 只 要 括号 中 用 








所 以 “参数 个 数 可 变 的 宏 宏 ” 和 printf 的 声 日 


您 看 了 printf 的 声 

















2 


定 的 参数 ， 
位 ， 就 表示 此 宏 的 参数 个 数 不 
是 一 样 的 : 
是 不 是 更 容易 接受 宏 的 变 参天 





".." 表 示 所 定义 的 宏 其 参数 可 变 ， 术 语 为 参数 个 数 可 变 的 
固定 。 和 悄悄 说 下 ，printf 也 支 


持 参 数 个 数 可 变 ， 
“extern int printf (_ const char * _ restrict ee) 
EB 式 了 ? 
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_ format, 





明 后 ， 

















参数 个 数 既 然 不 固定 ， 习 
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该 如 何 引用 它们 呢 ? 














了 预 处 至 














器 为 此 专门 提供 了 一 个 标识 符 _“VA_ARGS_， 它 只 允许 在 具有 可 变 参数 的 宏 蔡 换 列 表 中 出 现 ， 




















它 代 表 所 有 与 省 略 号 “...” 相 对 应 的 参数 。 该 参数 至 少 有 一 个 ， 但 可 以 为 空 。 
所 以 ， 我 们 传 给 panic_spin 的 其 中 一 个 参数 是 _VA_ARGS 。 同 样 作为 参数 的 还 有 _FILE ， LINE ， 
_ func ”， 这 三 个 是 预定 义 的 宏 ， 分 别 表示 被 编译 的 文件 名 、 被 编译 文件 中 的 行 号 、 被 编译 的 函数 名 。 












































































































































咱们 再 看 一 下 第 18 行 ， 调 用 PANIC 的 形式 为 PANIC(#CONDITION) ， 即 形 参 为 #CONDITION， 其 中 字 









































符 '# 的 作 





是 让 预 处 理 器 把 CONDITION 转换 成 字符 串 常 量 。 比 如 CONDITION 若 为 var != 0，#HCONDITION 

















的 效果 是 变 成 了 字符 串 “var != 0”。 


下 是 


传 给 panic_spin 函数 的 第 4 个 参数 VA _ARGS ， 实 际 类 型 为 字符 串 指 针 。 














i 





再 给 大 伙 儿 说 一 下 第 12 行 的 村 fdef NDEBUG 是 怎么 回 事 。 












































话说 ASSERT 是 在 调试 过 程 中 使 用 的 ， 宏 毕竟 是 一 段 代 码 ， 经 预 处 理 器 展开 后 ， 调 用 宏 的 地 方 越 多 ， 
程序 体积 越 大 ， 所 以 执行 得 越 慢 。 所 以 ， 当 我 们 不 再 调试 时 ， 就 应 该 让 此 宏 失效 ， 这 样 编译 出 来 的 程序 才 


比较 小 ， 运 行 会 稍 快 一 些 。 
话 虽 如 此 , 但 宏 已 经 写 在 程序 中 了 ,怎样 让 宏 在 程序 中 消失 呢 ? 难 道 要 写 个 删除 文件 行 脚本 吗 ? 很 多 














































































































流 文本 命令 都 可 以 做 这 个 ， 比 如 著名 的 sed。 写 脚本 太 麻 烦 了 ， 有 没有 更 好 的 办 法 呢 ?” 这 里 可 利用 #define 








宏 定 义 的 功能 让 宏 等 于 空 值 ， 这 就 是 在 第 13 行 所 写 的 #define ASSERT(CONDITION) ((void)0) 的 作用 ， 让 


后 - 





上 ASSERT 成 为 空 0， 也 就 是 什么 都 不 是 ， 这 样 就 相当 于 删除 了 ASSERT。 
宏 是 预 处 理 器 提供 的 功能 ， 是 在 预 处 理 阶 段 处 理 的 ， 所 以 让 其 为 空 的 条 件 也 得 在 预 处理 阶 段 判 断 才 行 。 
在 第 12 行 我 们 给 出 了 让 宏 等 于 空 的 条 件 ， 用 预 处 理 指令 #ifdef 判断 ， 如 果 定 义 了 宏 NDEBUG， 就 执行 上 面 说 



























































































































































过 的 第 13 行 ， 使 ASSERT 等 于 (void)0。 此 宏 NDEBUG 可 以 在 gcc 编译 时 指定 ， 方 法 很 简单 ， 只 要 用 gcc 的 
参数 -D 来 定义 NDEBUG 就 行 了 ， 如 gcc-DNDEBUG， 不 过 我 们 通常 将 “-DNDEBUG” 定 义 在 makefile 中 。 


好 啦 ， 






































现在 再 给 大 伙 儿 看 下 debug.c 中 的 panic_spin， 见 代码 8-4。 
代码 8-4 (project/c8/a/kernel/debug.h ) 





#include "debug.h" 
#include “print.h" 
#include "interrupt.h" 


























/* 打印 文件 名 、 行 号 、 函 数 名 、 条 件 并 使 程序 悬 停 */ 
\ 





} 


J 
2 
3 
4 
总 
6 void panic spin(char* filename, 
~ 
8 
9 
0 
a 


int line, \ 
Onst Charw CD \ 
const char* condition) \ 






































intr disable(); // 因为 有 时 候 会 单独 调用 panic spin 
// 所 以 在 此 处 关中 断 
putuetr (NiNAN\nt error TAN 而 于 和 
put str("filename:");put str(filename) ;put str("Nn") 7 
put_ str("line:O0x");put int (line);put str("™\n"); 
put_ str("function:");put str((char*)func);put str("\n"); 
put_str("condition:");put str((char*)condition);put str("\n"); 
while(1); 











代码 8-4 中 定义 了 panic_spin 函数 ， 除 参数 line 外 ， 其 他 三 个 参数 都 是 字符 串 指 针 ， 这 也 证 明了 代码 8-3 


中 的 PANIC(#CONDITION)， 此 #CONDITION 确实 是 字符 串 。 



































代码 也 比较 简单 ， 执 行 intr_disable 把 中 断 关 闭 后 ， 再 打印 调度 相关 的 信息 ， 之 后 就 通过 while(1) 死 循环 


悬 停 在 此 。 


























为 了 测试 ASSERT， 咱 们 得 找 个 地 方 应 用 它 ， 咱 们 在 main.c 中 测试 一 下 ， 请 见 代 码 8-5。 


工作 二 


nEO 请 




















代码 8-5 (project/c8/a/kernel/main.c ) 


#include "print.h" 
#include "init.h" 
#include "debug.h" 


main(void) { 
put_str("I am kernel\n"); 
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6 Enit LL 
ASSERT (1==2) ; 
8 while(1); 

9 return 0; 
10 } 

















Ba 


相对 于 上 个 版 本 的 main.c， 咱 们 这 里 把 开 中 断 sti 的 内 联 汇编 去 掉 了 ， 
打开 中 断 的 ， 目 前 暂时 将 其 关闭 ， 等 真正 时 机 成 熟 咱们 再 打开 不 迟 。 

为 引用 ASSERT， 在 第 3 行 包含 了 debug.h， 第 7 行 用 “ASSERT(UI 一 2)” 来 测试 ， 很 明显 1 一 2 是 不 
成 立 的 ， 故 此 ASSERT 会 开始 工作 ， 内 部 调用 panic_spin 来 打印 调试 信息 并 使 程序 悬 停 。 

好 啦 ， 代 码 部 分 该 说 的 都 说 了 ， 接 下 来 咱们 该 编译 运行 了 ， 您 懂 的 ，makefile 该 派 上 用 场 了 。 


8.2.3 通过 makefile 来 编译 


老实 说 ， 咱 们 的 makefile 部 分 介绍 得 不 多 ， 所 以 实际 所 写 的 makefile 内 容 也 很 简单 ， 现 在 咱们 写 一 个 
makefile 来 编译 之 前 的 所 有 文件 ， 见 代码 8-6。 
代码 8-6 (project/c8/a/makefile ) 




















为 之 前 是 为 了 演示 中 断 机 制 才 


































































































UILD DIR = ./build 
NTRY_POINT = 0xc0001500 
= Nasm 
= gcc 
= 
B = -I lib/ -I lib/kernel/ -I lib/user/ -I kernel/ -I device/ 
FLAGS = -f elf 
FLAGS = -Wall $ (LIB) -c -fno-builtin -W -Wstrict-prototypes \ 
-Wmissing-prototypes 
LDFLAGS = -Ttext $ (ENTRY POINT) -e main -Map $ (BUILD DIR)/kernel.map 
OBJS = BUILD DIR) /main.o $ (BUILD DIR)/init.o$ (BUILD DIR)/interrupt.o \ 
UILD DIR) /timer.o $ (BUILD DIR)/kernel.o $ (BUILD DIR)/print.o \ 
UILD DIR) /debug.o 


B 
E 
A 
C 
A 
G 





$( 
$ (B 
$ (B 





# # ### c 代码 编译 非 提 提 提 提 非 提 提 提 提 # 提 提 提 扩 
$ (BUILD DIR) /main.o: kernel/main.c lib/kernel/print.h \ 
lib/stdint.h kernel/init.h 

$(CC) $ (CFLAGS) $< -o $@ 


OAIOMOOARONPOOOIONAODNP 
HH 





Oo 


$ (BUILD DIR)/init.o: kernel/init.c kernel/init.h lib/kernel/print.h \ 
lib/stdint.h kernel/interrupt.h device/timer.h 
$ (CC) $ (CFLAGS) $< -~o $@ 





DDD 
Pe 
图 





$ (BUILD DIR)/interrupt.o: kernel/interrupt.c kernel/interrupt.h \ 
lib/stdint.h kernel/global.h lib/kernel/io.h lib/kernel/print.h 
$ (CC) $ (CFLAGS) $< -o $@ 




















NINN 
OO 必 w 
HH 


28 $ (BUILD DIR)/timer.o: device/timer.c device/timer.h lib/stdint.h\ 
29 lib/kernel/io.h lib/kernel/print.h 
30 $ (CC) $ (CFLAGS) $< -o $@ 








32 $ (BUILD DIR)/debug.o: kernel/debug.c kernel/debug.h \ 
33 lib/kernel/print.h lib/stdint.h kernel/interrupt.h 
34 $ (CC) $ (CFLAGS) $< -o $@ 


36 间 # 非 提 提 非 # 非 # 汇编 代码 编译 非 提审 提 提 非 提 提 提 扩 井 # 提 井 坟 
37 $ (BUILD DIR) /kernel.o: kernel/kernel.s 

38 $ (AS) $(ASFLAGS) $< -o $@ 

39 $ (BUILD DIR) /print.o: lib/kernel/print.s 

40 $ (AS) $(ASFLAGS) $< -oo $@ 

















间 ## 提 非 间 提 提 提 ## 非 链接 所 有 目标 文件 非 提 提 提审 非 提 非 提 提 提 提 非 
$ (BUILD DIR) /kernel.bin: $ (0BJS) 
$ (LD) $ (LDFLAGS) $^ -~o $Q@ 






































.PHONY : mk dir hd clean all 


mksd i 





if [[ ! -d $(BUILD DIR) ]];then mkdir $ (BUILD DIR);fi 


is te 
O00WJOAOONPODODP 


372 


4- 

2 dd if=$ (BUILD DIR) /kernel .bin AN 

53 of=/home/work/my workspace/bochs/hd60M.img \ 
54 bs=512 count=200 seek=9 conv=notrunc 

[eis 

56 clean: 

57 cd $ (BUILD DIR) && rm -f£f ./* 

58 


59 build: $ (BUILD DIR)/kernel.bin 


6 了 alls mk dir build ld 























先 我 必须 承认 这 


个 makefile 写 得 一 点 都 不 漂亮 ， 完 全 是 为 了 短 、 平 、 快 ， 








写 起 来 容易 ， 您 也 容 


易 看 懂 。 好 啦 废话 不 多 说 了 ， 介 绍 下 主要 内 容 。 





出 








第 1 行 定 义 了 目 
是 ENTRY POINT， 


























录 变 量 ， 即 BUILD_DIR， pee 目标 
其 值 为 0xc0001500， 就 是 之 前 ld 命令 中 -Ttext 参数 的 值 。 









































第 3 一 10 行 定义 了 编译 器 及 编译 参数 ， 其 中 在 第 8 行 的 参数 变量 CFLAGS 中 定义 了 -fno-builtin， 它 是 告 j 











这 样 做 比较 简单 省 事 ， 我 























文件 。 第 2 行 定义 的 变量 






































此 二 





编译 时 gce 会 提示 与 























前 译 器 不 要 采用 内 部 函数 ， 因 为 咱们 在 以 后 实现 中 会 自 定 义 与 内 部 函数 同名 的 函数 ， 
内 部 函数 冲突 。-Wstrict-prototypes 选项 要 求 函 数 声明 中 必须 有 参数 类 型 ， 否 















































A\ 





如 果 不 添加 此 选项 的 话 ， 
则 编译 时 


























发 出 警告 。-Wmissing-prototypes 选项 要 求 函数 必须 有 声明 ， 否 则 编译 时 发 出 警告 。 其 他 内 容 不 再 细 说 。 





泊 





第 11 行 定义 的 变量 OBJS 用 来 存储 所 有 的 目标 文件 名 ， 以 后 每 增加 一 个 




































































增加 就 行 了 ， 此 变量 
接 时 的 目标 文件 ， 位 




















置 顺序 上 最 好 还 是 调用 在 前 ， 实 现在 后 。 















































标 文件 ， 直 接 在 此 变量 




















用 在 链接 阶段 。 注 意 ， 最 好 不 要 用 模式 规则 %.o 来 匹配 ， 这 样 不 能 保证 链接 顺序 ， 链 




















第 15 一 44 行 是 编译 C 程序 、 汇 编 代码 及 链接 的 过 程 ， 在 前 面 介绍 makefile 时 已 经 介绍 过 类 似 的 用 法 ， 


不 再 细 述 。 
在 代码 的 末尾 定 


























义 了 mk dir，hd，clean，build 及 all 五 个 伪 目 标 。 























其 中 ， 伪 目标 mk_dir 用 来 建立 build 目录 ， 通 过 第 46 行 的 shell 命令 “if[[!-d 























build 目录 是 否 存在 ， 








若 不 存在 ， 则 利用 mkdir 命令 来 创建 。 





伪 目 标 hd 是 将 buildkerneLbin 写 入 硬盘 ， 执 行 make hd 是 将 文件 写 入 硬盘 。 


























伪 目 标 clean 是 将 build 目录 下 的 文件 清空 。 为 稳妥 起 见 ， 先 成 功 进 入 build 


删除 此 目录 下 的 所 有 





伪 目 标 build 就 是 编译 kernel.bin， 只 要 执行 make build 就 是 编译 文件 。 
伪 目 标 all 是 依次 执行 伪 目 标 mk _dir build hd。 只 要 执行 make all 便 完成 了 多 





由 于 此 makefile ; 


























$(BUILD_DIR) ]]” 来 判断 

















目录 后 再 执行 “rm -f./*” 





文件 ， 避 免 错 删 文件 。 执 行 make clean 将 会 清空 build 目录 下 的 文件 。 









































有 译 到 写 入 硬盘 的 全 过 程 。 



































还 是 相当 简单 的 ， 介 绍 就 到 这 里 ， 咱 们 执行 下 看 看 ， 效 果 妇 


[work@localhost a]$ make all 
if [[ ! -d ./build ]];then mkdir ./build;fi 
gcc -Wall -I lib/ -I lib/kernel/ -I lib/user/ -I kernel/ -I device/ -c -fno-builtin 
-W -Wstrict-prototypes -Wmissing-prototypes -Wsystem-headers kernel/main.c -o build/ 
main.o 
[| 
-W -Wstrict-prototypes -Wmissing-prototypes -Wsystem-headers kernel/init.c -o build/ 
init.o 
gcc -Wall -I lib/ -I lib/kernel/ -I lib/user/ -I kernel/ -I device/ -c -fno-builtin 
-W -Wstrict-prototypes -Wmissing-prototypes -Wsystem-headers kernel/interrupt.c -ob 
uild/interrupt.o 
[< 
-W -Wstrict-prototypes -Wmissing-prototypes -Wsystem-headers device/timer.c -0 build 
/timer.o 
nasm -f elf kernel/kernel.S -o build/kernel.o 
nasm -f elf lib/kernel/print.S -o build/print.o 
gcc -Wall -I Lib/y -I Lib/kerneLy -I Lib/usery -I kerneL -I device/ -c -fno-builtin 
-W -Wstrict-prototypes -Wmissing-prototypes -Wsystem-headers kernel/debug.c -o build 
/debug.o 
ld -Ttext 0xc0001500 -e main -Map ./build/kernel .map build/main.o build/init.o build 
/interrupt.o build/timer.o build/kernel .0 build/print.o build/debug.o -o build/kerne 
1.bin 
dd if=./build/kernel .bin \ 

of=/home/work/my_workspace/bochs/hd60M. img \ 

bs=512 count=200 seek=9 conv=notrunc 
记录 了 16+1 的 读 入 
记录 了 16+1 的 写 出 
8271 字 节 (8.3 kB) 已 复制 ，0.000846648 秒 ，9.8 MB/ 秒 
work@localhost a]$ 








二 


A 图 8-15 








一 个 makefile 执行 








1 图 8-15 所 示 。 
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您 看 ， 屏 幕 打 印 了 很 多 信息 ， 这 都 是 命令 〈gcc、nasm、1ld、dd) 执行 时 的 输出 ， 从 编译 、 链 接 到 写 
入 人 硬盘， 一 气 呵 成 ， 是 不 是 顿时 觉得 爽快 了 太 多 ?看 来 前 期 的 学 习 还 是 值得 的 。 
好 ， 立 即 在 bochs 中 运行 检验 ， 效 果 如 图 8-16 所 示 。 




































































I am kernel 
init_all 


idt_ir 


nit start 


idt_desc_init done 


pic_init done 


idt_ir 


hit done 


imer_init start 
timer_init done 


trerre 


error ?1991 


Function:main 
-ondition:1==2 





CTRL + 3rd button enables mouse | | | 

















您 看 ， 正 如 预期 一 样 ， 图 8-16 的 下 面 




















4 图 8-16 ”ASSERT 效果 

















是 由 “ASSERT(1==2)” 打 印 出 来 的 信息 ， 信 息 报 告 了 ASSERT 

















所 在 的 文件 名 : kernel/main.c，ASSERT 所 在 的 行 号 ， 这 里 是 第 7 行 ，ASSERT 确实 在 代码 8-5 的 第 7 行 ， 
ASSERT 所 在 的 函数 : main，ASSERT 中 的 条 件 表达 式 为 “1==2”， 这 里 它 已 经 变 成 了 字符 串 。 











到 这 里 ， 咱 们 的 ASSERT 实现 算是 完成 了 ， 感 谢 大 家 ， 好 累 ， 早 点 睡 。 


对 蛋 实现 字符 串 操 作 函 数 















































为 了 将 来 的 开发 工作 更 得 心 应 手 , 这 一 节 中 咱们 还 是 做 基础 方面 的 工作 ， 本 节 打 算 实现 与 字符 串 相关 
































的 函数 ， 此 类 函数 以 后 会 被 经 常用 到 ， 还 是 那 句 话 ， 磨 刀 不 误 砍 柴 工 ， 虽 们 要 一 步 一 个 脚印 地 走 。 









































在 咱们 用 高 级 语言 编程 时 ， 无 论 是 编译 

















型 语言 ， 还 是 脚本 语言 ， 都 会 提供 字符 串 操作 函数 ， 而 且 为 了 

















大 家 使 用 方便 ， 函 数 名 字 基 本 都 与 大 家 所 熟识 的 名 字 相 同 或 类 似 ， 比 如 获取 字符 串 长 度 的 函数 ， 各 种 语言 





版 本 都 类 似 称 为 strlen， 必 须 得 遵守 约定 俗 




















成 的 名 字 ， 和 否则 用 户 也 是 不 买账 的 。 























咱们 以 C 语言 为 参考 ， 按 照 C 代码 的 字符 串 函 数 名 编写 自己 的 函数 。 为 此 ， 虽 们 在 lib 目录 下 建立 了 















































string.c 文件 。 大 伙 放 心 ， 这 里 面 定义 的 每 一 个 函数 大 家 都 应 该 很 熟悉 ， 多 数 都 和 C 语言 的 同名 函数 功能 一 














样 ， 本 节 会 很 轻松 。 











为 方便 阅读 ， 将 此 文件 拆 分 成 三 部 分 ， 


请 大 伙 儿 参见 代码 8-7-1 一 代码 8-7-3 。 

















代码 8-7-1 (project/c8/b/lib/string.c ) 


#include "string.h" 
#include "global.h" 
#include "debug.h" 
/* 将 dst 起 始 的 size 个 字 节 置 为 value 


ASSERT (dst_ != NULL); 


OONprODPpPp 


9 while (size-- > 0) 
10 *dst++ = value; 
1 1} 





4 


void memset (void* dst , uint8 t value, uint32 t size) { 


Uint8 t* det = (uint® t*)dst » 


13 /* 将 src 起 始 的 size 个 字 节 复制 到 dst  */ 
14 void memcpy (void* dst , const void* src , uint32 t size) { 
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le ASSERT(dst_  != NULL && src_ 

16 uint8 tx dst = dst ; 

17 Const iint8 t* src = SrC » 

18 while (size-- > 0) 

1 *dst++ = *srct+t+; 

20 } 

多 二 

22 /* 连续 比较 以 地 址 a_ 和 地 址 b 开头 的 size 个 
若 a 大 于 b_ ， 返 回 +1， 否 则 返回 -1 */ 











23 int memcmp (const void* a , 











24 const char* a = a 7 
25 const char* bp = b; 
26 ASSERT(a != NULL ,起 
27 while (size-- > 0) { 
28 ifl(*a != xb) { 

29 TetUEN. wa > BD? 业 
30 } 

过 at++; 

32 b++; 

33 } 

34 return 0; 

35;. 














memset 函数 ) 
空间 ， 在 本 系统 ， 


























通常 





!= NULL); 





cn 


子 - 了 ， 





口 





若 相 等 则 返 





const void* pb , uint32 t size) 


!= NULL); 


省 


j 于 内 存 区 域 的 数据 初始 化 ， 原 理 是 逐 字 节 地 # 


0， 


{ 








于 内 存 分 配 时 的 数据 清 0。 




















memcpy 函数 用 于 内 存 数 据 拷贝 ， 原 
居 比 较 ， 分 别 以 两 个 地 址 a 和 b 为 起 始 
(或 ASCII 码 ) 大 于 b 中 同一 相对 位 置 的 内 存 数值 ， 出 





memcmp 函数 用 于 一 段 内 存 数 所 
某 个 内 存 字 节 的 数值 









































是 将 src 起 始 的 size 






































同一 位 置 的 所 有 值 都 相等 ， 则 返回 0， 否 则 返回 -1。 
代码 8-7-2 (project/c8/b/lib/st 
37 /* 将 字符 串 从 src 复制 到 dst */ 











































































































































































































38 "Ghar" etrepy (ohar "dst ;i const, Char* Sree) 

39 ASSERT(dst_  != NULL && src_  != NULL); 

40 char* r = dst ; // 用 来 返回 目的 字符 串 起 始 地 址 
41 while((*dst ++ = *src ++)); 

42 return r; 

43 } 

44 

45 /* 返回 字符 串 长 度 */ 

46 uint32 tt strlen{({const char* str) ‘{ 

47 ASSERT (str != NULL); 

48 const char* p = str; 

49 while (*pt++); 

50 return. (Be Str SL 

与 二 

52 

53 /* 比较 两 个 字符 串 ， 若 a_ 中 的 字符 大 于 b_ 中 的 字符 返回 1， 
相等 时 返回 0， 否 则 返回 -1. */ 

54 inte tt Stremp: (eonst "cnar* a COnst harw By) 

S55 ASSERT(a != NULL && b != NULL); 

5.6 while (*a != 0 && *a == xb) { 

5 at++t+; 

58 b++; 

59 } 

60 /* 如 果 *a 小 于 *b 就 返回 -1， 否 则 就 属于 *a 大 于 等 于 *b 的 情况 。 
在 后 面 的 布尔 表达 式 "*a > *b" 中 ，* 若 *a 大 于 *b， 表 达 式 就 等 于 1， 
61 否则 表达 式 不 成 立 ， 也 就 是 布尔 值 为 0， 恰恰 表示 *a 等 于 *b */ 
62 return *a < *b 2 =1 a Dy 

63 

64 














65 /* 从 左 到 右 查找 字符 串 str 中 六 


次 出 现 字符 ch 的 地 址 */ 

















人 6 ehar* strehr.(const. colar* -stry 





67 ASSERT (str != NULL); 

68 while (*str != 0) 

69 if (*str == ch) { 

70 return (char*) strs 


const Uint8 t chy). 


巴 value 写 入 起 始 内 存 地 址 为 dst_ 的 size 个 
个 字 节 复制 到 dst ， 逐 字 节 找 贝 。 

， 如 果 在 size 个 字 节 内 ，a_ 中 的 
时 返回 1， 如 果 这 两 个 地 址 ! 









































>» 


ring.c ) 








口 





// 需要 强制 转化 成 和 返 


值 类 型 一 样 








// 否则 编译 器 会 报 const 





属性 丢失 
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pl } 

了 公 Str+*y 

了 3 } 

74 return NULL; 
.小 

















strcpy 函数 用 于 把 起 始 于 地 址 src 的 字符 串 复 制 到 地 址 dst ， 这 和 memcpy 原理 相同 ， 只 不 过 strcpy 
以 src 处 的 字符 ;0 作为 终止 条 件 ，memcpy 以 拷贝 的 字 节 数 size 为 终止 条 件 。 

strlen 函数 用 于 返回 字符 串 的 长 度 ， 即 字符 数 。 

strcmp 函数 用 于 比较 起 始 地 址 分 别 为 a 和 的 两 个 字符 串 是 否 相等 ， 若 a 中 某 个 字符 的 ASCII 值 大 
于 b 中 同一 相对 位 置 字符 的 ASCII 值 ， 此 时 返回 1， 若 字符 都 相同 ， 则 返回 0， 和 否则 返回 -1。 同 memcpy 
的 原理 相同 ， 区 别 就 是 stremp 以 地 址 a 处 的 字符 串 的 长 度 ， 也 就 是 直到 字符 0 为 终止 条 件 ，memcpy 的 终 
止 条 件 是 size 个 比 对 的 字 节 。 

strchr 返回 的 是 字符 ch 在 字符 串 str 中 ， 从 左 到 右 最 先 出 现 的 所 在 地 址 ， 并 不 是 下 标 ， 这 一 点 请 注意 。 
代码 8-7-3 (project/c8/b/lib/string.c ) 
77 /* 从 后 往 前 查找 字符 串 str 中 首次 出 现 字符 ch 的 地 址 */ 
8 charr strrehrtieonst ehar* ste, Const, Lnte 七 chy 
79 ASSERT (str != NULL); 
80 const char* last char = NULL; . 


81 /* 从 头 到 尾 遍历 一 次 ， 若 存在 ch 字符 ，last_char 总 是 该 字符 最 后 一 次 
出 现在 串 中 的 地 址 (不 是 下 标 ， 是 地 址 ) */ 














让 






















































































































































































82 while (*str != 0) { 

83 if (*str == ch) { 

84 last char = str; 
85 

86 Strt+t+;? 

87 } 

88 return (char*)1last char; 
89 } 


90 
91 /* 将 字符 串 src_ 拼 接 到 dast_ 后 ， 返 回 拼接 的 串 地 址 */ 
92. char* "streat (ehar* det., Const char* sre ) 泽 







































































93 ASSERT(dst_  != NULL && src_ != NULL); 
94 char* str = dst ; 
95 while (*strt+t+); 
96 --str; // 别 看 错 了 ，--str 是 独立 的 一 句 ， 并 不 是 while 的 循环 体 
97 while((*str++ = *src_++)); // 当 *str 被 赋值 为 0 时 
// 也 就 是 表达 式 不 成 立 ， 正 好 添加 了 字符 串 结尾 的 0 














98 return dst ; 

















8 

00 

01 /* 在 字符 串 str 中 查找 字符 ch 出 现 的 次 数 */ 
02. .Uinta tStrehrs(const char stry, "unte tt Gh) A 
08 ASSERT (str != NULL); 

04 Uint32. telent’ =" 0% 

05 const char* p = str; 

06 while(*p != 0) { 

07 if (*p == ch) { 

08 Gh CNt 相 ts 

09 } 

10 p++;? 

让 } 

12 return ch cnt; 

gs 

















strrchr 函数 返回 的 是 从 后 往 前 查找 字符 串 str 中 首次 出 现 字 符 ch 的 地 址 ， 注 意 ， 是 字符 在 字符 串 中 的 
地 址 ， 并 不 是 下 标 值 。 此 函数 虽然 是 从 后 往 前 找 ， 但 原理 上 是 通过 从 前 往 后 〈 从 左 到 右 ) 的 顺序 查找 的 ， 
这 样 的 好 处 是 无 需 事 先知 道 字符 串 的 结束 字符 "0 的 地 址 。 

strcat 函数 的 功能 是 字符 串 拼 接 ， 将 src_ 处 的 字符 串 接 在 dst 的 结尾 处 ， 并 将 dst_ 返回。 实现 原理 是 
将 src_ 处 的 字符 串 找 贝 到 dst 的 结束 处 。 

strchrs 函数 用 于 返回 字符 ch 在 字符 串 str 中 出 现 的 次 数 。 

您 看 ， 是 不 是 很 容易 ? 本 节 很 愉快 地 结束 了 。 















































风 二 
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有 位 图 他 到 ) 拉 及 其 函数 的 实现 
8.4.1 位 图 简介 
们 图， 也 束 是 bitmap， 广 泛 用 于 资源 管理 ， 是 一 种 管理 资源 的 方式 、 手 段 。“ 资 源 ” 包 括 很 多 ， 比 如 
内 存 或 硬盘 ， 对 于 此 类 大 容量 资源 的 管理 一 般 都 会 采用 位 图 的 方式 。 
什么 是 位 图 呢 ? 位 图 包含 两 个 概念 : 位 和 图 。 
立 是 指 bit， 即 字 节 中 的 位 ，1 字 节 中 有 8 个 位 。 图 是 指 map，map 这 个 词 在 很 久之 前 就 介绍 过 啦 ， 地 
图 本 质 上 就 是 映射 的 意思 ， 上 映射， 即 对 应 关系 。 综 合 起 来 ， 位 图 就 是 用 字 节 中 的 1 位 来 映射 其 他 单位 大 小 
的 资源 ， 按 位 与 资源 之 间 是 一 对 一 的 对 应 关系 。 
生活 中 处 处 有 这 样 一 一 对 应 的 例子 ， 比 如 老师 上 课 用 于 点 名 的 名 单 ， 上 面 每 一 个 名 字 都 代表 班 里 某 一 
个 真实 的 同学 ， 去 银行 办 事 也 要 先 排 号 ， 这 个 号 也 是 对 应 某 一 个 来 办 事 的 人 。 
计算 机 中 为 什么 要 使 用 位 图 呢 ? 其 实 我 不 说 您 也 明白 ， 不 过 我 还 是 自由 发 挥 一 下 吧 。 
计算 机 中 的 一 些 资 源 的 数量 非常 庞大 ， 比 如 内 存 容 量 和 硬盘 空间 ， 发 展 到 今天 ,它们 的 容量 还 是 非常 
可 观 的 。 为 了 有 效 使 用 这 些 资源 ， 必 然 要 涉及 到 一 套 管理 这 些 资源 的 方法 。 而 方法 中 必然 要 构建 具体 的 数 
据 结构 来 存储 管理 数据 ， 而 这 些 数 据 结构 本 身 也 要 占用 内 存 ， 也 就 是 说 ,管理 资源 的 方法 是 有 成 本 的 ， 这 



























































































































































































































































































































































个 成 本 当然 是 越 小 越 好 。 您 想 ， 就 拿 内 存 管理 来 说 ， 总 不 能 用 物理 内 存 的 一 半 容 量 来 存储 资源 管理 的 相关 
数据 吧 。 
管理 结构 中 的 数据 也 有 自己 的 单位 大 小 , 被 管理 的 资源 也 有 自己 的 单位 大 小 ， 故 有 效 减少 管理 成 本 的 


























































































































方法 是 使 管理 结构 中 的 单位 达到 最 小 ， 其 所 管理 资源 的 单位 调整 到 最 大 。 此 类 典型 的 案例 有 很 多 ， 比 如 一 
个 足球 大 小 的 地 球 仪 代表 整个 地 球 。 
计算 机 中 最 小 的 数据 单位 是 位 ， 于 是 ， 用 一 组 二 进 制 位 串 来 管理 其 他 单位 大 小 的 资源 是 很 自然 的 事 ， 
这 组 二 进 制 位 中 的 每 一 位 与 其 他 资源 中 的 数据 单位 都 是 一 对 一 的 关系 ， 这 实际 就 成 了 一 种 映射 ， 即 map， 
于 是 这 组 二 进 制 位 就 有 了 更 恰当 的 名 字 一 一 位 图 。 
既然 位 图 本 质 上 就 是 一 串 二 进 制 位 ， 那 对 于 它 的 实现 ,用 字 节 型 数组 还 是 比较 方便 的 ， 数 组 中 的 每 一 
个 元 素 都 是 一 字 节 ， 每 1 字 节 含有 8 位 ， 因 此 位 图 的 1 字 节 对 等 表示 8 个 资源 单位 。 

位 图 中 的 每 一 位 有 两 种 状态 ， 即 0 和 1， 所 以 一 般 情 况 下 ， 位 图 所 管理 的 资源 被 我 们 人 工 划分 为 两 种 

















































































































































































































































































































































































































































































































状态 〈 并 不 是 说 资源 本 身 就 只 有 两 种 状态 )， 状 态 的 定义 是 人 为 的 ， 取 决 于 咱们 怎样 看 竺 它们， 取决 于 管 
理 的 内 容 是 什么 。 位 图 用 0 和 1 这 两 种 状态 反应 实际 所 管理 资源 的 状态 ， 比 如 位 图 中 的 0 表示 该 资源 未 占 
用 ， 位 图 中 的 1 表示 该 资源 已 占用 。 当 然 这 只 是 举例 而 已 ， 具 体 的 意义 要 随 具体 的 应 用 而 定 。 

也 许 我 还 没 把 “管理 结构 的 单位 大 小 ”和 “资源 自己 的 单位 大 小 ”说 清楚 。 举 个 例子 来 说 ， 若 用 位 图 
来 管理 内 存 ， 位 图 中 的 每 一 位 都 将 表示 实际 物理 内 存 中 的 4KB， 也 就 是 一 页 ， = 
即位 图 中 的 一 位 对 应 物理 内 存 中 的 一 页 ， 如 果 某 位 为 0， 表 示 该 位 对 应 的 页 未 ai] 内 
分 配 ， 可 以 使 用 ， 反 之 如 果 某 位 为 1， 表示 该 位 对 应 的 页 已 经 被 分 配 出 去 了 ， ;一 *[a | 存 
在 将 该 页 回收 之 前 不 可 再 分 配 。 这 种 对 应 关系 如 图 8-17 所 示 。 1 

其 中 , “管理 结构 的 单位 大 小 ”是 指 位 图 中 的 1 位 ， 也 就 是 图 8-17 位 图 框 中 。 [ae | 




















的 “ 黑 点 ” “资源 自己 的 单位 大 小 ”就 是 指 以 4KB 为 单位 大 小 的 内 存 ， 也 就 是 。 | 上 于 8 

图 中 每 一 个 4KB 的 小 格子 。 注 意 ， 内 存 本 身 最 小 可 寻 址 单位 是 字 节 ，4KB 是 :| | 

人 为 划分 的 内 存单 位 ， 内 存 中 可 没有 一 个 个 4KB 大 小 的 “格子 ”。 之 所 以 这 样 ” ”| 表示 丛 

做 ， 原 因 就 像 上 面 所 说 的 ， 将 所 管理 资源 的 单位 调整 到 最 大 。 当 然 ， 为 了 高 效 | :: 

管理 ， 这 个 资源 单位 并 不 是 越 大 越 好 ， 得 方便 管理 才 合 适 。 
以 上 是 我 随意 发 挥 的 ， 表 达能 力 有 限 ， 希 望 能 帮助 那些 头 一 次 接触 位 图 的 

同学 。 4 图 8-17 位 图 与 内 存 
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总 结 一 下 ， 位 图 相当 于 一 组 资源 的 映射 。 位 图 中 的 每 一 位 和 被 管理 的 单位 资源 都 是 一 对 一 的 关系 ， 故 
位 图 主要 用 于 管理 容量 较 大 的 资源 。 


8.4.2 位 图 的 定义 与 实现 


上 一 节 中 给 大 伙 介 绍 了 位 图 的 概念 , 不 知道 那些 未 接触 过 位 图 的 同学 是 否 清楚 了 ? 不 过 用 文字 描述 还 
是 有 些 单薄 星 深 ， 对 于 抽象 的 东西 多 说 无 益 ， 咱 们 还 是 看 看 实际 的 位 图 代码 吧 。 
本 节 又 新 增 两 个 文件 bitmap.c 和 bitmap.h， 它 们 位 于 lib/kernel/ 下 ， 咱 们 先 看 下 bitmap.h， 请 见 代 码 8-8。 


代码 8-8 (project/c8/c/lib/kernel/bitmap.h ) 
1 #ifndef _LIB _ KERNEL BITMAP H 
2 #define _LIB KERNEL BITMAP HH 
3 #include "global.hn™ 
4 #define BITMAP MASK 1 
5 
6 
7 






















































































































































































struct bitmap { 
uint32 七 btmp bytes len; 











/* 在 遍历 位 图 时 ， 整 体 上 以 字 节 为 单位 ， 细 节 上 是 以 位 为 单位 ， 
所 以 此 处 位 图 的 指针 必须 是 单字 节 */ 

8 linto t* bitsr 

9 
10 

11 void bitmap init(struct bitmap* btmp); 
12 bool bitmap scan test(struct bitmap* btmp, uint32 七 bit idx); 
L311nt. bitmapseam(stiuct bitmap* btmp urnt32 TC cnt 
14 void bitmap set (struct bitmap* btmp, uint32 七 bit idx, int8 t value); 
15 #endif 


给 大 伙 儿 看 bitmap.h 的 目的 是 想 让 大 伙 儿 先 了 解 位 图 的 结构 struct bitmap， 这 样 在 后 面 介绍 位 图 操作 
函数 时 就 更 容易 理解 了 。 

struct bitmap 中 只 定义 了 两 个 成 员 : 位 图 的 指针 bits 和 位 图 的 字 节 长 度 btmp_bytes_len。 
前 面 和 大 伙 儿 介绍 过 ， 位 图 可 以 使 用 字 节 型 数组 来 生成 ， 如 果 位 图 长 度 事先 已 知 的 话 ， 我 们 可 以 在 struct 
bitmap 中 定义 一 个 字 节 型 数组 成 员 来 充当 位 图 。 当 然 这 也 只 是 愿景 ， 现 实 中 哪 有 那么 多 容易 的 事 ， 我 “悲观 ”的 
原因 是 这 样 的 ， 位 图 长 度 取决 于 所 管理 资源 的 大 小 ， 其 长 度 不 固定 ， 因 此 不 能 在 位 图 结构 struct bitmap 中 生成 
固定 大 小 的 位 图 数组 。 因 此 一 种 “乐观 ”的 解决 方案 是 在 struct bitmap 中 提供 位 图 的 指针 ， 就 是 uint8_t* bits。 
用 指针 bits 来 记录 位 图 的 地 址 ， 真 正 的 位 图 由 上 一 级 模块 提供 ， 并 由 上 一 级 模块 把 位 图 的 地 址 赋值 给 bits 。 

注意 ，bits 的 类 型 是 uint8_ tf， 此 类 型 强调 的 是 字 节 型 指针 ， 最 好 不 要 用 多 字 节 类 型 ， 否 则 在 处 理 时 会 复 
杂 。 因 为 我 们 在 遍历 位 图 时 先是 通过 字 节 来 定位 某 bit 所 在 的 字 节 ， 如 果 将 其 设 为 其 他 类 型 ， 比 如 int32， 在 遍 
历 位 图 时 会 产生 4 字 节 的 跳跃 ， 每 次 处 理 其 中 的 bit 时 要 判断 32 个 bit， 不 如 让 数组 成 员 为 字 节 型 ， 这 样 字 节 
扁 移 量 就 是 数组 元 素 的 索引 ， 定 位 方便 ， 而 且 只 处 理 8 个 bit， 因 此 指针 bits 的 类 型 最 好 设 为 单字 节 大 小 。 

宏 BITMAP MASK 其 值 为 1， 用 来 在 位 图 中 逐 位 判断 ， 主 要 就 是 通过 按 位 与 “人 ”来 判断 相应 位 是 
否 为 1 。 

好 啦 ， 头 文件 就 这 么 简单 ， 下 面 看 下 位 图 的 具体 实现 ， 请 大 伙 儿 参见 代码 8-9。 

代码 8-9 (project/c8/c/lib/kernel/bitmap.c ) 
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1 #include "bitmap .hyn" 

2 #include "stdint.h" 

3 #include "string.h" 

4 #include "print.h" 

5 #include "interrupt.h" 
6 #include "debug.h" 

7 

8 





/* 将 位 图 btmp 初始 化 */ 
9 void bitmap init(struct bitmap* btmp) { 
10 memset (btmp->bits, 0, btmp->btmp bytes len); 
11 } 


























13 /* 判断 bit_idx 位 是 否 为 1， 若 为 1， 则 返回 true， 否 则 返回 false */ 
14 bool bitmap scan test(struct bitmap* btmp, uint32 t bit idx) { 
15 uint32 t byte idx = bit idx / 8; // 向 下 取 整 用 于 索引 数组 下 标 
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16 uint32 t bit odd = bit idqx % 8; // 取 余 用 于 索引 数组 内 的 位 
站 学 return (btmp->pbits [byte idx] & (BITMAP MASK << bit odd)); 
1:82 站 
19 
20 /* 在 位 图 中 申请 连续 cnt 个 位 ， 成 功 ， 则 返回 其 起 始 位 下 标 ， 失 败 ， 返 回 -1 */ 
21 irnt bitmap. scani(struct bitmnap* btmp. int32 Ct cnt) A{ 
22 uint32 t idx byte = 0; 0 记录 空闲 位 所 在 的 字 节 
23 /* 先 逐 字 节 比较 ， 变 力 法 */ 
24 while (( Oxff == btmp->bits[idx byte]) && (idx byte < btmp->btmp bytes len)) 
25 /* 1 表示 该 位 已 分 配 ， 若 为 0xff， 则 表示 该 字 节 内 已 无 空 闪 位 ， 向 下 一 字 节 继续 找 */ 
26 idx bytett+t; 
2 } 
28 
29 ASSERT (idx byte < btmp->btmp bytes len); 
30 if (idx byte == btmp->btmp bytes len) { // 若 该 内 存 池 找 不 到 可 用 空间 
3 return -1; 
32 } 
33 
34 /* 若 在 位 图 数组 范围 内 的 某 字 节 内 找到 了 空闲 位 
35 * 在 该 字 节 内 逐 位 比 对 ， 返 回 空间 位 的 索引 。*/ 
36 Lnt. Ldx Bit 二 07 
37 /* 和 btmp->bits[idx_byte] 这 个 字 节 逐 位 对 比 */ 
38 while ((uint8 t) (BITMAP MASK << idx bit) & btmp->bits[idx byte]) { 
39 导电 生 二 二 站 池 
40 } 
41 
42 int bit idx start = idx byte * 8 + idx bit; // 空闲 位 在 位 图 内 的 下 标 
43 if (cnt == 1) { 
44 return bit idx start; 
45 } 
46 
47 uint32 t bit left = (btmp->btmp bytes len * 8 - bit idx start); 
// 记录 还 有 多 少 位 可 以 判断 
48 uint32:t next bit = bit idx start + ‘13 
49 uint32 t count = 1; yy 记录 找到 的 空闲 位 的 个 数 
50 
51 bit idx start = -1; // 先 将 其 置 为 -1， 若 找 不 到 连续 的 位 就 直接 返 世 
B52 while (bit left-- > 0) { 
53 if (!(bitmap scan _ test (btmp, next bit))) { // 若 next bit 为 0 
54 Count++; 
55 } else { 
56 count = 0; 
57 } 
58 if (count == cnt) { // 若 找到 连续 的 cnt 个 空位 
59 bit idx start = next bit - cnt + 1; 
60 break; 
6 } 
62 next bit++; 
63 } 
64 return bit idx start; 
65-3} 
66 
67 /* 将 位 图 btmp 的 bit_idx 位 设置 为 value */ 
68 void bitmap set (struct bitmap* btmp, uint32 t bit idx, int8 t value) { 
69 ASSERT((value == 0) || (value == 1)); 
70 uint32 t byte idx = bit idx / 8 // 向 下 取 整 用 于 索引 数组 下 标 
71 uint32 t bit odd = bit idx % 8; // 取 余 用 于 索引 数组 内 的 位 
72 
73 /* 一 般 都 会 用 个 0x1 这 样 的 数 对 字 节 中 的 位 操作 
74 * 将 1 任意 移动 后 再 取 反 ， 或 者 先 取 反 再 移 位 ， 可 用 来 对 位 置 0 操作 。*/ 
75 if (value) { // 如 果 value 为 1 
76 btmp->bits[byte idx] |= (BITMAP MASK << bit odd); 
77 else // 若 为 0 
78 btmp->bits[byte idx] &= ~ (BITMAP MASK << bit odd); 
79 
80 } 
给 大 伙 儿 简要 介绍 下 bitmap.c， 代 码 虽 然 不 长 ， 但 今后 我 们 所 用 到 的 位 图 操作 够 用 了 。 
bitmap_init 函数 只 有 一 个 参数 ， 即 位 图 指针 btmp， 此 函数 功能 是 初始 化 位 图 
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btmp， 它 是 月 


月 memset 
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函数 根据 位 图 的 字 节 大 小 btmp_bytes_len 将 位 图 的 每 一 个 字 节 用 0 来 填充 。 
bitmap_scan test 函数 接受 两 个 参数 ， 分 别 是 位 图 指针 btmp 和 位 索引 bit idx。 其 功能 是 判断 位 图 btmp 
中 的 第 bit_idx 位 是 否 为 1， 若 为 1， 则 返回 true， 否 则 返回 false。 此 函数 是 被 bitmap_scan 调用 的 ， 当 想 在 位 


























图 中 获得 连续 多 

















找到 连续 的 cnt 个 可 用 位 









































个 可 用 位 时 ， 逐 次 调用 bitmap_ scan test 依次 判断 。 
bitmap scan 函数 接受 两 个 参数 ， 分 别 是 位 图 指针 btmp 及 位 的 个 数 cnt。 此 函数 的 功能 是 在 位 图 btmp 中 












































， 返 回 起 始 空闲 位 下 标 ， 若 没 找 到 cnt 个 空 亲 位 ， 返 回 -1。 位 图 中 的 位 ， 其 值 为 0 就 
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表示 该 位 对 应 的 资源 可 用 , 故此 函数 的 原理 是 在 btmp->bits 所 指向 的 位 图 中 先 逐 字 节 查找 值 为 0 的 位 所 在 的 
字 节 ， 以 该 字 节 为 起 始 ， 然 后 逐个 判断 每 一 个 位 ， 若 找到 连续 的 cnt 值 为 0 的 空 帮 位 ， 返 回 第 一 个 空闲 位 所 








第 22 行 的 idx_byte 
的 字 节 长 度 btmp_bytes_len 范围 内 逐 字 节 查找， 若 字 节 的 值 不 为 0xff， 就 说 明 该 字 节 里 面 至 少 有 一 个 0， 











于 是 循环 条 件 不 成 立 ， 退 出 循环 。 
第 30 行 ， 如 果 idx_byte 等 于 位 图 的 字 贡 长度， 表示 位 图 已 没有 空闲 位 ， 直 接 返 回 -1。 
























































在 的 下 标 。bitmap_scan 是 位 图 操作 的 核心 方法 ， 其 他 位 图 函数 也 用 到 了 该 函数 中 的 方法 ， 下 面 看 其 实现 。 
















































































] 于 记录 第 一 个 空间 位 所 在 的 字 节 索引 ， 此 变量 用 在 下 面 的 while 循环 中 ， 在 位 图 















































































































































接 下 来 在 该 字 节 内 逐 位 判断 , 第 36 行 定义 一 个 变量 idx_bit, 用 于 记录 此 字 节 内 第 一 个 空闲 位 的 下 标 。 














第 38 行 在 含有 空闲 位 的 字 节 〈idx_byte ) 内 逐个 判断 所 有 位 ， 判 断 的 方法 是 在 while 循环 中 ， 用 





























BITMAP MASK << idx_bit 将 1 逻辑 左 移 到 各 位 ， 然 后 与 该 字 节 内 的 各 位 进行 按 位 与 操作 ， 直 到 按 位 与 的 























结果 为 0 时 退出 


idx_bit 仅仅 是 





循环 ， 

















对 此 找到 空 闪 位 ， 其 下 标 就 记 在 变量 idx_bit 中 。 




















字 节 内 的 索引 ， 其 值 范围 是 0~7， 我 们 在 第 42 行 声明 一 个 变量 bit idx start， 将 idx bit 














转换 成 整个 位 图 内 
在 第 43 行 判断 cnt 

















的 位 索引 ， 方 法 很 简单 ， 就 是 加 了 个 空闲 位 所 在 字 节 的 位 数 : idx_ byte* 8。 














的 大 小 ， 若 只 想 获 取 一 个 空闲 位 ， 即 cnt 为 1 的 话 ，bit idx _start 就 是 最 终 的 结 

















能 访问 到 位 图 外 











直接 在 第 44 行将 其 返回 。 
如 果 cnt 大 于 1， 这 说 明 还 要 继续 在 位 图 中 找 空 闲 位 ， 但 我 们 得 知道 位 图 中 还 有 多 少 个 剩余 位 ， 一 定 不 















































的 内 存 。 














所 以 在 第 47 行 ,用 变量 bit_left 来 记录 位 图 内 还 有 多 少 个 位 可 以 判断 ， 它 的 值 等 于 











位 图 中 位 的 总 数量 减 去 第 一 个 空闲 位 的 索引 ， 即 btmp_bytes_ len* 8 - bit idx start。 











> 














第 48 行 的 next_bit 用 于 记录 位 图 中 下 一 个 待 查找 的 位 ， 它 是 相对 于 整个 位 图 的 位 下 标 。 目 前 也 不 知 
道 next_bit 位 是 空闲 位 〈0)， 还 是 已 经 占用 〈1)， 一 会 要 传 给 函数 bitmap_scan test 去 判断 。 
























































位 count 等 于 cnt 时 ， 就 表示 咱们 成 功 找到 了 cnt 个 空闲 位 。 











第 49 行 的 变量 count 用 于 记录 找到 的 空闲 位 的 个 数 , 我 们 不 是 要 找到 cnt 个 空闲 位 吗 ， 当 找到 的 空闲 


























虽然 bit_idx_start 是 位 图 中 第 一 个 空闲 位 的 下 标 ， 但 我 们 的 目的 是 找到 连续 的 cnt 个 空闲 位 ， 若 找 不 
到 cnt 个 连续 空闲 位 就 失败 返回 。 于 是 在 第 51 行 ， 将 变量 bit_idx_start 置 为 -1， 即 默认 情况 下 找 不 到 cnt 
个 空闲 位 〈 先 悲观 着 没什么 不 好 ， 万 一 有 惊喜 呢 )。 
















































































第 $S2 一 63 行 便 天 


























F 足 马力 ， 通 过 调用 bitmap_scan test 依次 判断 下 一 位 next_bit 是 否 为 0， 即 是 否 为 空 











闲 , 每 判断 一 位 就 在 第 62 行将 next_bitt+。 每 找到 一 个 连续 的 空闲 位 就 将 countt+, 若 下 一 个 位 不 是 空闲 ， 


就 将 count 清 0 
个 空闲 位 的 起 始 























» 从 头 














再 来 重新 找 。 若 发 现 count 等 于 cnt， 说 明 完 成 任务 ， 将 bit idx _start 改 为 连续 cnt 




















， 即 “bit idx_start = next bit - cnt+ 1”。 通 过 break 退出 循环 ， 执 行 “return bit idx_start” 
返回 。 否则 ， 当 bit_left 递减 为 0 时 ， 即 表示 位 图 中 所 有 的 位 都 检索 过 了 ， 于 是 while 循环 条 件 不 成 立 ， 循 
环 退 出 ， 此 时 bit idx_ start 依然 是 -1， 于 是 将 bit idx _start 返回 表示 失败 。 至 此 bitmap_scan 就 介绍 完了 。 





























bitmap_set 接受 三 个 参数 ， 位 图 指针 btmp、 位 索引 bit idx、 位 值 value， 函 数 功能 是 将 位 图 btmp 中 的 














如 果 value 为 1， 直 
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第 bit_idx 位 设置 为 value， 其 中 bit_idx 为 整个 位 图 中 的 位 索引 。 简 要 介绍 下 此 函数 。 

第 69 行 的 ASSERT 用 来 监督 value 的 范围 ， 既 然 是 为 位 设置 值 ，value 要 么 是 0， 要 么 是 1。 

第 70~71 行将 bit_idx 转换 成 相应 的 字 节 byte_idx 及 字 节 内 的 偏 移 bit_odd。 

第 75 一 79 行 是 将 字 节 bits[byte_idx] 中 的 第 bit_odd 位 置 为 value， 也 就 是 将 位 图 中 的 第 bit_ idx 位 的 值 
置 为 value。 对 了 





































































































F value 的 值 ， 这 里 的 处 理 分 两 种 情况 。 


















































接 将 BITMAP MASK( 宏 值 为 1) 左 移 bit odd 位 后 与 位 图 中 的 字 节 bits[byte_idx] 


进行 按 位 或 运算 ， 这 样 该 字 节 中 的 位 bit_odd 便 为 1， 其 他 位 为 原 值 。 

如 果 value 为 0， 即 只 将 字 节 bits[byte idx] 中 的 bit odd 位 置 为 0， 方 法 是 让 某 个 字 节 中 的 bit odd 位 
为 0， 其 他 位 为 1， 然后 将 该 字 节 与 bits[byte_idx] 做 按 位 与 运算 。 这 样 bits[byte_idx] 中 的 第 bit_odd 位 便 
置 为 0， 其 他 位 为 原 值 。 

好 啦 ， 有 关 位 图 操作 的 函数 到 这 里 就 介绍 完了 ， 本 节 到 此 结束 ， 大 伙 儿 辛苦 啦 。 


,人 内 存 管理 系统 


程序 即 是 一 堆 指 令 的 集合 ,而 内 存 是 程序 的 舞台 。 要 想 让 程序 在 计算 机 中 运行 ,必须 要 将 其 加 载 到 内 
存 中 才 可 以 ， 原 因 是 处 理 器 被 设计 成 到 内 存 中 取 指 令 ， 这 就 是 处 理 器 的 代码 段 寄 存 器 CS 和 指令 指针 寄 
存 器 EIP 中 存储 的 是 指令 所 在 的 内 存 地 址 的 原因 。 
用 户 程序 所 占用 的 内 存 空间 是 由 操作 系统 分 配 的， 内 存 是 如 何 分 配 的 并 且 该 给 用 户 进程 分 配 多 少 字 
节 了 呢 ? 这 就 是 咱们 要 解决 的 问题 。 
所 以 ， 从 现在 起 ， 咱 们 要 循序 渐进 地 实现 内 存 管理 系统 ， 一 直到 函数 malloc 和 free 的 完成 。 
当然 ， 饭 要 一 口 一 口 地 吃 ， 做 任何 事情 都 不 能 一 哮 而 就 ， 本 节 咱 们 先 实 现 内 存 管理 系统 的 基础 部 分 ， 
然后 再 完成 简单 的 内 存 分 配 。 


8.5.1 内 存 池 规 划 


通常 情况 下 ， 我 们 所 说 的 地 址 都 是 指 内 存 地 址 。 昌 然 端口 和 扇 区 也 都 是 通过 地 址 定位 ， 但 为 了 与 内 存 
地 址 区 分 ， 它 们 的 地 址 亦 分 别称 为 端口 号 和 逻辑 扇 区 号 ， 所 以 ， 地 址 和 内 存 几 乎 被 我 们 一 视 同 仁 ， 地 址 和 
内 存 ， 它 们 虽然 一 一 对 应 ， 但 却 是 两 套 不 同 的 资源 。 

我 们 知道 ， 内 核 和 用 户 进程 分 别 运行 在 自己 的 地 址 空间 ， 在 实 模式 下 ， 程 序 中 的 地 址 就 等 于 物理 地 址 ， 
实 实在 在 ， 这 没什么 好 说 的 。 在 保护 模式 下 ， 程 序 地 址 变 成 了 虚拟 地 址 ， 虚 拟 地 址 对 应 的 物理 地 址 是 由 分 
页 机 制 做 的 映射 。 因 此 ， 在 分 页 机 制 下 有 了 虚拟 、 物 理 这 两 种 地 址 ， 操 作 系统 有 责任 把 这 两 种 地 址 分 别管 
理 ， 并 通过 页 表 将 这 两 类 地 址 关联 。 我 们 本 节 所 讨论 的 就 是 有 关 这 两 类 地 址 的 内 存 池 规 划 问 题 。 

十 么 是 内 存 池 ? 本 文 所 讨论 的 内 存 池 ， 其 实 称 为 内 存 地 址 池 更 为 恰当 。 

池 ， 意 为 池塘 ， 也 就 是 水 源 仓库 ， 它 起 到 水 源 存储 、 集 中 管理 的 作用 ， 需 要 水 的 时 候 直接 从 池 中 取出 
即 可 。 内 存 地 址 池 的 概念 是 将 可 用 的 内 存 地 址 集中 放 到 一 个 “池子 ”中 ， 需 要 的 时 候 直 接 从 里 面 取出 ， 用 
完 后 再 放 回 去 。 由 于 在 分 页 机 制 下 有 了 虚拟 地 址 和 物理 地 址 ， 为 了 有 效 地 管理 它们 ,我 们 需要 创建 虚拟 内 
存 地 址 池 和 物理 内 存 地 址 池 。 

咱们 先 讨论 下 如 何 规划 物理 内 存 池 。 
不 管 怎么 说 ， 内 核 和 用 户 进程 肯定 都 要 运行 在 物理 内 存 之 中 。 问 题 来 了 ， 哪 些 物理 内 存 用 来 运行 内 核 ， 
哪些 物理 内 存 用 来 运行 用 户 进程 呢 ? 咀 们 先 看 看 物理 内 存 的 规划 。 

一 种 可 行 的 方案 是 将 物理 内 存 划 分 成 两 部 分 , 一 部 分 只 用 来 运行 内 核 , 另 一 部 分 只 用 来 运行 用 户 进 程 ， 
将 内 存 规划 出 不 同 的 部 分 ， 专 项 专用 。 

操作 系统 为 了 能 够 正常 运行 ， 不 能 用 户 进程 申请 多 少 内 存 就 分 配 多 少 ， 必 须 得 给 自己 预 留 出 足够 
的 内 存 才 行 ， 否则 有 可 能 会 出 现 因为 物理 内 存 不 足 ， 导 致 内 核 自 己 都 无 法 正常 运行 、 自 身 难 保 的 现象 。 

基于 这 个 原因 ,我 们 把 物理 内 存 分 成 两 个 内 存 池 ， 一 部 分 称 为 用 户 物理 内 存 池 ， 此 内 存 池 中 的 物理 内 
存 只 用 来 分 配给 用 户 进程 。 另 一 部 分 就 是 内 核 物理 内 存 池 ， 此 内 存 池 中 的 物理 内 存 只 给 操作 系统 使 用 。 
即使 是 从 池塘 中 取水 ， 每 次 也 只 是 取出 一 小 部 分 ， 要 么 用 水 桶 盛 水 ， 要 么 用 盆 盛 水 ， 总 之 每 次 取水 都 会 有 
一 个 容量 单位 ， 不 会 一 次 就 把 整个 池塘 的 水 都 取 走 ， 当 然 连 续 多 次 取水 还 是 有 可 能 的 。 从 内 存 池 中 获取 内 存 资 
源 也 是 一 样 的 ， 内 存 池 中 的 内 存 也 得 按 单位 大 小 来 获取 ， 这 个 单位 大 小 是 4KB， 称 为 页 ， 故 ， 内 存 池 中 管理 
的 是 一 个 个 大 小 为 4KB 的 内 存 块 ， 从 内 存 池 中 获取 的 内 存 大 小 至 少 为 4KB 或 者 为 4KB 的 倍数 (以 后 咱们 会 
实现 更 细 粒 度 的 内 存 管 理 ， 但 是 ， 这 依然 不 是 直接 从 内 存 池 中 获取 ， 它 需要 另外 一 种 管理 结构 ， 这 是 后 话 )。 
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为 了 方便 实现 ， 咱 们 把 这 两 个 内 存 池 的 大 小 设 为 一 致 ， 即 各 占 一 半 的 物理 内 存 ， 如 图 8-18 所 示 。 

当 用 户 内 存 池 中 的 内 存 都 被 用 户 进程 耗 尽 时 ， 不 再 向 内 核 内 存 池 申请 ， 而 是 返回 信息 “内 存 不 足 ” 拒绝 请 求 。 

下 面 再 讨论 下 虚拟 内 存 地 址 池 。 

先 来 点 前 情 提 要 ， 就 当 是 与 大 伙 儿 回顾 下 。 在 分 页 机 制 下 程序 中 的 地 址 都 是 虚拟 地 址 ， 虚 拟 地 址 的 范 
围 取决 于 地 址 总 线 的 宽度 ， 咱 们 是 在 32 位 环境 下 ， 所 以 虚拟 地 址 空间 为 4GB。 除 了 地 址 空间 比较 大 以 外 ， 
分 页 机 制 的 另 一 个 好 处 是 每 个 任务 都 有 自己 的 4GB 虚拟 地 址 空间 ， 也 就 是 各 程序 中 的 虚拟 地 址 不 会 与 其 
程序 冲突 ， 都 可 以 为 相同 的 虚拟 地 址 ， 不 仅 用 户 进程 是 这 样 ， 内 核 也 是 。 程 序 中 的 地 址 是 由 链接 器 在 链 
接 过 程 中 分 配 的 ， 分 配 之 后 就 不 会 再 变 了 ， 运 行 时 按部就班 地 送 上 处 理 器 的 CS 和 EIP 即 可 。 
但 程序 进程、 内核 线程 ) 在 运行 过 程 中 也 有 申请 内 存 的 需求 ， 这 种 动态 申请 内 存 一 般 是 指 在 堆 中 申请 内 存 ， 
操作 系统 接受 申请 后 ， 为 进程 或 内 核 自己 在 堆 中 选择 一 空闲 的 虚拟 地 址 ， 并 且 找 个 空闲 的 物理 地 址 作为 此 虚拟 地 
址 的 映射 ， 之 后 把 这 个 虚拟 地 址 返回 给 程序 。 那 么 问题 又 来 了 ， 哪 些 虚 拟 地 址 是 空闲 的 ? 如 何 跟踪 它们 的 ? 

对 于 所 有 任务 〈 包 括 用 户 进程 、 内 核 ) 来 说 ， 它 们 都 有 各 自 4GB 的 虚拟 地 址 空间 ， 因 此 需要 为 所 有 
任务 都 维护 它们 自己 的 虚拟 地 址 池 ， 即 一 个 任务 一 个 。 

内 核 为 完成 某 项 工作 , 也 需要 申请 内 存 , 当然 它 绝对 有 能 力 不 通过 内 存 管 理 系统 申请 内 存 , 先 斩 后 奏 ， 
或 者 奏 都 不 奏 一 声 ， 直 接 拿 来 就 用 。 当 然 ， 这 种 “王者 之 风 ” 显 然 不 是 那么 和 谐 ， 我 们 让 内 核 也 通过 内 存 
管理 系统 申请 内 存 ， 为 此 ， 它 也 要 有 个 虚拟 地 址 池 ， 当 它 申请 内 存 时 ， 从 内 核 自 己 的 虚拟 地 址 池 中 分 配 虚 
拟 地 址 ， 再 从 内 核 物 理 内 存 池 内核 专用 ) 中 分 配 物理 内 存 ， 然 后 在 内 核 自己 的 页 表 将 这 两 种 地 址 建立 好 
映射 关系 。 

对 用 户 进程 来 说 ， 它 向 内 存 管理 系统 ， 即 操作 系统 ， 申 请 内 存 时 ， 操 作 系 统 先 从 用 户 进程 自己 的 虚拟 
地 址 池 中 分 配 空闲 虚拟 地 址 ， 然 后 再 从 用 户 物理 内 存 池 所 有 用 户 进 程 共 享 ) 中 分 配 空 闲 的 物理 内 存 ， 然 
后 在 该 用 户 进程 自己 的 页 表 将 这 两 种 地 址 建立 好 映射 关系 。 

为 方便 管理 ， 虚 拟 地 址 池 中 的 地 址 单位 也 是 4KB， 这 样 虚拟 地 址 便于 和 物理 地 址 做 完整 页 的 映射 。 有 
了 虚拟 地 址 池 和 物理 地 址 池 后 ， 它 们 的 关系 如 图 8-19 所 示 。 
















































































































































































































































































































































































































































































































































































































































































































































































































































































农妇 内 入 
虚拟 
地 址 池 页 表 物理 内 存 
EE 四 | 7 
虚拟 页 | 、 省 物理 页 | A 
ed a 虚拟 页 | | 物理 页 | -> 
物理 内 存 划分 为 两 个 内 存 池 开机 页 |、、| 物理 页 ”上 
入 村 / 内 存 池 
所 有 | 内核 内 存 池 
物理 二 7 > 
S 2 拟 页 | ->| 物理 页 | ,| 虚拟 页 |---->| 物理 页 |/ 
内 丰 jw 存 池 a 
虚拟 页 | “| 物理 页 | 虚拟 页 | 一 “>| 物理 页 上 
物理 内 存 页 (4KB) we ji 
用 户 进程 A ”用户 进 程 A 用户 进程 B 户 进程 B 
RR 虚拟 ”页 表 虚拟 ”页 表 ” 
用 户 进程 使 地 址 池 地 址 池 
4 图 8-18 ”内 存 池 示 意 A 图 8-19 ”虚拟 地 址 池 与 物理 地 址 池 












































无 论说 得 再 怎么 细致 都 不 如 自己 动手 做 一 遍 来 得 清楚 ， 咱 们 马上 动手 实践 。 
本 节 在 kernel 目录 下 新 建 了 两 个 文件 memoryh 和 memoryc， 有 关内 存 管理 的 代码 都 写 在 其 中 。 在 头 文 件 
中 定义 了 虚拟 地 址 结构 ， 咱 们 一 睹 为 快 ， 如 代码 8-10 所 示 。 


代码 8-10 ( c8/d/kernel/memory.h ) 















































#ifndef _ KERNEL MEMORY H 
#define KERNEL MEMORY H 
#include "stdint.h" 
#include "bitmap.h" 





wD 


382 
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里 ， 在 页 表 中 完全 可 以 直接 把 虚拟 地 址 和 


页 表 的 映射 关系 
其 中 虚拟 地 址 是 逻辑 上 的 ， 通 常 可 指 




















6 /* 虚拟 地 址 池 ， 用 于 虚拟 地 址 管理 */ 
7 struct virtual addr { 
8 struct bitmap vaddr bitmap; // 虚拟 地 址 用 到 的 位 图 结构 
9 uint32 t vaddr start; // 虚拟 地 址 起 始 地 址 
10 
本 
12 extern struct pool kernel pool, user pool; 
13 void mem init (void); 
14 #endif 
memory.h 比较 简单 ， 主 要 就 是 定义 了 struct virtual addr， 此 结构 就 是 虚拟 地 址 池 ， 用 于 虚拟 地 址 管理 。 
坦白 说 ，struct virtual addr 是 不 必要 的 ， 对 于 虚拟 地 址 的 管 
物理 地 址 一 一 对 应 ， 这 样 实现 还 更 简单 ， 一 对 一 映射 是 最 方便 的 。 不 过 ， 即 使 没 学 过 操作 系统 课程 ， 大 伙 
儿 也 都 有 所 了 解 ， 虚拟 地 址 与 物理 地 址 是 两 种 不 同 的 地 址 概念 ， 它 们 是 通过 分 页 机 种 
关联 到 一 块 的 ， 也 就 是 说 ， 虚 拟 地 址 和 物理 地 址 是 各 自 独立 不 相关 的 。] 
程序 中 的 地 址 ， 其 具有 连续 性 。 物 理 地 址 是 指 分 布 在 物理 内 存 中 的 真实 地 址 ， 可 以 连续 ， 也 可 以 不 连续 ， 为 


了 演示 


bitmap 





以 拥有 相同 的 虚拟 地 址 ,但 究 其 原因 ， 是 因为 这 些 虚 拟 地 址 所 对 应 的 物理 地 址 是 不 同 的 。 但是, 在 





进程 内 




































































分 页 机 制 是 如 何 将 这 两 种 独立 不 相关 的 地 址 关联 到 一 起 的 ， 特 意 加 了 此 结构 体 用 于 管理 虚拟 地 址 。 
继续 说 代码 ，struct virtual_addr 包含 两 个 成 员 ， 一 个 是 vaddr_bitmap， 它 的 类 型 是 位 图 结构 体 struct 






































， 用 来 以 页 为 单位 管理 虚拟 地 址 的 分 配 情况 ， 对 ， 您 没 看 错 ， 虚 拟 地 址 也 要 分 配 。 虽 然 多 个 ; 






























































进程 可 


















































的 虚拟 地 址 必然 是 唯一 的 ， 这 通常 是 由 链接 器 为 其 分 配 的 ， 由 链接 器 负责 虚拟 地 址 《程序 























的 唯 



































性 。 但 进程 在 运行 时 可 以 动态 从 堆 中 申请 内 存 ， 系 统 为 其 分 配 的 虚拟 地 址 也 属于 此 进程 的 虚 


























空间 ， 












































也 必须 要 保证 虚拟 地 址 的 唯一 性 ， 所 以 ， 


WE 


位 图 来 记录 虚拟 地 址 的 分 配 情况 。 



































vaddr_start 用 来 记录 虚拟 地 址 的 起 始 值 ， 咱 们 将 来 在 分 配 虚拟 地 址 时 ， 将 以 这 个 地 址 为 起 始 分 
他 的 部 分 是 一 些 声明 ， 它 们 都 在 memory.c 中 有 具体 的 实现 ， 在 此 不 解释 了 。 


























下 





























面 咱们 看 看 memory.c 的 具体 代码 。 























为 方便 大 伙 儿 阅读 ， 我 已 把 代码 划分 成 三 部 分 贴 出 来 。 大 伙 先 请 看 代码 8-11-1。 
代码 8-11-1 (project/c8/d/kernel/memory.c ) 
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5 
6 
7 
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3 
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3 





30 








#include "memory.h" 
#include "stdint.h" 
#include "Print.hn 


#define PG SIZE 4096 





/类 类 类 类 火炎 火炎 大 类 炎炎 类 类 类 类 大大 类 类 类 大 六 太 位 图 地 址 天 类 类 类 类 类 六 类 炎炎 大业 类 火炎 炎炎 炎炎 类 炎 炎炎 炎炎 次 类 类 大 





















































* 因为 0xc009f000 是 内 核 主线 程 栈 顶 ，0xc009e000 是 内 核 主线 程 的 pcb。 


* 一 个 页 框 大 小 的 位 图 可 表示 128MB 内 存 ， 位 图 位 置 安排 在 地 址 0xc009a000， 
































* 这 样本 系统 最 大 支持 4 个 页 框 的 位 图 ， 即 512MB */ 
#define MEM BITMAP BASE 0xc009a000 








/ 术 业 类 炎炎 火炎 类 类 类 类 大 类 类 大 类 大 大 类 类 类 大 类 大 大 类 大 类 大 大 类 大 类 大 大 类 大 类 大 类 大 大 类 大 类 大 大 类 大 类 大 大 大 大 类 大 大 大 大 类 大 大 大 大 大 大 了/ 


/* 0xc0000000 是 内 核 从 虚拟 地 址 3G 起 。 
00000 意 指 跨 过 低 端 1MB 内 存 ， 使 虚拟 地 址 在 逻辑 上 连续 */ 
#define K HEAP START 0xc0100000 


/* 内 存 池 结构 ， 生 成 两 个 实例 用 于 管理 内 核 内 存 池 和 


Strnrt PODL. 4 















































子 池 类 太 























内 
struct bitmap pool bitmap; // 本 内 存 池 用 到 的 位 图 结构 ， 
uint32 t phy addr start; // 本 内 存 池 所 管 



































F 管 理 物 理 内 存 




















uint32 t pool size; // 本 内 存 池 字 节 容量 
】} 


管理 物理 内 存 的 起 始 地 址 


























struct pool kernel pool，user pool; // 生成 内 核 内 存 池 




















和 内 存 池 
struct virtual addr kernel vaddr;  // 此 结构 用 来 给 内 核 分 配 虚 拟 地 址 





/* 初始 化 内 存 池 */ 

static void mem pool init (uint32 t all mem) 
But str( mem pool init start\n"); 
uint32 t page table size = PG SIZE * 256; 





司 一 个 





内 地 址 ) 
拟 地 址 











配 。 其 


383 


下 


各 
已 





和 5 行 定义 了 宏 PG_SIZE， 
11 行 定 义 了 宏 MEM _ BITMAP BASE， 




















// 页 表 大 小 


A 














1 页 的 页 第 0 和 第 768 


个 页 














录 项 指向 同一 个 页 表 + 




















/ 第 769 一 1022 个 页 目录 项 共 指向 254 个 页 表 ， 


EE: 














uint32 t used mem = page ta 
// 0x100000 为 





uint32 七 free mem = all 
uint16 t all free pages = free mem / 
页 为 4KB， 不 管 总 内 存 是 不 是 4k 的 倍数 











ble size 十 


_mem - used mem; 





共 256 个 页 





0x100000; 
氏 端 1MB 内 存 





PG_SIZE; 














// 对 于 以 页 为 单位 的 











内 存 分 配 策略 ， 不 足 

















1 的 内 各 


沪 了 





FE 工 内 全 个 























j 以 表示 页 的 尺 
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寸 ， 





值 为 4096， 即 4KB。 
































选择 这 个 数 呢 ? 














这 其 实 和 进程 PCB 或 线程 TCB (PCB 程序 控 人 
暂且 称 之 为 PCB 

注意 的 是 PCB 所 
是 0xXXXXXXfff。 也 就 是 不 能 跨 页 
进程 或 线程 的 “身份 证 ” 任何 一 个 进程 都 包含 一 个 PCB 乡 





3 以 表示 














内 存 位 图 的 基 址 ， 





有 为 0xc009a00 


























I 块 ，TCB 线程 控 























| 1 页 内 存 ， 








巴 。 将 来 我 们 所 实现 的 PCB 要 占 



































占用 的 内 存 必须 是 自然 页 ， 









































ft 二 











为 方便 叙述 PCB 的 结构 ， 假 如 PCB 四 
0xXXXXX000 以 上 存储 





纪 














说 )。PCB 的 最 高 处 0xXXXXXffF 以 下 | 
因为 压 栈 操作 的 原型 





的 地 和] 


的 是 进程 或 线程 的 
j 于 进程 





















































是 栈 指针 esp 先 





























占用 ，PCB 必须 是 完整 、 血 


址 是 0xXXXXX000。PCB 结构 是 这 样 
言 息 ， 这 包括 pid、 进 程 状态 等 (以 后 在 介绍 线程 时 是 


自 减 ， 然 后 再 往 E 





即 PCB 要 占用 








0， 为 什么 要 


央 块 ) 结构 有 一 定 关 系 。 为 方便 讨论 我 们 
4KB 大 小 的 内 存 空 间 ， 不 过 
自然 页 就 是 页 的 起 始 地 址 必须 是 0xXXXXX000， 终 止 地 址 必须 


要 

















日 




















王 



































单独 地 占用 一 个 物理 页 框 。 


LE| 





吉 构 。 








顺便 说 


句 ，PCB 


的 ， 在 PCB 的 最 低 处 














或 线程 在 0 特权 级 下 所 使 用 的 栈 。 
减 后 的 地 址 处 存储 数据 ， 故 ， 作 
































初始 的 栈 顶 便 是 此 页 框 的 最 顶端 +1， 即 下 一 个 页 框 的 起 始 处 ， 也 就 是 0xXXXXXfff+ 1 。 


程序 都 有 个 主线 程 ,， 





三 
XE 


了 


其 实 ， 我 们 王 





























门 得 给 它 个 


名 份 ， 











们 的 内 核 也 是 一 样 ， 这 个 主线 程 就 是 指正 式 进 入 内 核 H 
是 main 线程 。main 线程 一 直 存 在 ， 它 调用 了 init all 来 做 各 科 
它 默默 地 为 咱们 做 了 这 么 多 ， 咱 


了 跟 大 伙 儿 








E 何 进程 或 线程 











也 就 是 说 ， 它 必须 也 要 有 个 PCB。 


























才 所 运行 的 程序 ，]j 
初始 化 的 工作 ， 将 来 还 要 初始 化 线程 等 。 您 看 ， 

















i 


























实 如 此 。 
为 PCB 要 占用 一 个 E 















































内存 空间 ， 我 们 偏 
我 们 # 


双 低 端 1MB 的 内 存 做 的 是 对 等 映射 )， 











间 


而 疑惑 。 现 石 











FE 您 是 否 有 季 然 开朗 








不 过 话 又 说 回来 了 ， 


已 经 为 main 预 留 了 PCB 的 空间 ， 正 
过 mov esp, 0xc009f000 将 内 核 所 使 用 的 栈 顶 指向 0xc009f000， 
0xc009e000， 对 ， 确 
正 是 因 然 页 ， 所 以 ， 在 低 端 1MB 的 内 存 布 
篇 把 0x9f000 作为 内 核 栈 顶 (0xc009f000 对 应 的 物理 





如 








大 
































地 址 是 0x9f00 














j 不 是 mov esp，0xc009fc00， 还 为 ; 





的 感觉 了 ? 























FI 





EC: 





GANXE 
的 实现 机 








中 ， 栈 指针 也 会 在 PCB 


的 个 





上 忌 \ 噩 


-这 立 | 























竺 我们 
不 断 上 下 游 动 ， 








| 




















了 分。 所 以 在 原理 




















只 是 这 村 


一 来 ，3 





节 〈0xc009fc00 一 0xc009ffff )。 


我 们 的 内 核 预计 在 70KB 左右 ， 装 载 到 0x9f000 以 下 是 绰绰有余 的 ， 所 以 ， 
是 我 们 在 























氏 端 1MB 中 所 用 到 的 最 高 地 址 。 
虚拟 机 配置 了 32MB 的 物理 



























































故 一 页 大 小 的 位 








图 可 管理 














不 过 为 了 扩展 ， 我 们 可 以 更 有 
既然 0xc009e000 已 经 是 主线 程 的 PCB, 一 页 大 小 为 0x1000， 故 再 
0xc009a000。 故 我 们 有 


不 矢 


一 会 儿 在 介绍 内 存 池 初 始 化 函数 mem_pool_init 时 
第 15 行 定义 了 宏 K_HEAP_START， 用 来 表示 内 核 所 使 / 


384 





F 性 一 点 ， 在 此 打算 支 











的 位 图 地 址 为 0xc009a000。 
[ 道 大 伙 儿 有 没有 想 过 ， 为 什么 一 定 要 在 人 


























， /人 4 要 保 订 


mov esp， Oxc009fc00 
线程 main 的 PCB 就 不 完美 了 ， 别 人 的 PCB 都 是 4096 字 节 ， 


内 存 ， 这 32MB 物理 
128MB 的 内 存 。 对 于 目前 的 32MB 内 存 来 说 ， 





FEPCB 日 




















主线 程 的 栈 顶 

















们 在 loader.S 中 所 做 的 ， 在 进入 内 核 之 前 ， 
此 您 肯定 知道 了 将 来 主线 程 的 PCB 地 址 


的 起 始 地 址 是 自然 页 就 好 ， 因 为 程序 在 运行 过 程 
比 ， 在 不 破坏 程序 或 线程 信息 的 情况 下 ， 栈 项 可 以 在 此 页 内 
巴 主线 程 的 栈 顶 初始 化 为 0xc009fe00 也 是 可 以 的 ， 


通 


局 中 ， 明 明 有 一 段 0x7E00~0x9FBFF 





0， 因 为 在 页 


良 费 了 0xc00 字 节 








主线 程 的 PCB 少 了 0x400 字 


地 址 0x9f000 























内 存 需 要 1024 字 ? 


的 位 图 ， 也 就 是 仪 占 


U 








分 之 一 页 ， 




















一 页 内 存 来 存储 位 








区 





还 浪费 呢 ， 




















多 








持 4 页 内 存 的 位 





， 即 最 大 可 管理 S12MB 的 















































物理 内 存 。 





减 去 4 页 ， 即 0xc009e000 - 0x4000 = 





氏 端 1MB 内 存 以 内 为 位 图 选 地 址 呢 ? 暂时 
再 揭晓 答案 。 
的 堆 空 间 起 始 虚拟 地 址 ， 





















































上 ~ A 
E 留 点 伏笔 ， 


0xc0100000。 








内 核 也 是 程序 ， 


们 为 此 也 定义 了 内 核 所 
K_HEAP_START 的 作用 ， 
在 loader 中 我 们 已 经 通过 设置 页 表 把 虚拟 地 址 0xc0000000 一 0xc00ff8F 映射 到 了 物理 地 址 0x00000000 一 
内 存 )， 故 我 们 为 了 让 虚拟 地 址 连续 ， 将 堆 的 起 始 虚拟 地 址 设 为 0xc0100000。 
[以 不 连续 ， 不 过 让 其 连续 不 是 显得 紧凑 一 些 吗 ? 这 并 不 是 强制 的 。 





0x000fffff《〈 低 端 1MB 的 
当然 ， 虚 拟 地 址 也 可 














它 偶 尔 也 需要 动态 申请 内 存 来 完成 某 项 
































工作 ， 动 态 申请 的 内 存 都 是 在 堆 空 间 中 完成 的 ， 我 















































] 的 堆 空 间 ， 堆 也 是 内 存 ， 内 












































堆 的 起 始 虚拟 地 址 。 




















存 就 得 有 地 址 ， 从 哪个 地 址 开始 分 配 呢 ? 这 就 是 




































































这 里 给 大 伙 提 醒 一 下 ， 物 理 地 址 0x100000 一 0x101 











表 ， 因 此 将 来 的 内 核 虚 拟 

















内 存 起 始 地 址 。pool size 是 本 物 型 
您 看 ，struct pool 与 struct virtual addr 同样 都 是 地 芭 
pool size 成 员 ， 


虚拟 地 址 池 和 物理 















































ff， 是 我 们 已 经 在 loaderS 中 定义 好 的 页 目录 及 页 

















也 址 0xc0100000 一 0xc0101fff 并 不 映射 到 这 两 个 物理 地 址 ， 必 须要 绕 过 它们 。 
第 17 行 是 内 存 管 理 的 主角 ， 物 理 内 存 池 结 构 体 ，struct pool， 用 它 来 管理 本 内 存 池 中 的 所 有 物理 内 存 。 此 































































































结构 中 定义 了 三 个 成 员 ，pool bitmap 是 本 内 存 池 用 于 管理 























内 存 的 位 图 结构 ，phy_addr_start 是 本 内 存 池 的 物理 



























































尽管 虚拟 地 址 空 
地 址 池 分 别 定 义 了 两 个 结构 。 








第 24 一 25 





变量 ， 以 后 的 内 存 管 理 








内 存 池 的 内 存 容量 ， 因 为 物理 地 址 是 有 限 的 。 
上 池 结 构 ， 但 和 struct pool 相 比 ，struct virtual addr 中 没有 







































































间 最 大 是 4GB， 但 相对 来 说 是 无 限 的， 不 需要 指定 地 址 空间 大 小 。 因 此 





行 定义 了 内 核 物 理 内 存 池 变量 kernel_pool 和 用 户 物理 内 存 池 变 量 user_pool, 它们 都 是 全 局 



























































都 需要 用 到 这 两 个 变量 ， 它 们 在 函数 mem_pool_init 中 被 初始 化 。 








在 继续 介绍 函数 mem pool init 之 前 ， 和 暂且 移 步 代码 8-11-3 的 最 后 几 行 ， 这 里 有 函数 mem pool init 的 调用 ， 














El 


























伙 儿 还 记得 内 存 容量 是 妇 





3 们 先 看 看 传 进来 的 是 人 
在 代码 8-11-3 中 的 第 94 行 定 义 了 变量 mem bytes_ total， 它 用 来 存储 机 器 上 安装 的 物理 内 存 总 量 。 大 
上 何 获取 的 吗 ? 在 loader.S 中 ， 为 了 获取 内 存 容量 ， 我 们 用 了 三 种 BIOS 方法 ， 最 


么 参数 。 

















































































































终 把 获取 到 的 内 存 容量 保存 在 汇编 变量 total mem bytes 中 ， 其 物理 地 址 为 0xb00。total mem bytes 是 用 
伪 指 令 dd 来 定义 的 ， 其 宽度 是 32 位 ， 因 此 ， 我 们 先 把 0xb00 转换 成 32 位 整 型 指针 ， 再 通过 * 对 该 指 























接 下 来 在 第 95 




















行将 此 内 存 容量 值 传 给 

















函数 mem pool init 


all_ mem 的 大 小 初始 化 物 到 


是 时 候 揭 开 之 前 留 下 上 


























针 做 取 值 操作 ， 这 样 就 获取 到 了 内 存 容量 。 这 就 是 代码 “*(*(uint32_t*)(0xb00))” 的 意义 。 
函数 mem_pool init， 让 函数 mem_pool init 将 它 分 配给 各 物理 
内 存 池 ， 好 ， 咱 们 再 回来 细 说 代码 8-11-1 中 mem pool init 函数 的 实现 。 
接受 一 个 参数 ，all mem， 此 参数 表示 内 存 容量 ， 函 数 的 功能 是 根据 内 存 容 
































内 存 池 的 相关 结构 。 
的 伏笔 了 ， 为 什么 要 将 位 图 地 址 选 在 低 端 1MB 以 下 呢 ? 



























































内 存 管 理 中 所 使 用 的 数 所 






































tr 



































昌 结 构 必然 也 要 保存 在 内 存 中 , 即 内 存 管理 系统 自己 也 要 占用 内 存 , 那 它 还 要 

















管理 自己 所 占 的 内 存 吗 ? 

















9 己 管理 自己 似乎 有 点 “复杂 ”， 























般 的 内 存 管理 系统 所 管理 





当然 包括 内 存 管 理 
0xc009a000 (0x9a000) 的 原 























E 的 是 那些 空 闪 的 内 存 ， 虹 
相关 数 于 























不 要 再 动脑 筋 了 ， 其 实用 不 着 那么 麻烦 的 ， 一 


pe 


























已 被 使 用 的 内 存 是 不 在 内 存 池 中 的 ,“ 已 使 用 的 内 存 ” 






























































不 用 考虑 它 占 























] 的 内 存 了 。 下 
第 30 行 定义 了 变量 page table size， 
Ne 























表 大 4 





间 ， 第 769 一 1022 个 页 目录 项 并 





出 











结构 所 占 的 内 存 ， 位 图 就 是 用 于 管理 内 存 的 数据 结构 ， 这 也 是 位 图 地 址 选 为 
因 ， 此 地 址 位 于 低 端 1MB 之 内 ， 这 里 
下 咱们 看 看 具体 的 实现 吧 。 

它 用 来 记录 页 目录 表 和 页 表 占 用 的 字 节 大 小 ， 总 大 小 等 于 页 目录 
+ 页 表 大 小 。 页 目录 大 小 为 1 页 框 ， 第 0 和 第 768 个 页 目录 项 指向 同一 个 页 表 ， 它 们 共享 这 1 页 框 空 









































摆 的 内 存 几乎 都 被 占用 了 ， 因 此 我 们 就 










































































2MB。 注 意 ， 最 后 


个 页 目录 项 (外 








从 指向 254 个 页 表 ， 故 页 表 总 大 小 等 于 256*PG SIZE， 共 计 0x200000 字 节 ， 
名 1023 个 pde) 指向 页 目录 表 ， 因 此 不 重复 计算 空间 。 


























第 32 行 定义 了 变量 used_mem， 它 用 来 记录 当前 已 
和 低 端 0x100000 字 节 (1MB ) 内 存 。 





三 


























第 34 行 定 








第 33 行 定义 变量 free mem， 它 用 来 存储 目前 可 
便 是 free_mem。 


义 了 变量 all free pages， 它 用 来 保存 可 














使 用 的 内 存 字 节 数 ， 这 包括 页 表 大 小 page_table_size 
































j 的 内 存 字 节 数 ， 














St 














总 内 存 all mem 减 去 used_mem 


























内 存 字 节 数 free mem 转换 成 的 物理 页 数 ， 因 为 内 





























存 池 中 的 内 在 


# 位 是 物理 








上 做 。 
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此 函数 的 其 余部 分 还 要 看 代码 8-11-2 和 代码 8-11-3。 咱 们 继续 。 


代码 8-11-2 (project/c8/d/kernel/memory.c ) 








36 uint16 t kernel free pages = all free pages / 2; 
3;7 uint16 t user free pages = all free pages - kernel free pages; 
38 








39 /* 为 简化 位 图 操作 ， 余 数 不 处 理 ， 坏 处 是 这 样 做 会 丢 内 存 。 

40 好 处 是 不 用 做 内 存 的 越界 检查 ， 因 为 位 图 表示 的 内 存 少 于 实际 物理 内 存 */ 
uint32 t kbm length = kernel free pages / 8; 

Kernel BitMap 的 长 度 ， 位 图 中 的 一 位 表示 一 页 ， 以 字 节 为 单位 
uint32 t ubm length = user free pages / 8; 

User BitMap 的 长 






















































































) 电 


41 

// 

42 

// 

43 

44 uint32 七 kp_ start = used mem 

// Kernel Pool start, 内 核 内 存 池 的 起 始 地 址 

45 uint32 t up_ start = kp start + kernel free pages * PG SIZE; 
// User Pool start, :内存 池 的 起 始 地 址 

46 
47 
48 
49 
50 























kernel pool.phy addr start 
user pool.phy addr start 


kp start* 
up_start; 








kernel pool.pool size kernel free pages * PG SIZE; 




















51 user pool.pool size user _ free pages * PG SIZE; 
52 

53 kernel pool.pool bitmap.btmp bytes len = kbm length; 
54 user pool.pool bitmap.btmp bytes len = ubm length; 
55 

556 /大 大 火炎 火炎 火炎 炎 内 核 内 存 池 和 内 存 池 位 医 Eee ot ke ea 
































57 * ”位 图 是 全 局 的 数据 ， 长 度 不 固定 。 
* ”全 局 或 静态 的 数组 需要 在 编译 时 知道 其 长 度 ， 
59 * 而 我 们 需要 根据 总 内 存 大 小 算出 需要 多 少 字 节 ， 
* ”所 以 改 为 指定 一 块 内 存 来 生成 位 图 。 


61 大 大 大 类 炎炎 大 大大 炎炎 类 类 大 大 类 类 类 大 大大 大 类 大 类 大 大 类 大 类 大 大 大 大 类 大 类 大 大 大 大 大 大 大 大 大 类 大 大 


62 // 内 核 使 用 的 最 高 地 址 是 0xc009f000， 这 是 主线 程 的 栈 地 址 
// ( 内 核 的 大 小 预计 为 70KB 左右 ) 

63 // 32MB 内 存 占用 的 位 图 是 2KB 
// 内 核 内 存 池 的 位 图 先 定 在 MEM BITMAP BASE (0xc009a000) 处 

64 kernel pool .pool bitmap.bits = (void*)MEM BITMAP BASE， 


66 /* 内 存 池 的 位 图 紧 跟 在 内 核 内 存 池 位 图 之 后 */ 
67 User pool.pool bitmap.bits = (void*) (MEM BITMAP BASE + kbm length); 
第 36~37 行 定义 的 变量 kernel free_pages 用 来 存储 分 配给 内 核 的 空闲 物理 页 ， 变 量 user free_pages 
把 分 配给 内 核 后 剩余 的 空闲 物理 页 作为 用 户 内 存 池 的 空闲 物理 页 数量 。 
第 41 行 定义 了 变量 kbm_length， 它 用 来 记录 位 图 的 长 度 。 因 为 位 图 中 的 1 位 表示 1 页 ， 故 用 kernel_ 
free_pages 除 以 8 以 获得 位 图 的 长 度 。 为 方便 写 程序 ， 余 数 咱们 就 不 处 理 了 ， 这 样 做 的 好 处 是 不 用 做 内 存 
的 越界 检查 ， 因 为 位 图 表示 的 内 存 少 于 实际 物理 内 存 ， 坏 处 是 会 丢 (1 一 7 页 )*2 的 内 存 : 内 核 物理 内 存 池 + 
用 户 物 理 内 存 池 。 
第 42 行 的 ubm_ length 是 用 户 内 存 池 位 图 的 长 度 ， 同 kbm_length 一 个 道理 。 
第 44 行 的 kp_start 用 于 记录 内 核 物 理 内 存 池 的 起 始 地 址 ， 值 就 是 used_mem。 
第 45 行 的 up_start 用 于 记录 用 户 物理 内 存 池 的 起 始 地 址 ， 其 值 等 于 kp_start 加 上 内 核 物 理 内存 池 中 的 
内 存 字 节 数 ， 即 加 上 kernel free pages * PG SIZE。 
第 47 一 48 行 用 以 上 的 两 个 起 始 物理 地 址 初始 化 各 自 内 存 池 的 起 始 地 址 ， 即 kernel pool.phy addr 
start = kp_start, user pool.phy addr start = up start。 

第 50~51 行 用 各 自 内 存 池 中 的 容量 字 节 数 〈 物 理 页 数 乘 以 PG_SIZE) 初始 化 各 自 内 存 池 的 pool size。 
第 53 一 54 行 用 各 自 内 存 池 的 位 图 长 度 kbm_ length 和 ubm_length 初始 化 各 自 内 存 池 的 位 图 中 的 位 图 字 
共度 成 员 btmp_bytes_len。 
第 56 一 67 行 是 初始 化 各 自 内 存 池 所 使 用 的 位 图 。 
里 有 多 行 注释 ， 解 释 了 为 什么 要 用 此 方式 定义 位 图 。 
在 上 一 节 和 大 伙 介 绍 位 图 的 时 候 已 经 提 到 过 ,位 图 可 以 用 数组 来 实现 , 但 是 位 图 
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BH 波 












































全 局 数据 结构 ， 全 
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局 或 静态 的 数组 需要 在 编译 时 知道 其 长 度 ， 而 位 图 的 长 度 取决 于 具体 要 管理 的 内 存 页 数量 ， 因 此 是 无 法 预 
计 的 ， 所 以 我 们 就 只 在 struct bitmap 结构 中 定义 了 bits 成 员 用 来 记录 上 层 模块 提供 的 位 图 的 地 址 。 这 里 提 
到 的 上 层 模 块 ， 就 是 指 此 处 的 mem _pool init 函数 ， 由 此 函数 为 struct bitmap 中 的 bits 提供 位 图 地 址 。 
























































































































































































































































































































































































































































































































































也 许 您 会 说 ,既然 位 图 的 长 度 并 不 固定 ， 是否 可 以 用 变 长 数组 来 实现 ? 变 长 数组 只 在 c99 中 支持 ， 并 且 数 组 
占用 的 内 存 是 堆 空 间 ， 而 且 那 还 是 在 操作 系统 的 支持 下 ， 而 我 们 目前 所 做 的 正 是 在 构建 操作 系统 ， 而 本 节 我 
们 的 内 存 管理 系统 ， 其 实 也 是 在 构建 堆 内 存 管理 ， 我 们 的 两 个 内 存 池 就 相当 于 堆 。 

综 上 所 述 ， 由 于 编译 器 必须 要 “事先 ”知道 数组 长 度 才能 定义 静态 数组 ， 但 我 们 用 作 位 图 的 数组 ， 其 长 度 取 
决 于 内 存 大 小 ， 我 们 需要 在 程序 运行 过 程 中 根据 总 内 存 大 小 算出 位 图 数组 需要 多 少 字 节 ， 也 就 是 说 在 “将 来 ” 
才能 确定 数组 长 度 。 因 此 改 为 指定 一 块 内 存 来 生成 位 图 ， 这 样 就 不 需要 固定 长 度 了 。 

第 64 行 初始 化 内 核 位 图 的 指针 kernel pool.pool bitmap.bits， 其 值 为 MEM BITMAP BASE， 也 就 是 
0x9a000。 

第 67 行 初始 化 用 户 位 图 的 指针 user_pool.pool bitmap.bits， 其 值 为 MEM_ BITMAP BASE + kbm length， 
也 就 是 紧 跟 在 内 核 位 图 之 后 。 

还 有 一 些 初始 化 工作 在 代码 8-11-3 中 ， 大 伙 儿 继续 跟 我 来 。 

代码 8-11-3 (project/c8/d/kernel/memory.c ) 
68 /大大 普 太太 大 炎 大 大 大 大 大 大 大大 大 大 大 大 大 输出 内 存 池 信 息 * 六 大大 大 六 六 太太 大 大 大 太太 类 六 大大 大 炎 太 大/ 
G9 put.Stri( kernel pool bitmap start:"); 
put int((int) kernel pool.pool bitmap.bits); 
70 put_ str(" kernel pool phy addr start:"); 
put int (kernel pool.phy addr start); 
71 Put StrE(" NA )y 
了 之 put_str("user pool bitmap start:"); 
put _ int((int)user pool.pool bitmap.bits); 
ee put_str(" user pool phy addr start:"); 
put_int (user pool.phy addr start); 

74 Put str( Nm) 

745: 

76 /* 将 位 图 置 0*/ 

了 了 bitmap init(&kernel _ pool.pool bitmap); 

78 bitmap init(&user pool.pool bitmap); 

79 

80 /* 下 面 初始 化 内 核 虚 拟 地 址 的 位 图 ， 按 实际 物理 内 存 大 小 生成 数组 。*/ 

81 kernel vaddr.vaddr bitmap.btmp bytes len = kbm length; 

// 用 于 维护 内 核 扒 的 虚拟 地 址 ， 所 以 要 和 内 核 内 存 池 大 小 一 至 
82 
83 /* 位 图 的 数组 指向 一 块 未 使 用 的 内 存 ， 
月 位 了 内 核 内 存 池 和 :内存 池 之 外 */ 
84 kernel vaddr.vaddr bitmap.bits = \ 
(void*) (MEM BITMAP BASE + kbm length + ubm length); 

853 

86 kernel vaddr.vaddr start = K HEAP_ START; 

87 bitmap init(&kernel vaddr.vaddr bitmap); 

88 本 mem pool init done\n"™); 

89 } 

90 

91 /* 内 存 管理 部 分 初始 化 入 口 */ 

92 void mem init() { 

93 put_str("mem init start\n"); 

94 uint32 七 mem bytes total = (x (uint32 t*) (0xb00) 

95 mem pool init (mem bytes total); £4 初始 化 内 存 池 

96 put_str("mem init done\n™); 

人 

第 69 一 74 行 是 打印 内 存 池 的 信息 ， 这 包括 内 存 池 的 所 用 位 图 的 起 始 地 址 和 内 存 池 的 起 始 物理 地 址 。 

内 存 池 中 的 位 图 还 需要 初始 化 , 位 值 为 0 表示 该 位 对 应 的 内 存 页 未 分 配 , 位 值 为 1 表示 该 位 对 应 的 内 
存 页 已 分 配 。 因 此 在 第 77 一 78 行 调用 函数 bitmap_init 将 位 图 初始 化 为 0。 

第 80 行 之 后 开始 初始 化 内 核 虚 拟 地 址 池 , 方法 同 前 面 所 述 类 似 , 在 第 84 行为 其 所 使 用 的 位 图 指针 初始 
化 ， 将 其 安排 在 紧 挨 着 内 核 内 存 池 和 用 户 内 存 池 所 用 的 位 图 之 后 ， 即 : 
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bh 的 起 始 地 址 为 K_HEAP START， 即 0xc0100000。 之 后 
这 就 说 完了 。 
的 是 函数 mem init，mem pool init 是 在 此 函数 中 调 月 








| kernel vaddr.vaddr bitmap.bits= 
虚拟 内 存 池 

图 初始 化 。 至 此 ，mem pool init 函数 到 这 
在 第 92 行 

始 化 入 口 ， 从 名 字 上 就 能 看 出 ， 它 和 之 前 的 

才 行 ， 这 里 就 不 再 演示 了 。 







































































在 makefile 中 添加 memory.o 的 乡 




















口 




















idt_init、timer_init 一 样 ， 





前 译 及 链接 信息 后 ， 执 行 make all， 最 六 



































的 ， 因 
要 被 放 到 init'c ! 














(void*) (MEM BITMAP BASE + kbm length + ubm_ 


让 第 87 行 调 月 








































































































length) 














日 bitmap_init 将 其 位 

















此 mem init 是 内 存 管理 的 初 

















的 init all 函数 中 





新 的 kernel.bin 便 被 写 入 bochs 























虚拟 硬盘 了 【好 方便 )。 在 bochs 上 运行 的 结果 如 图 8-20 所 示 。 
I am kernel 
be start 
idt_desc_init done 
pic_init done 
idt_init done 
imer_init start 
imer_init done 
em_init start 
mem_pool_init start 
3 0001010 
uUSEr_pool_bitmap_start:C909h1EO user_poo1l_phu_addr_start:1100000 
mem_pool_init done 
em_init done 
CTRL + 3rd button enables mouse | | | | | | | | | 
4 图 8-20 ”内 存 池 信 息 
您 看 ， 我 们 打印 出 了 内 存 池 的 信息 。 其 中 内 核 物理 内 存 池 所 用 的 位 图 地 址 在 0xc009a000， 其 内 存 池 中 
第 一 块 物理 页 地 址 是 0x200000。 下 一 行 的 是 对 应 的 用 户 物理 内 存 池 的 相关 信息 。 以 后 在 申请 内 存 时 ， 都 会 
更 改 位 图 的 内 容 ， 我 们 可 以 通过 查看 位 图 地 址 处 的 值 来 判断 内 存 系统 工作 是 否 正确 。 
本 节 到 此 结束 ， 下 一 节 中 咱们 试 着 分 配 内 存 。 
8.5.2 ”内 存 管理 系统 第 一 步 ， 分 配 页 内 存 






























































































































































































































































































































































































































































































































































































































































在 有 了 内 存 池 之 后 ， 咱 们 可 以 采取 进一步 的 行动 了 。 咱 们 在 C 语言 下 是 用 malloc 函数 向 操作 系统 申请 内 存 
的 ， 此 函数 可 以 申请 的 内 存 数量 比较 灵活 ， 在 用 户 眼 里 ， 可 以 申请 任意 字 节 尺寸 的 内 存 。 其 实 它 后 面 的 故事 可 多 
呢 ， 先 留 点 悬念 ， 以 后 咱们 实现 malloc 时 就 知道 了 。 本 节 要 做 的 是 实现 任意 内 存 分 配 的 基础 部 分 ,“ 整 页 分 配 ” 

“ 整 页 分 配 这 个 词 是 我 自己 杜撰 的 , 我 的 意思 是 咱们 先 支 持 一 次 分 配 n 个 页 的 内 存 , 即 n*4096 字 节 ， 
看 上 去 有 点 粗 狂 ， 其 实用 途 可 大 呢 。 

在 上 一 节 的 基础 上 ， 咱 们 又 对 memoryh 和 memoryc 做 出 了 改进 ，memoryh 见 代码 8-12-1，memory.c 
的 最 新 面貌 见 代 码 8-12-2 和 代码 8-12-3， 咱 们 先 从 头 文件 开始 ， 里 面 有 新 定义 的 结构 。 

代码 8-12-1 (project/c8/e/kernel/memory.h ) 

6 /* 内 存 池 标记 ， 用 于 判断 用 哪个 内 存 池 */ 

7 enum pool flags { 

8 PF_ KERNEL = 1, // 内 核 内 存 池 

9 PF USER = 2 // 内 存 池 

0 1}; 

i 

2 #define PGP1 1 // 页 表 项 或 页 目录 项 存在 属性 位 

3 #define PGC PO 0 // 页 表 项 或 页 目录 项 存在 属性 位 

4 #define PG RWR 0 // R/W 属性 位 值 ， 读 /执行 

5 #define PG RWW 2 // R/W 属性 位 值 ， 读 / 写 / 执 行 

6 #define PG US S 0 // U/S 属性 位 值 ， 系 统 级 

7 #define PGUSU 4 // U/S 属性 位 值 ， 级 

我 们 在 C pr 于 我 们 是 用 户 程 序 ， 操 作 系 统 直 接 会 在 用 户 内 存 池 中 分 配 内 存 ， 但 
这 对 应 到 内 核 中 具体 的 操作 时 ， 必 须要 “ 显 式 ”指定 在 哪个 内 存 池 中 申请 ， 故 我 们 在 memory.h 中 新 增 了 
枚 举 结构 enum pool flags ee 文 两 个 内 存 池 ， 此 结构 里 面 定义 了 两 个 成 员 ，PF_KERNEL 值 为 1， 它 


388 


代表 内 核 物理 内 存 池 。PF USER 值 为 2， 它 代表 用 户 物 理 内 存 池 。 
内 存 管理 中 ， 必 不 可 少 的 操作 就 是 修改 页 表 ， 这 势必 涉及 到 页 表 项 及 页 目录 项 的 操作 ， 因 此 又 在 
memory.h 中 定义 了 一 些 PG 开头 的 宏 ， 这 是 页 表 项 或 页 目录 项 的 属性 ，memory.c 中 的 函数 会 用 到 它们 。 
简要 介绍 下 这 些 属性 值 ， 以 下 所 说 的 页 内 存 表示 页 表 或 普通 物理 页 。 

PG 前 级 表示 页 表 项 或 页 目录 项 ，US 表示 第 2 位 的 US 位 ，RW 表示 第 1 位 的 RW 位 ，P 表示 第 0 位 的 P 位 。 

。 PG P 1 表示 了 位 的 值 为 1， 表 示 此 页 内 存 已 存在 。 

。 PG P 0 表示 了 位 的 值 为 0， 表 示 此 页 内 存 不 存在 。 

。 PG RW_W 表示 RW 位 的 值 为 W， 即 RW=1， 表 示 此 页 内 存 允 许 读 、 写 、 执 行 。 

。 PG RW _R 表示 RW 位 的 值 为 R， 即 RW=0， 表 示 此 页 内 存 允 许 读 、 执 行 。 

e。 PG US S 表示 US 位 的 值 为 S$， 即 US=0， 表 示 只 允许 特权 级 别 为 0、1、2 的 程序 访问 此 页 内 存 ， 
3 特权 级 程序 不 被 允许 。 

e。 PG US U 表示 US 位 的 值 为 U， 即 US=1， 表 示人 允许 所 有 特权 级 别 程序 访问 此 页 内 存 。 

以 上 各 属性 的 值 是 以 它们 的 位 次 来 定义 的 ， 并 不 是 0 或 1， 这 样 方便 后 面 的 页 表 项 或 页 目录 项 的 属性 合成 。 

头 文件 就 更 新 了 这 些 内 容 ， 在 介绍 memory.c 之 前 ， 咱 们 先 来 点 干货 。 为 减少 学 习 阻 力 ， 先 给 大 伙 复 
习 下 32 位 虚拟 地 址 的 转换 过 程 。 

(1) 高 10 位 是 页 目录 项 pde 的 索引 ， 用 于 在 页 目录 表 中 定位 pde， 细 节 是 处 理 器 获取 高 10 位 后 自动 
将 其 乘 以 4， 再 加 上 页 目录 表 的 物理 地 址 ， 这 样 便 得 到 了 pde 索引 对 应 的 pde 所 在 的 物理 地 址 ， 然 后 自动 
在 该 物理 地 址 中 ， 即 该 pde 中 ， 获 取保 存 的 页 表 物 理 地 址 (为 了 严谨 ， 说 的 都 有 点 抛 口 了 )。 

(2) 中间 10 位 是 页 表 项 pte 的 索引 ， 用 于 在 页 表 中 定位 pte。 细 节 是 处 理 器 获取 中 间 10 位 后 自动 将 
其 乘 以 4， 再 加 上 第 一 步 中 得 到 的 页 表 的 物理 地 址 ， 这 样 便 得 到 了 pte 索引 对 应 的 pte 所 在 的 物理 地 址 ， 
然后 自动 在 该 物理 地 址 (该 pte》 中 获取 保存 的 普通 物理 页 的 物理 地 址 。 
(3) 低 12 位 是 物理 页 内 的 偏 移 量 ， 页 大 小 是 4KB，12 位 可 寻 址 的 范围 正好 是 4KB， 因 此 处 理 器 便 直 
接 把 低 12 位 作为 第 二 步 中 获取 的 物理 页 的 偏 移 量 ， 无 需 乘 以 4。 用 物理 页 的 物理 地 址 加 上 这 低 12 位 的 和 
便 是 这 32 位 虚拟 地 址 最 终 落 向 的 物理 地 址 。 

32 位 地 址 经 过 以 上 三 步 拆 分 ， 地 址 最 终 落 在 某 个 物理 页 内 。 
注意 啦 ， 再 提醒 一 次 ， 页 表 的 作用 是 将 虚拟 地 址 转换 成 物理 地 址 ， 此 工作 表面 虚幻 ， 但 内 心 真 实 ， 其 
转换 过 程 中 涉及 访问 的 页 目录 表 、 页 目录 项 及 页 表 项 ， 都 是 通过 真实 物理 地 址 访问 的 ， 否则 车 用 虚拟 地 址 
访问 它们 的 话 ， 会 陷入 转换 的 死 循环 中 不 可 自拔 。 

以 上 我 一 直 强 调 的 是 物理 地 址 ， 此 概念 在 后 面 的 函数 中 会 屡屡 

回忆 至 此 结束 ， 咱 们 继续 开工 啦 。 










































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































钢 ， 希 望 大 伙 儿 能 够 体会 到 我 的 良 苦 用 心 。 











LL 

















代码 8-12-2 (project/c8/e/kernel/memory.c ) 
include "memory.h" 
2 #include "bitmap.h" 
3 #include "stdint.h" 
4 #include "global.h" 
5 #include "debug.h" 
6 #include "print.h"™ 
7 #include "string.h" 


阁 
18 #define PDE IDX(addr) ((addr & 0xffc00000) >> 22) 
19 #define PTE IDX(addr) ((addr & Ox003ff000) >> 12) 
阁 



































34 /* 在 pf 表示 的 虚拟 内 存 池 中 申请 pg_cnt 个 虚拟 页 ， 
35 * 成 功 则 返回 虚拟 页 的 起 始 地 址 ， 失 败 则 返回 NULL */ 
36 static void* vaddr get (enum Pool flags pf, uint32 t pg cnt) { 
































区 本 int vaddr start = 0, bit idx start = -1; 

38 dirit32 tont := 03 

39 if (pf == PF KERNEL) { 

40 bit idx start = bitmap scan(&kernel vaddr.vaddr bitmap, pg_cnt); 
41 if (bit idx start == -1) { 

42 return NULL; 
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43 } 

44 while(cnt < pg cnt) { 

45 bitmap set (&kernel vaddr.vaddr bitmap, bit idx start + cnt++, 1); 
46 } 

47 vaddr start = kernel vaddr.vaddr start + bit idx start * PG SIZE; 
48 } else { 

49 // 内 存 池 ， 将 来 实现 用 户 进程 再 补充 

50 } 

51 return (void*)vaddr start; 

5 中 

53 


54 /* 得 到 虚拟 地 址 vaddr 对 应 的 pte 指 和 
D5 Uint32 tt* pte _ptr (uint32_ t ee { 




























































































56 /* 先 访问 到 页 表 自 己 + 和 

57 * 页 目录 项 pde ( 页 目录 内 页 表 的 索引 ) 作为 pte 的 索引 访问 到 页 表 + \ 
58 * pte 的 索引 作为 页 内 偏 移 */ 

59 uint32 tx pte = (uint32 t*) (0xffc00000 + \ 

60 (vaddr. &, Oxffc00000) >>. 10) 半 六 


a 
记 
pi 


TE_IDX(vaddr) * 4); 
62 return pte; 
63 1} 
64 


65 /* 得 到 虚拟 地 址 vadqr 对 应 的 pde 的 指针 */ 





























66 uint32 t* pde ptr(uint32 七 vaddr) { 

67 /* 0xfffff 用 来 访问 到 页 表 本 身 所 在 的 地 址 */ 

68 uint32 t* pde = (uint32 t*) ((0xfffff000) + PDE IDX(vaddr) * 4); 
69 return pde; 

70 } 

71 


72 /* 在 m pool 指向 的 物理 内 存 池 中 分 配 1 个 物理 页 ， 



















































































73 * 成 功 则 返回 页 框 的 物理 地 址 ， 失 败 则 返回 NULL */ 

714 -Statie: void* palloe(struet. pool* mm Poo0l) { 

75 /* 扫描 或 设置 位 图 要 保证 原子 操作 */ 

76 int bit idx = bitmap_ scan(&m pool->pool bitmap，1); // 找 一 个 物理 页 面 
汪 深 if (bit idx == -1 ) { 

78 return NULL; 

79 } 

80 bitmap_set (&m pool->pool bitmap, bit idx, 1); // 将 此 位 bit_ igdx 置 
81 uint32 t page phyaddr = ((bit idx * PG SIZE) + m pool->phy addr start); 
82 return (void*)page phyaddr; 

83 .} 

84 


代码 8-12-2 的 前 几 行 新 增 了 一 些 头 文件 。 
第 18 一 19 行 定义 了 两 个 宏 ，PDE_IDX 用 于 返回 虚拟 地 址 的 高 10 位 ， 即 pde 索引 部 分 ， 此 部 分 用 于 
在 页 目录 表 中 定位 pde。 
PTE IDX 用 于 返回 虚拟 地 址 的 中 间 10 位 ， 即 pte 索引 部 分 ， 此 部 分 用 于 在 页 表 中 定位 pte。 
vaddr get 函数 接受 两 个 参数 ，pf 是 内 存 池 的 flag， 就 是 在 头 文件 中 定义 的 enum pool flags。pg_cnt 
是 页 数 ， 函 数 的 功能 是 在 pf 表示 的 虚拟 内 存 池 中 申请 pg_cnt 个 虚拟 页 ， 帮 申请 成 功 ， 则 返回 虚拟 页 的 起 
始 地 址 ， 失 败 时 ， 则 返回 NULL。 
函数 中 定义 的 变量 vaddr_start 用 于 存储 分 配 的 起 始 虚拟 地 址 ，bit_idx_start 用 于 存储 位 图 扫描 函数 
bitmap_scan 的 返回 值 ， 默 认为 -1。 
接 下 来 会 判断 pf 的 值 ， 如 果 其 等 于 PF_KERNEL, 便 认为 是 在 内 核 虚 拟 地 址 池 中 申请 地 址 ， 于 是 调用 
bitmap_scan 函数 扫描 内 核 虚 拟 地 址 池 中 的 位 图 。 若 bitmap_scan 返回 -1， 则 vaddr_get 函数 返回 NULL。 
由 于 目前 只 是 试探 着 扫描 了 位 图 ， 并 未 将 位 图 中 的 相应 位 置 1， 所 以 在 后 面 用 while 循环 ， 根 据 申 请 
的 页 数量 ， 即 pg_cnt 的 值 ， 逐 次 调用 bitmap set 函数 将 相应 位 置 1。 
将 位 图 置 1 之 后 , 工作 基本 上 完成 了 , 现在 需要 将 bit idx _start 转换 为 虚拟 地 址 ， 如 代码 “vaddr start 
= a ad od start + bit_idx_start * PG_SIZE”， 因 为 位 图 中 的 一 位 代表 实际 1 页 大 小 的 内 存 ， 
所 以 转换 原理 还 是 很 简单 的 ， 就 是 用 虚拟 内 存 池 的 起 始 地 址 kernel_vaddr. vaddr_start 加 上 起 始 位 索引 
bit_idx_start 相对 于 1 的 虚拟 页 偏 移 地 址 bit idx start* PG_SIZE。 
下 面 的 else 对 应 的 部 分 是 用 户 内 存 池 ， 由 于 目前 尚未 实现 用 户 进程 ， 先 空 着 吧 。 
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最 后 用 
第 55 
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此 函 











行 定义 了 函数 pte_ptr， 它 接受 一 个 参数 vaddr， 功 
针 的 值 也 就 是 虚拟 地 址 ， 故 此 函数 实际 返回 的 
数 涉 及 到 页 表 操 作 ， 现 在 大 伙 儿 回忆 一 下 ， 


“return (void*)vaddr start” 将 vaddr_ star 转换 成 指针 后 返回 。 
能 是 得 到 


是 能 够 访问 vaddr 所 在 pte 的 虚拟 地 址 。 





地 址 vaddr 所 在 














门 71 








过 前 


竺 loader.S 中 创建 页 表 





























页 





录 项 里 写 的 是 页 目录 表 自 








作 





了 【〔 耳 边 突然 啊 起 了 :“ 可 喜 可 痪 



































己 的 物 














































































































里 地 址 ， 目 
”玩笑 玩笑 )。 
F vaddr 所 在 页 表 项 pte 的 地 址 ， 这 说 明 咱们 要 访问 的 内 存 是 页 表 ， 是 不 












































的 就 是 为 了 通过 此 页 目录 项 编辑 页 表 ， 如 今 终 于 派 上 




















































































































页 的 物理 地 址 。 



































侦 移 地 址 加 上 物理 页 








于 此 函数 的 目的 是 获取 地 二 
是 觉得 有 些 神秘 呢 ? 
访问 页 表 也 得 需要 用 内 存 地 址 来 访问 ， 在 分 页 机 制 下 任 
构造 出 一 新 的 虚拟 地 址 ， 和 暂且 称 之 为 new_vaddr，| 
没有 看 错 ， 虚 拟 地 址 最 终 会 落 到 某 个 物理 地 址 上 ， 咱 
理 下 思路 ， 处 理 器 处 理 32 位 地 址 的 三 个 步骤 如 下 。 
(1) 首先 处 理 高 10 位 的 pde 索引 ， 从 而 处 理 器 得 到 页 表 物 理 地 址 。 
(2) 其 次 处 理 中 间 10 位 的 pte 索引 ， 进 而 处 理 器 得 到 普通 物理 
(3) 最 后 是 把 低 12 位 作为 普通 物理 页 的 页 内 偏 移 地 址 ， 出 
地 址 之 和 便 是 最 终 的 物理 地 址 ， 处 理 器 到 此 物理 地 址 上 进行 读 写 操作 。 




















也 就 是 说 ， 我 们 要 创造 的 这 个 新 的 
终 会 落 到 vaddr 自身 所 在 的 pte 的 物 到 
































pte 


习 于 页 表 中 ， 因 

















表 的 物理 地 址 ， 而 不 是 普通 物 















































此 偏 移 量力 


1 上 页 表 物 理 



































的 页 表 ， 在 页 表 ， 











才 是 页 表 项 pte。 





此 要 想 访问 v 
里 页 的 4 
bh 址 ， 所 得 的 地 址 2 
简单 来 说 就 是 要 想 获 取 pte 的 地 址 ， 必 须 















































地 址 上 。 
addr 所 在 的 pte， 必 须 保证 处 理 
为 理 地 址 ， 这 样 可 以 再 利用 第 




















和 











虚拟 地 址 new_vaddr， 它 经 过 处 理 























器 以 








更 是 vaddr 所 在 的 pte 


pte 的 指针 ， 强 调 下 ， 








的 时 候 ， 在 最 后 一 个 
] 场 





























可 地 址 都 是 虚拟 地 址 ， 因 此 我 们 要 根据 vaddr 
j 它 来 访问 vaddr 本 身 所 在 的 pte 的 物理 地 址 。 对 ， 您 
门 就 是 要 用 虚拟 地 址 访问 某 个 确切 的 4 

















勿 理 地 址 。 





的 物理 





h 址 ， 得 到 的 























个 步骤 的 拆 分 处 理 ， 最 












































3 步 中 的 低 12 位 
的 物理 地 址 。 
































器 在 第 2 步 处 理 pte 索引 时 得 到 的 是 
改 页 表 内 的 偏 移 量 








页 
上 
/ 





























访问 到 页 目录 表 ， 再 
因此 ， 我 们 需要 分 别 在 地 址 的 高 10 位 、 中 间 10 位 和 低 12 位 中 填 入 合 





适 的 数 ， 拼 凌 出 满足 此 要 求 的 新 的 32 位 地 址 new_vaddr。 





。 第 一 步 






































32 位 地 址 中 ， 


照 这 个 思路 ， 























拼凑 新 地 址 new_vaddr 的 过 程 可 分 为 三 步 。 
， 先 访问 到 页 目录 表 。 
首先 ， 处 理 喜 需要 高 10 位 来 定位 pde o 














通过 其 中 的 页 

















录 项 pde， 找 到 相应 











高 





让 








| 是 0x3ff， 








市 









































10 位 用 于 定位 页 目录 项 ， 





















































在 
但 处 理 
是 我 们 
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2 








们 眼 里 , 最 后 
器 把 保存 在 pde 中 的 所 
1 次 骗 了 处 理 器 。 

此 时 我 们 拼 竣 出 了 新 虚拟 地 址 new_vaddr 的 高 10 位 ， 下 面 继续 努力 。 
第 二 步 ， 找 到 











个 pde! 











页 表 。 























项 pte。 我们 在 上 一 步 中 已 经 得 到 了 页 
因此 我 们 要 
表 当 成 了 页 表 ， 其 需要 的 是 pte 的 索引 ， 
现在 要 做 的 是 将 参数 vaddr 的 高 10 位 (pde 索引 ) 取 


在 页 目录 项 中 ， 














其 次 ， 处 理 器 需要 pte 索引 。 
为 满足 处 理 器 的 要 求 , 我 们 需要 再 凑 H 





的 物 到 

















E 想 办 法 访 























页 目录 表 物 理 地 址 ， 此 处 页 
的 配置 项 PAGE DIR TABLE POS， 其 值 便 为 0x100000。 
录 表 地 址 , 因为 这 是 咱们 在 创建 页 表 时 提前 安排 好 的 ， 
会 把 刚刚 获得 这 


地 址 是 页 
也 址 都 视 为 页 表 地 址 ， 即 处 理 


录 表 物理 地 址 〈 其 实处 珀 


















































录 表 物理 


于 最 后 一 个 页 目录 项 保存 的 正 是 页 
我 们 需要 让 地 址 的 高 10 位 指向 最 后 一 个 页 目录 项 ， 即 第 1023 个 pde， 这 样 才能 获取 页 目录 
表 本 身 的 物理 地 址 。 

1023 换算 成 十 六 进 
在 最 后 一 个 pde 中 取 了 
看 boot/include/boot.inc 











目录 表 物 理 地 址 ， 按 





将 其 移 到 高 10 后 ， 变 成 0xffc00000。 于 是 ，0xffc00000 让 处 理 器 自动 


地 址 为 0x100000， 如 果 忘 记 的 话 ， 可 以 看 



























































中 间 10 位 。 中间 10 位 是 页 表 项 的 索引 ， 

















的 页 目录 表 














当成 页 表 来 处 理 ， 








这 























j 来 在 页 表 中 定位 页 表 

















器 把 页 目 











问 到 





大 | 














此 我 1 

















] 把 vaddr 的 pde 索引 当 作 处 理 器 视角 : 
来 ， 做 新 地 址 new_vaddr 的 


























录 表 当成 页 表 了 )， 页 表 地 址 保存 
vaddr 所 在 的 页 目录 项 。 此 时 处 理 器 已 经 把 





上 一 步 获 得 的 页 目录 




















的 pte 索引 就 行 了 ， 














间 10 位 (pte 索引 )。 
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于 是 我 们 先 用 按 位 与 操作 “(vaddr & 0xffc00000)” 获 取 高 10 位 ， 再 将 其 右 移 10 位 ， 使 其 变 成 中 间 
10 位 ， 于 是 就 成 了 处 理 器 眼 的 pte 索引 。 这 样 在 处 理 器 处 理 新 地 址 new_vaddr 的 pte 索引 时 ， 以 为 接 下 
来 获得 的 是 pte 中 的 普通 物理 页 地 址 ， 但 这 只 是 处 理 器 视角 中 的 情景 。 而 事实 上 是 我 们 骗 了 处 理 器 ， 由 于 
上 一 步 我 们 获得 的 是 页 目录 表 地 址 ， 并 且 本 步 中 传 给 它 的 pte 索引 是 vaddr 中 的 pde 索引 ， 故 此 时 处 理 器 获 
得 的 是 vaddr 中 高 10 位 的 pde 索引 所 对 应 的 pde 里 保存 的 页 表 的 物理 地 址 , 并 不 是 pte 中 保存 的 普通 物理 
页 的 物理 地 址 。 这 是 我 们 第 2 次 骗 了 处 理 器 。 所 以 ， 此 时 我 们 获得 了 vaddr 所 在 的 页 表 物 理 地 址 。 

此 时 我 们 已 拼凑 出 了 新 虚拟 地 址 new_vaddr 的 中 间 10 位 。 

。 第 三 步 ， 在 页 表 中 找到 pte。 

最 后 ， 处 理 器 需要 地 址 的 低 12 位 。 

我 们 一 次 又 一 次 地 骗 了 处 理 器 ,马上 还 要 再 骗 一 次 呢 ， 不 过 话说 回来 了 ， 人 家 处 理 器 才 不 关心 是 否 被 
骗 ， 因 为 由 欺骗 导致 的 错误 ， 受害 者 不 是 处 理 器 ， 而 是 欺骗 它 的 人 ， 所 以 我 们 在 欺骗 处 理 器 时 要 确保 自己 
不 是 受害 者 ， 这 是 一 个 骗子 最 起 码 的 “素质 ”， 哈 哈 ， 玩 笑 。 

上 一 步 中 处 理 器 认为 已 经 找到 了 最 终 的 物理 页 地 址 ， 所 以 它 此 时 需要 的 是 32 位 地 址 中 的 低 12 位 , 用 
该 12 位 作为 上 一 步 中 获取 到 的 物理 页 的 偏 移 量 ， 当 然 ， 这 依然 只 是 处 理 器 的 视角 。 在 我 们 眼 里 ， 上 一 步 
央 得 的 是 页 表 的 物理 地 址 ， 因 此 我 们 只 要 把 vaddr 的 中 间 10 位 转换 成 处 理 器 眼 里 的 12 位 长 度 的 页 内 偏 移 
量 就 行 了 。 由 于 地 址 的 低 12 位 寻 址 范围 正好 是 一 页 的 4KB 大 小 ， 故 处 理 器 直接 拿 低 12 位 去 寻 址 , 不 会 
为 其 自动 乘 以 4， 因 此 ， 咱 们 得 手动 将 vaddr 的 pte 部 分 乘 4 后 再 交 给 处 理 器 。 这 里 的 做 法 是 先 用 
PTE_IDX(vaddr) 获取 vaddr 的 pte 索引 ， 即 中 间 10 位 ， 再 将 其 乘 4， 即 PTE_IDX(vaddr) * 4 拼凑 出 了 新 虚 
拟 地 址 new_vaddr 的 低 12 位 。 故 0xffc00000 + ((vaddr & 0xffc00000) >> 10) + PTE_IDX(vaddr) * 4 的 结果 
LR 最 终 的 新 虚拟 地 址 new_vaddr 的 完整 32 位 数值 ，new_vaddr 保存 在 指针 变量 pte 中 。 由 于 此 结果 仅仅 

个 整 型 数值 ， 需 要 将 其 通过 强制 类 型 转换 ， 即 (vint32_t*)， 转 换 成 32 位 整 型 地 址 。 此 时 指针 变量 pte 指 
vaddr 所 在 的 pte。 最 后 通过 return pte 将 此 指针 返回 。 

函数 pde_ptr 只 接受 一 个 参数 ， 它 的 功能 是 得 到 虚拟 地 址 vaddr 所 在 pde 的 指针 ， 也 就 是 返回 能 够 访 
问 该 pde 的 虚拟 地 址 。 用 此 指针 可 以 访问 到 虚拟 地 址 vaddr 对 应 的 pde。 此 函数 的 实现 原理 和 pte_ptr 一 样 ， 
不 过 更 简单 一 些 。 

同样 ， 访 问 pde 也 必须 要 通过 地 址 ， 因 此 我 们 这 里 也 必须 要 根据 vaddr 来 构造 一 个 新 的 32 位 地 址 
new_vaddr。 根 据 前 面 所 说 的 处 理 器 处 理 32 位 地 址 的 三 个 步 又 ， 处 理 器 先 处 理 的 是 32 位 地 址 中 高 10 位 的 
pde 索引 ， 其 次 是 中 间 10 位 的 pte 索引 ， 最 后 是 低 12 位 。 

我 们 要 创造 的 这 个 新 的 虚拟 地 址 new_vaddr， 它 经 过 以 上 三 个 步骤 的 拆 分 处 理 ， 最 终 处 理 器 会 把 要 访 
问 的 地 址 落 在 vaddr 所 在 的 pde 的 物理 地 址 上 

由 于 要 访问 的 是 vaddr 所 在 的 页 目录 项 ps 所 以 必须 想 办 法 在 第 2 步 中 让 处 理 器 处 理 pte 索引 时 获 
得 的 是 页 目录 表 物 理 地 址 ， 然 后 利用 低 12 位 作为 物理 页 的 偏 移 量 ， 此 偏 移 量 加 上 页 目录 表 的 物理 地 址 ， 
所 得 的 地 址 之 和 便 是 vaddr 所 在 的 pde 的 物理 地 址 。 
其 实 早 在 long long ago 介绍 页 表 的 时 候 就 和 大 伙 儿 说 过 了 , 由 于 最 后 一 个 页 目录 项 中 存储 的 是 页 目录 
表 物 理 地 址 ， 故 当 32 位 地 址 中 高 20 位 为 0xfffff 时 ， 这 就 表示 访问 到 的 是 最 后 一 个 页 目录 项 ， 即 获得 了 页 
目录 表 物 理 地 址 。 这 也 很 容易 理解 ，0xfffffxxx 的 高 10 位 是 0x3 人 在 ， 中 间 10 位 也 是 0x3 任 ， 也 就 是 处 理 pde 
索引 时 得 到 的 是 页 目录 表 的 物理 地 址 , 此 时 处 理 器 以 为 此 页 目录 表 就 是 页 表 , 继续 用 pte 索引 在 该 页 表 ( 页 
目录 表 ) 找到 最 后 一 个 页 表 项 pte (其 实 是 页 目录 项 pde)， 所 以 再 次 获得 了 页 目录 表 物 理 地 址 (当然 处 理 
器 以 为 获得 的 是 普通 物理 页 的 物理 地 址 )。 

因此 ， 新 虚拟 地 址 new_vaddr 等 于 0xfffff000 再 加 上 vaddr 的 页 目录 项 索引 乘 以 4 的 积 ， 即 “(Oxfffff000) + 
PDE_IDX(vaddr) * 4”。 此 时 的 new_vaddr 便 落 到 vaddr 所 在 的 页 目录 项 pde 的 物理 地 址 上 。 由 于 此 结果 仅 
仅 是 个 整 型 数值 ， 需 要 将 其 通过 强制 类 型 转换 成 32 位 整 型 指针 。 最 终 的 新 虚拟 地 址 new_vaddr 保存 在 指针 变 
量 pde 中 , 因此 “pde = (uint32_t9)(Oxffftffo00)+PDE IDXCvaddnD* 4)”， 此 时 指针 变量 pde 指向 了 vaddr 所 在 的 
pde， 最 后 通过 return pde 将 指针 返回 
392 
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new_vaddr 经 过 处 





两 件 事 要 注意 。 
(1) pte ptr 和 pde_ptr 这 两 个 函数 返回 



































里 器 处 理 32 位 地 址 的 三 个 步骤 ， 








最 终 指向 vaddr 的 pte 及 pde 所 








的 是 能 够 访问 到 vaddr 所 在 pte 及 pde 的 刘 





虚拟 地 址 new_vaddr， 
在 的 物理 地 址 。 因 此 ， 




















这 两 个 函数 的 功能 等 同 于 : 给 我 一 个 新 的 虚拟 地 址 new_vaddr， 让 它 指向 vaddr 所 在 的 pde 及 pte， 也 就 是 
让 new_vaddr 指向 pde 及 pte 所 在 的 物理 地 址 。 


(2) 这 两 个 函数 中 的 参数 vaddr， 本 
中 不 存在 的 虚拟 地 址 ，pte_ptr 和 pde_ptr i 
岂 址 ， 与 vaddr 所 在 的 pte 及 pde 是 否 存在 无 关 。 
这 两 个 函数 是 修改 页 表 的 核心 , 相对 来 说 有 点 难 , 不 过 大 伙 儿 请 放心 , 不 会 再 有 
个 参数 m_pool， 功 能 是 在 m_pool 指向 的 物理 内 存 池 中 分 配 1 个 物理 页 ， 成 功 时 
里 地 址 ， 失 败 时 则 返回 
bit_idx 用 于 存储 bitmap_scan 函数 的 返回 值 ，bitmap_scan 函数 在 物 
立 ， 如 果 失 败 ， 则 返回 -1， 因 此 函数 palloc 也 将 返 区 
位 ， 接 下 来 再 通过 函数 bitmap set 将 bit idx 位 设置 为 1， 
“bitmap_set(&m pool->pool bitmap, bit idx, 1)”。 

变量 page phyaddr 用 于 
页 在 内 存 池 中 的 偏 移 地 址 (bit idx * PG _SIZE)。 
最 后 通过 “return (void*) page_phyaddr” 将 物理 


pte 及 pde 的 虚拟 


palloc 函数 只 接受 
回 页 框 的 物 至 
定义 的 变量 




















找 可 用 
不 为 -1， 











addr start+ 物理 














也 就 是 找到 了 可 |} 















































以 是 已 经 分 配 、 在 页 表 中 存在 的 ， 也 可 以 是 尚未 分 配 ， 
这 两 个 函数 只 是 根据 虚拟 地 址 转换 的 规则 计算 











前 页 表 














上 vaddr 对 应 的 





















































NULL 。 














比 它们 更 难 的 函数 了 。 








De 








里 内 存 池 的 位 图 ! 











查 







































































‘HH 


保存 分 配 的 物理 页 地 址 ， 它 的 值 是 物 






































页 地 址 转换 成 空 指针 后 返回 。 








下 面 继续 看 代码 8-12-3。 


87 


91 / 术 大 大火 大 类 类 类 类 大 类 大 大 类 大 类 大 大 大 大 类 大 大 大 





uint32 tx* pde 
uint32 t* pte 


92 * 执行 :pte， 会 访问 到 空 


*pte 只 能 出 现在 下 四 


* 否则 会 引发 page_fault。 因 此 大 


85 /* 页 表 中 添加 虚拟 地 址 
86 static void page table add (void* 


uint32 t vaddr = 


代码 8-12-3 (project/c8/e/kernel/memory.c ) 
vaddr 与 物理 地 址 page_phyaddr 的 映射 */ 
_vaddr, void* page phyaddr) { 
(uint32 七 ) vaddr, page phyaddr = (uint32 t) 
pde_ptr (vaddr); 
pte_ptr (vaddr); 





注意 类 炎炎 类 类 大大 类 类 大 类 类 类 大 大大 大 类 类 大 大 类 大 大 大 


3 的 pdeo 所 | 以 确保 pde 创建 完成 后 才能 执行 *pte， 
E*pde 为 0 时 ， 









































else 语 





句 块 中 的 xpde 后 
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OOUNPODP 


// 页 目录 项 和 


// US=1,RW=1, 
} else 1{// 
PANIC ("pte repeat"),， 























/* 先 在 页 目录 内 判断 
& Ox00000001) 





if (*pde 














录 项 的 P 位 ， 若 为 已 存在 *# 








， 则 表示 该 未 









































ASSERT(! 


if (!(*pte & 0x00000001) 
/ 只 要 是 创建 





表 ， 
pte 
P=1 


4* 汀 


*pte 





// US=1,RW=1,P=1 


} else { 


页 表 项 的 第 0 位 为 P， 此 


// 页 目录 项 个 行 

















处 判断 目录 项 是 否 存在 
(*pte & Ox00000001)); 

















pte 就 应 该 不 存在 ， 多 判断 一 下 放心 
= (page phyaddr PG US.U'| PG RWW | PGP 1)3 


会 先 执行 























的 ASSERT 








前 应 该 不 会 执行 到 这 ， 因 为 上 


























= (page phyaddr PG NS8. VU | PGSRW WN | PG._P 1}3 





























在 ， 所 以 要 先 创 建 页 目录 再 包 








建 页 表 项 





























/* 贝 表 中 
ULnit32 t 


*pde 4 


(pde phyaddr 

















到 的 页 框 一 律 从 内 核 空间 分 配 */ 
pde phyaddr = (uint32 t)palloc(&kernel pool); 








PG US U | PG RW 了 PG Pr 4) 


Y ea 的 物理 页 地 址 pde_phyaddr 对 应 的 物理 内 存 清 0， 

















的 陈旧 数据 变 成 了 页 表 项 ， 从 而 让 页 表 混 乱 。 











* 访 向 到 pde 对 应 的 物理 地 址 ， 





























Pte 取 高 20 位 便 可 。 











为 bte 基于 该 pde 对 应 的 物理 地 址 内 














寻 址 ， 














把 很 了 2 


memset ((void*) ((int)pte & Oxfffff000), 0, 








ASSERT (! 




















位 置 0 便 是 该 pde 对 应 的 物理 页 的 起 始 */ 
PG_SIZE); 





(*pte & Ox00000001)); 


NULL， 宣 告 失败 。 若 bitmap_scan 的 返回 值 











也 就 是 代码 


里 内 存 池 的 起 始 地 址 m_ pool-> phy_ 


_page phyaddr; 
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le) *pte = (page phyaddr | PG US U | PG RWW | PG P 1); 
// US=1,RW=1,P=1 

20 } 

2 

22 沟 














23 /* 分 配 pg_cnt 个 页 空间 ， 成 功 则 返回 起 始 虚 拟 地 址 ， 失 败 时 返回 NULL */ 
24 void* malloc page (enum pool flags pf, uint32 t pg cnt) { 














28 ASSERT(pg_ cnt > 0 && pg_cnt < 3840) 
26 /**********w*w* Imalloc page 的 原理 是 三 个 动作 的 合成 :  ******* 火 火炎 火炎 














27 1 通过 vaddr_get 在 虚拟 内 存 池 中 申请 虚拟 地 址 
28 2 通过 palloc 在 物理 内 存 池 中 申请 物理 页 
29 3 通过 page_table_add 将 以 上 得 到 的 虚拟 地 址 和 物理 地 址 在 页 表 中 完成 映射 


30 大 大 炎炎 炎炎 大 类 火炎 大 类 类 大 类 大 类 大 大 类 类 类 大 类 类 类 类 大 类 大 大 类 类 类 大 大 类 大 类 大 大 大 大 类 大 大 大 大 类 大 类 大 大 大 大 类 大 大 大 大 类 大 大 大 大 大 大 大 


































































































































































































31 void* vaddr start = vaddr get (pf, pg_cnt); 

站 if (vaddr start == NULL) { 

33 return NULL; 

34 3. 

35 

36 uint32 t vaddr = (uint32 t)vaddr start, cnt = pg_cnt; 

37 struct pool* mem pool = pf & PF KERNEL ? &kernel pool : &user pool; 

38 

39 /* 因为 虚拟 地 址 是 连续 的 ， 但 物理 地 址 可 以 是 不 连续 的 ， 所 以 逐个 做 映射 */ 

40 while (cnt-- > 0) { 

41 void* page phyaddr = palloc (mem Pool) ; 

42 if (page phyaddr == NULL) { // 失 败 时 要 将 曾经 已 申请 的 虚拟 地 址 和 
// 物 理 页 全 部 回 滚 ， 在 将 来 完成 内 存 回收 时 再 补充 

43 return NULL; 

44 } 

45 page_ table add((void*)vaddr，page phyaddr); // 在 页 表 中 做 映射 

46 vaddr += PG_ SIZE; // 下 一 个 虚拟 页 

47 } 

48 return vaddr start; 

49 } 

50 

51 /* 从 内 核 物 理 内 存 池 中 申请 1 页 内 存 ， 



































成 功 则 返回 其 虚拟 地 址 ， 失 败 则 返回 NULL */ 
52 void* get kernel pages (uint32 t pg cnt) { 















































多 可 void* vaddr = malloc page (PF KERNEL, pg_cnt); 

54 if (vaddr != NULL) { // 若 分 配 的 地 址 不 为 空 ， 将 页 框 清 0 后 返 世 
5 memset (vadqqr，0，Ppg_cnt * PG SIZE); 

56 } 

57 return vaddr; 
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第 86 行 定义 了 函数 page_table_add， 它 接受 两 个 参数 ， 虚 拟 地 址 _vaddr 和 物理 地 址 page_phyaddr， 功 能 是 
添加 虚拟 地 址 vaddr 与 物理 地 址 page_phyaddr 的 映射 。 
虚拟 地 址 和 物理 地 址 的 映射 关系 是 在 页 表 中 完成 的 ， 本 质 上 是 在 页 表 中 添加 此 虚拟 地 址 对 应 的 页 表 项 pte， 
并 把 物理 页 的 物理 地 址 写 入 此 页 表 项 pte 中 。 也 就 是 说 ， 页 表 操作 会 用 到 上 面 介绍 过 的 pde_ptr 和 pte_ptr 函数 。 
函数 开头 调用 了 函数 pde_ptr(vaddr)， 以 此 获取 虚拟 地 址 vaddr 所 在 的 pde 的 虚拟 地 址 ， 此 地 址 用 指针 
变量 pde 保存 。 
接着 调用 pte_ptr(vaddr) 获 得 vaddr 所 在 的 pte 虚拟 地 址 ， 此 地 址 保存 在 指针 变量 pte 中 。 
pte 隶属 于 某 个 页 表 ， 而 页 表 地 址 保存 在 pde 中 。 一 个 pte 代表 一 个 物理 页 ， 物 理 页 是 4KB 大 小 , 一 
个 页 表 中 可 支持 1024 个 pte， 故 一 个 页 表 最 大 支持 4MB 内 存 。 由 于 我 们 目前 已 经 有 了 一 个 页 表 啦 ， 故 在 
4MB (0x0~0x3ff000) 的 范围 内 新 增 pte 时 ， 只 要 申请 个 物理 页 并 将 此 物理 页 的 物理 地 址 写 入 新 的 pte 即 
可 ， 无 需 再 做 额外 操作 。 可 是 ， 当 我 们 访问 的 虚拟 地 址 超过 了 此 范围 时 ， 比 如 0x400000， 这 不 仅 是 添加 
pte 的 问题 ， 同 时 还 要 申请 个 物理 页 来 新 建 页 表 ， 同 时 将 用 作 页 表 的 物理 页 地 址 写 入 页 目录 表 中 的 第 1 个 
页 目录 项 pde 中 。 也 就 是 说 ， 只 要 新 增 的 虚拟 地 址 是 4MB 的 整数 倍 时 ， 就 一 定 要 申请 两 个 物理 页 ， 一 个 
物理 页 作为 新 的 页 表 ， 同 时 在 页 目录 表 中 创建 个 新 的 pde， 并 把 此 物理 页 的 物理 地 址 写 入 此 pde。 另 一 个 
物理 页 作为 普通 的 物理 页 ， 同 时 在 新 建 的 页 表 中 添加 个 新 的 pte， 并 把 此 物理 页 的 物理 地 址 写 入 此 pte。 
因此 ， 在 添加 一 个 页 表 项 pte 时 ,我 们 务必 要 判断 该 pte 所 在 的 页 表 是 否 存 在 。 在 第 96 行 就 是 在 判断 
页 表 项 中 的 P 位 ， 如 果 此 位 为 1， 则 表示 页 目录 项 已 存在 ， 不 需要 再 建立 。 



































































































































































































































































































































































































































































































































































































































































































































如 果 页 表 已 存在 ， 接 着 在 第 99 行 判 断 pte 是 否 存在 ， 按 理 说 申请 新 的 地 址 时 其 所 对 应 的 pte 不 会 存在 ， 














但 为 了 排除 异常 的 情况 ， 












































在 此 还 是 多 判断 一 下 比较 放心 。 如 果 pte 不 存在 ， 就 将 物理 页 的 物理 地 址 及 相关 属性 








写 到 此 pte 中 ， 即 代码 “*pte = (page phyaddr|PG US U |PG RW_W |PG P 1D” 这 样 vaddr 对 应 的 pte 就 被 
映射 到 物理 地 址 page phyaddr 上 ， 并 添加 了 属性 US=1，RW=1，P=1， 各 属性 意义 在 前 面 介绍 头 文 件 时 已 述 。 








如 果 在 上 面 的 判断 















































中 发 现 pde 不 存在 时 ,需要 申请 个 新 的 物理 页 来 创建 新 的 页 表 ， 因 此 第 107 行 通过 























调用 “palloc(&kernel pool)” 申 请 新 的 物理 页 并 将 地 址 保存 在 变量 pde_phyaddr 中 。 随 后 将 新 物理 页 的 物 











理 地 址 pde_phyaddr 和 相关 属性 写 入 此 pde 中 ， 即 代码 “*pde = (pde phyaddr | PG US U |PG RW_W 











PG P_1)” 属性 同样 是 US=1，RW=1，P=1。 


























第 116 行 是 调用 memset 函数 对 刚刚 申请 的 物理 页 初始 化 为 0， 这 里 面 还 是 有 些 陈旧 数据 的 。 



































在 上 面 有 几 行 注释 




















“干净 ”的 ， 否 则 一 些 陈 旧 数据 会 让 此 页 表 混 乱 。 举 个 例子 ， 比 如 此 时 的 页 表 是 新 创建 的 ， 其 中 应 该 没有 

















， 大 概 意思 是 : 由 于 此 物理 页 要 被 用 作 页 表 ， 所 以 必须 要 保证 此 物理 页 中 的 内 容 是 












































任何 pte， 但 此 物理 页 在 之 前 可 能 已 被 分 配 并 使 用 过 ， 用 户 或 内 核 程序 在 里 面 已 经 写 了 脏 数 据 ， 内 存 管理 














系统 在 回收 该 物理 页 的 




























































































四 mm 




















收 时 清 0 是 低 效 的 ， 物 理 页 在 回收 后 未 必 会 再 分 配 H 





时 候 并 没有 对 其 清 0， 因 为 










































































去 ， 所 以 在 分 配 的 时 候 对 其 清 0 较 高 效 。 这 个 脏 数据 可 能 “恰好 ”形成 pte， 其 实 我 用 这 个 “恰好 ”只 是 

















想 表 达 一 种 “无 心 插 柳 柳 成 荫 ” 的 情形 ， 对 于 这 种 “形成 pte” 的 情况 并 不 是 偶然 的 ， 而 是 “经 常 ”。 因 为 




















处 理 器 就 是 把 页 表 中 每 4 字 节 的 数据 视 为 pte， 而 各 属性 位 无 论 取 值 如 何 都 有 相应 的 意义 ， A 




































































pte 是 否 合理 ， 一 律 全 盘 接受 。 这 就 像 遇 到 了 女神 ， 怎 么 看 都 顺眼 ,“ 缺 点 、 任 性 ”都 成 了 “个 性 ? 
这 样 形成 的 pte 风格 迎 异 ， 也 许 P 位 为 1， 也 许 pte 的 高 20 位 有 数值 ， 这 就 会 导致 新 的 页 表 





























中 平 白天 



































故地 多 了 好 多 页 表 项 ， 


















































页 表 就 会 “及 有 和 肿 且 破 烂 不 堪 ”。 您 可 以 试 一 下 ， 如 果 此 处 不 对 用 作 新 页 表 的 物理 页 



































清 0 的 话 ， 在 bochs 中 用 info tab 来 查看 页 表 中 的 映射 关系 时 ， 能 输出 好 儿 屏 的 内 容 ， 而 且 全 不 是 自己 添 





加 的 ， 想 想 就 醉 了 ， 您 
为 了 初始 化 物理 页 
访问 的 ， 因 此 必须 得 知 



































懂 的 ， 小 弟 我 就 深 受 其 苦 。 
， 光 知道 物理 页 的 物理 地 址 是 不 行 的 ,毕竟 在 分 页 机 制 下 一 切 都 是 通过 虚拟 地 址 来 
道 该 物理 页 对 应 的 虚拟 地 址 。 

























































































既然 此 物理 页 用 作 



























































页 表 ， 也 就 是 它 会 被 写 入 某 个 pde 中 ， 咀 们 先 看 看 现 有 的 变量 能 否 解决 。 


























































































































































































































在 本 函数 开头 的 指针 变量 pde， 其 值 是 虚拟 地 址 vaddr 所 在 pde 的 虚拟 地 址 ， 如 果 对 其 用 * 取 值 ， 如 *pde， 
其 结果 是 该 pde 中 的 值 ， 即 4 字 节 的 页 目录 项 的 内 容 : 第 0 位 为 P 位 …… 高 20 位 为 页 表 的 物理 地 址 等 。 
得 到 了 物理 地 址 也 白搭 ， 我 们 知道 ， 必 须要 通过 虚拟 地 址 访问 ， 因 此 ， 指 针 pde 似乎 帮助 不 大 。 
咱们 再 看 看 指针 变量 pte，pte 是 vaddr 所 在 页 表 项 pte 的 虚拟 地 址 ，*pte 的 值 是 vaddr 所 在 的 页 表 项 
pte 的 内 容 , 其 中 高 20 位 是 普通 物理 页 的 物理 地 址 …… 也 依然 是 物理 地 址 , 似乎 指针 pte 也 并 没有 什么 用 ， 
[至 感觉 天 空 也 跟着 黯淡 了 许多 。 
但 是 Ee 





pte 是 vaddr 所 在 的 页 表 项 pte 的 虚拟 地 址 ， 它 就 是 pte_ptr 返回 的 结果 new_vaddr，new_vaddr 的 低 12 位 
是 用 来 在 其 高 20 位 所 定位 到 的 页 表 中 做 pte 的 偏 移 量 ， 也 就 是 说 ， 如 果 new_vaddr 的 低 12 位 为 0， 访 问 
到 的 则 是 页 表 的 起 始 虚 拟 地 址 ， 而 我 们 要 初始 化 的 物理 页 就 是 用 作 此 页 表 。( 不 知 怎么 地 ， 天 空 又 出 现 了 一 缕 
阳光 。) 言 外 之 意 是 将 new_vaddr 的 低 12 位 清 0， 就 是 说 pte 的 偏 移 量 不 要 了 ， 而 高 20 位 保留 ， 也 就 是 如 代 


























码 “(int)pte & 0xfffff000” 所 示 ， 这 样 就 得 到 了 这 个 vaddr 所 在 页 表 的 虚拟 地 址 ， 也 就 是 刚刚 申请 的 新 物理 










































































页 的 虚拟 地 址 。 这 样 就 


“memset((void*)((int)pte & Oxfffff000), 0, PG SIZE);”。 


























意味 着 可 以 对 其 用 memset 清 0 了， 于 是 用 此 行 代码 对 该 物理 页 做 清 0 操作 ， 即 









































(page phyaddr | PG US 























接着 在 本 函数 的 最 后 ， 为 vaddr 对 应 的 pte 赋值 ， 也 就 是 把 物理 页 地 址 和 属性 写 进 去 ， 即 “*pte = 





U|PG RW W|PG P_ D?”。 




















业 
数 ， 








有 关 page table add 函数 的 介绍 至 此 结束 ， 
第 124 行 的 malloc page 函数 接受 2 个 参数 ， 一 个 是 pf， 用 来 指明 内 存 池 ， 另 外 一 个 是 pg_cnt， 用 来 指明 页 
此 函数 的 功能 是 在 pf 所 指向 的 内 存 池 中 分 配 pg_cnt 个 页 ， 成 功 则 返回 起 始 虚 拟 地 址 ， 失 败 时 返回 NULL。 











们 继续 看 。 

































































在 函数 的 开头 ， 有 一 








人 句 “ASSERT(pg_cnt>0&&pg cnt<3840)”， 它 用 来 监督 申请 的 内 存 页 数 pg_cnt 
395 


是 否 超过 了 物理 内 存 池 的 容量 。 内 核 和 用 户 空间 各 约 16MB 空间 , 保守 起 见 用 15MB 来 限制 ， 申 请 的 内 存 
页 数 要 小 于 内 存 池 大 小 ， 即 
pg cnt<15*1024*1024/4096 = 3840 页 。 
其 实 此 函数 是 申请 虚拟 地 址 , 然后 为 此 虚拟 地 址 分 配 物理 地 址 ， 并 在 页 表 中 建立 好 虚拟 地 址 到 物理 地 
址 的 映射 ， 相 当 于 于 了 三 件 事 ， 步 又 如 下 。 
(1) 通过 vaddr_get 在 虚拟 内 存 池 中 申请 虚拟 地 址 。 
(2) 通过 palloc 在 物理 内 存 池 中 申请 物理 页 。 
(3) 通过 page_table_add 将 以 上 两 步 得 到 的 虚拟 地 址 和 物理 地 址 在 页 表 中 完成 映射 。 
您 看 ，malloc_page 就 是 以 上 三 个 函数 的 封装 。 
按照 上 面 的 步骤 ， 第 131 一 134 行 先 申请 虚拟 地 址 ， 如 果 失 败 就 返回 NULL。 
第 137 行 判 断 要 用 的 内 存 池 属 于 内 核 ， 还 是 用 户 ， 下 面 要 在 相应 的 内 存 池 中 分 配 物 理 页 。 
第 140 一 147 行 是 循环 为 虚拟 页 分 配 物理 页 并 在 页 表 中 建立 映射 关系 。 
第 141 行 调用 palloc 在 相应 内 存 池 中 申请 物理 页 ， 物 理 页 地 址 保存 在 指针 变量 page_phyaddr 中 ， 如 果 
失败 (返回 值 为 NULL》 则 通过 “return NULL” 返 回 。 
这 里 还 有 些 工 作 没 完成 ， 当 申请 物理 页 失败 时 ， 应 该 将 曾经 已 申请 成 功 的 虚拟 地 址 和 物理 地 址 全 部 回 滚 ， 
虽然 地 址 还 未 使 用 ， 但 虚拟 内 存 池 的 位 图 已 经 被 修改 了 ， 如 果 物 理 内 存 池 的 位 图 也 被 修改 过 ， 还 要 再 把 物理 地 
址 回 滚 。 由 于 这 部 分 属于 地 址 回收 的 功能 ， 不 属于 本 节 的 内 容 ， 待 将 来 实现 内 存 回收 时 再 补充 吧 。 知 物理 页 申 
青 成 功 ， 再 调用 “page table add((void*)vaddr, page phyaddr)” 将 虚拟 地 址 vaddr 映射 为 物理 地 址 page phyaddr。 
随后 通过 “vaddr += PG_SIZE” 将 vaddr 更 新 为 下 一 个 虚拟 页 ， 继 续 下 一 个 循环 的 申请 物理 页 和 页 表 映 射 。 
当 处 理 完 pg_cnt 个 页 后 ， 通 过 “return vaddr start” 将 分 配 的 起 始 虚 拟 地址 返回 。 
malloc_page 函数 就 介绍 完了 ， 不 知 有 没有 同学 感到 疑惑 ， 为 什么 要 将 第 〈1) 步 和 第 (2)、(3) 两 步 
拆 开 ， 而 未 放 在 同一 个 大 的 循环 中 ? 
原因 是 这 样 的 ， 虚 拟 地 址 是 连续 的 ， 但 物理 地 址 可 能 连续 ， 也 可 能 不 连续 ， 因 此 第 1 步 中 可 以 一 次 性 
申请 pg_cnt 个 虚拟 页 。 成 功 申请 之 后 ， 根 据 申 请 的 页 数 ， 通 过 循环 依次 为 每 一 个 虚拟 页 申请 物理 页 ， 再 
将 它们 在 页 表 中 依次 映射 关联 。 
最 后 一 个 函数 是 get kernel pages， 它 只 接受 一 个 参数 申请 的 页 数 pg_cnt， 函 数 功 能 是 从 内 核 物理 内 
存 池 中 申请 pg_cnt 页 内 存 ， 成 功 则 返回 其 虚拟 地 址 ， 失 败 则 返回 NULL。 
在 其 内 部 是 调用 malloc_page 来 实现 的 ， 返 回 的 虚拟 地 址 保存 在 变量 vaddr 中 ， 之 后 再 通过 memset 
将 此 页 清 0。 由 于 malloc page 返回 的 是 虚拟 地 址 ， 因 此 可 以 直接 将 vaddr 作为 memset 的 参数 ， 由 于 虚拟 
地 址 是 连续 的 ， 所 以 置 0 的 字 节 数 直 接 用 pg_cnt 乘 以 PG_SIZE。 
申请 成 功 通过 return vaddr 返回 分 配 的 虚拟 地 址 。 
有 关 本 节 内 存 管 理 的 内 容 就 介绍 完了 ， 现 在 需要 测试 一 下 ， 我 们 在 main.c 中 添加 申请 内 存 的 代码 试 
试看 ， 见 代码 8-13。 
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代码 8-13 (project/c8/e/kernel/main.c ) 





1 #include "print.h"™ 

2 #include "init.h" 

3 #include "memory.h" 

4 int main(void) { 

put_str("I am kernel\n"); 

6 Ti LL(Y)s 

二 

8 voidx addr = get kernel_ pages (3) ; 
9 put_str("\n get kernel page start vaddr is "); 
1 从 Dut rint (ulintS2 tyaddr)s 

11 Put str("\nY)s 

过 

13 while(1); 

14 return 0; 

二 5: = 寺 
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如 图 8-21 所 示 ， 























最 上 面 我 们 先 月 
是 映射 关系 ， 左 边 是 虚拟 地 址 的 范围 























I am kernel 
init_all 
idt_init start 
idt _desc_init done 
pic_init done 
idt_init done 
imer_init start 
imer_init done 
em_init start 
mem_pool_init start 



































图 8-21 所 示 。 





L131 0 
uUSer_pool_bitmap_start:C900981EO user_pool_phu_addr_start:1100000 


mem_pool_init done 
em_init done 


get_kernel_ page start vaddr is |CO100000 


CTRL + 3rd button enables mouse | 

















异 幕 上 如 预 
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圆 

File Edit View Search Termi 
<bochs:2> info tab 
cr3: Qx000000100000 
69x000060060-9x6000ffTfTff 
Ox00100000-9x900102fff 
OxcO000000-OQxcOOfffff 


OxffcO0000-OxffcOOfTTf 
Oxfff00000-Oxffffefff 
Oxfffff000-Oxffffffff 





A 


测 | 








期 打印 了 我 








hn:o-tl 


| | | | | | 
8-21 ”bochs 运行 结果 

















前 过 get kernel pages(3) 申 请 了 3 个 物理 页 。 代 码 没 什么 可 说 的 ， 编 译 链接 后 写 入 虚 
们 在 bochs 中 运行 试 试看 效果 ， 如 

















门 想 要 的 信息 ， 









































work@localhost:~/my_workspace/bochs 


nal Help 


-> Ox000000000000-0x0000000fffff 
-> 0x000000200000-9x900000202fff 
-> Ox000000000000-0x9000000fffff 
Bxc0100000-0xc0102fff -> 6x000000200600-06x000000202fff 

-> Ox000000101000-0x000000101fff 
-> Ox000000101000-0x0000001fffff 
-> Ox000000100000-0x900009100fff 














址 ， 还 是 物理 地 址 ， 只 要 其 是 连续 的 ，bochs 就 会 合 3 
0xc0102fff 所 映射 的 物理 地 址 范围 是 0x200000 一 0x202fff。 
射 ， 用 page 指令 分 别 对 各 个 虚拟 页 查看 其 映射 到 的 物理 页 ， 大 伙 儿 自 
对 照 着 三 个 命令 的 输出 验证 吧 。 左 边 的 方 框 是 虚拟 地 址 ， 右 边 的 方 框 是 物 








为 验证 下 各 个 虚拟 





























最 后 
我 们 看 最 
变化 与 预期 符 


通过 x/10 0xc009a000 查看 了 


<bochs:3> page QOxc0100000 
PDE: Ox0000000000101067 


PTE: 90x9000000000200967 


linear page maps 
<bochs:4> page 0xc9101000 
PDE: Qx0000000000101067 
PTE: Qx0000000000201067 
linear page maps 
<bochs:5> page Qxc0102000 
PDE: Ox00000000600161657 


PTE: 0x9000000000202967 


linear page [xc9102000| maps 
<bochs:6> x 90xc009a000 






























































也 址 的 上 


《让 











ps 


to 


ps 


to 





A pcd pwt UWP 
gpatDApcd pwtUWP 
physical page |9ox000000200000 


A pcd pwt UWP 
gpatDApcd pwtUWP 
physical page |OQx000000201000 


A pcd pwt UWP 


gpatDApcd pwtUWP 
physical page [90x000000202000 


0x90900007 











有 info tab 查看 了 页 表 中 虚拟 地 址 与 物理 地 址 的 映射 关系 ， 在 其 后 
， 右 边 是 所 映射 的 物理 





8-22 ”bochs 控制 合 


的 虚拟 地 址 。 
台中 验证 一 下 ， 看 看 以 上 所 有 代码 的 效果 ， 如 图 8-22 所 示 。 
下 夯 线 的 部 分 是 调试 命令 ， 方 框 中 的 是 输出 信息 。 
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到 一 起 输出 。 因 此 ， 虚 拟 地 址 范围 
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其 中 用 两 个 方 框 标 出 了 两 个 重点 信息 : 上面 的 
框 是 内 核 物 理 内 存 池 的 起 始 物理 地 址 ， 为 0x200000， 下 面 的 框 是 在 main.c 中 申请 
咱们 继续 在 bochs 控 甫 


图 8-22 中 ， 夯 





面 的 最 大 的 长 方 框 中 
地 址 。 在 bochs 的 输出 中 ， 无 论 地 址 是 虚拟 地 





0xc0100000 一 





























二 
i 
[ 诗 - 
ot- 
片 - 
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内 核 内 存 池 的 位 图 所 在 地 址 ， 
后 一 个 框 ， 其 内 容 是 0x00000007， 这 说 明 低 3 位 都 是 1， 



































这 和 是 医 











为 咱们 申请 ] 






























































本 节 真 是 有 点 长 ,不 过 总 算 结束 了 ， 有 关内 存 管理 的 部 分 咱们 先 告 
都 介绍 完 后 咱们 再 回来 继续 丰富 它 的 功能 。 
兄弟 们 辛 苗 了 ， 本 章 任 务 完成 ， 下 一 章 再 见 。 

































































二 
Cj 





图 中 最 下 面 的 三 行 是 此 命令 的 输出 ， 
3 个 页 ， 位 图 的 


段落 ， 待 今后 把 其 他 相关 的 内 容 
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3 实现 内 核 线程 


在 我 们 学 习 操 作 系统 课程 之 前 就 知道 ， 为 了 充分 利用 计算 机 硬件 资源 ， 要 让 计算 机 尽 可 能 “同时 ”多 做 一 些 
工作 。“ 工 作 ” 是 由 处 理 器 执行 某 段 程序 代码 来 完成 的 ， 这 段 程序 代码 就 称 为 进程 ， 一 个 进程 可 以 完成 一 项 工作 。 
有 的 时 候 ， 工 作 往往 并 不 简单 ， 它 由 多 个 “ 子 工作 ”组 成 ， 因 此 ， 我 们 需要 让 进程 尽 可 能 “同时 ”多 做 一 些 子 工 
作 ， 这 些 子 工作 也 得 由 程序 代码 完成 ， 完 成 这 些 子 工作 的 程序 就 是 线程 。 
既然 是 要 求 同 时 去 做 计算 机 中 的 “工作 ” 因此 工作 无 论 大 小 ， 都 是 独立 的 控制 执行 流 ， 需 要 处 理 器 
单独 去 执行 ， 所 以 进程 和 线程 是 最 基本 的 执行 单元 。 
线程 和 进程 咱们 要 分 两 部 分 实现 ， 本 节 咱们 先 开始 线程 之 旅 。 
9.1.1 执行 流 
过 去 ， 计 算 机 只 有 1 个 处 理 器 (当然 ， 即 使 是 现在 ， 计 算 机 中 的 处 理 器 数量 也 不 是 无 限 的 ， 一 般 是 8 
核 左 右 )， 在 其 上 运行 的 系统 也 是 单 任务 操作 系统 ， 即 不 管 有 多 少 个 任务 ， 任 务 的 执行 都 是 囊 行 的 ， 一 个 
任务 彻底 执行 完成 后 才能 开始 下 一 个 任务 。 
假如 有 任务 A， 它 的 执行 要 耗 时 一 天 (一 点 都 不 夸张 ， 在 流量 较 大 的 业务 中 有 这 样 的 脚本 任务 ， 经常 跑 个 
一 天 半天 的 ), 任务 B 的 执行 仅 需 要 2 分 钟 ， 如 果 任务 A 先 上 处 理 器 上 运行 ， 似 乎 会 严重 滞后 其 他 的 任务 执行 
计划 ， 用 户 往往 是 急躁 的 ， 为 了 执行 一 个 2 分 钟 的 任务 要 等 上 一 天 ， 这 怎么 得 了 。 
于 是 ， 在 处 理 器 数量 不 变 的 情况 下 ， 多 任务 操作 系统 出 现 了 ， 它 采用 了 
一 种 称 为 多 道 程序 设计 的 方式 , 使 处 理 器 在 所 有 任务 之 间 来 回 切换 ,这样 就 
给 用 户 一 种 所 有 任务 并 行 运行 的 错觉 ， 这 称 为 “ 伪 并 行 ” 毕竟 在 任意 时 刻 ， Csr > 调 
处 理 器 只 会 执行 某 一 个 任务 ， 处 理 器 会 落 到 哪些 任务 上 执行 ， 这 是 由 操作 系 (cpy) 度 



















































































































































































































































































































































































































































































统 中 的 任务 调度 器 决定 的 ， 如 图 9-1 所 示 ， 处 理 器 固定 在 圆心 ， 任 务 就 像 轮 
盘 一 样 , 由 任务 调度 器 把 任务 转动 到 处 理 器 的 箭头 处 , 这 就 表示 上 CPU 运行 。 

按理 说 ， 一 个 处 理 器 任意 时 刻 只 能 执行 一 个 任务 ， 真 正 的 并 行 是 指 多 个 处 
理 器 同时 工作 , 一 台 计 算 机 的 并 行 能 力 取决 于 其 物理 处 理 器 的 数量 。 也 就 是 说 ， 
目前 本 来 只 有 1 个 处 理 器 ， 但 现在 非 要 让 其 兼顾 所 有 的 任务 ， 唯 一 的 做 法 是 只 
能 让 每 个 任务 各 在 处 理 器 上 执行 一 小 会 儿 ， 然 后 再 换 下 一 个 任务 上 处 理 器 ， 直 到 所 有 任务 都 执行 完毕 。 

以 上 的 任务 轮转 工作 就 是 由 任务 调度 器 来 完成 的 ， 什 么 是 任务 调度 器 呢 ? 

简单 来 说 , 任务 调度 器 就 是 操作 系统 中 用 于 把 任务 轮流 调度 上 处 理 器 运行 的 一 个 软件 模块 , 它 是 操作 
系统 的 一 部 分 。 调 度 器 在 内 核 中 维护 一 个 任务 表 ( 也 称 进程 表 、 线 程 表 或 调度 表 )， 然 后 按照 一 定 的 算法 ， 
从 任务 表 中 选择 一 个 任务 ,然后 把 该 任务 放 到 处 理 嚣 上 运行 ， 当 任务 运行 的 时 间 片 到 期 后 ， 再 从 任务 表 
找 另外 一 个 任务 放 到 处 理 器 上 运行 , 周而复始， 让 任务 表 中 的 所 有 任务 都 有 机 会 运行 。 正 是 因为 有 了 调度 
器 ， 多 任务 操作 系统 才能 得 以 实现 ， 它 是 多 任务 系统 的 核心 ， 它 的 好 坏 直接 影响 了 系统 的 效率 。 

这 种 伪 并 行 的 好 处 是 降低 了 任务 的 平均 响应 时 间 , 通俗 点 说 , 就 是 让 那些 执行 时 间 短 的 任务 不 会 因为 
“后 到 ”而 不 得 不 等 前 面 “ 先 来 ”的 且 执 行 时 间 很 长 的 程序 执行 完 后 才能 获得 执行 的 机 会 ， 整 体 上 “显得 ” 
快 了 很 多 。 当 然 这 和 调度 算法 有 关 , 这 里 所 说 的 调度 算法 是 较为 “公正 ”的 时 间 片 轮转 算法 , 也 称 为 轮 询 。 





























































































































4 图 9-1 伪 并 行 调度 























































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































那 多 任务 就 没有 什么 弊端 吗 ? 
对 于 所 有 任务 来 说 ， 在 不 考虑 阻塞 的 情况 下 ， 无 论 是 在 哪 种 系统 上 ， 它 们 “自身 指令 ”总 共 的 执行 时 
间 之 和 应 该 是 一 致 的 。 但 是 ， 在 多 任务 系统 中 ， 任 务 切换 是 软件 完成 的 ， 切 换 工作 本 身 必 然 要 消耗 处 理 器 
周期 ， 因 此 所 有 任务 的 总 共 执行 时 间 反而 更 长 了 ， 如 图 9-2 所 示 ， 四 个 任务 : A、B、C、D 执行 的 总 时 间 ， 
在 多 任务 操作 系统 上 的 时 间 更 长 ， 其 中 右 图 中 虚线 
的 部 分 是 任务 切换 的 时 间 成 本 。 人 全 用 
虽然 所 有 任务 总 的 执行 时 间 变 长 了 一 些 , 但 能 c 一 co _-”_ -=-” 
够 让 后 面 紧急 的 任务 及 时 完成 ， 这 点 代价 算 起 来 也 “4 一 小 =- - 
算是 微不足道 了 。 -时 间 | - 时 间 
任务 并 行 这 是 用 软件 来 切换 任务 模拟 出 来 的 ， 
假 包 ， 处 理 器 根本 就 不 在 平 切 换 任务 这 问 事 , 不 过 全。 
话 不 能 说 得 这 么 绝对 ， 其 实处 理 器 原生 支持 “ 任 
务 ” 并 提供 了 相关 的 结构 、 方 法 ， 比 如 TSS 结构 和 任务 门 ， 因 此 它 知道 何 时 发 生 了 任务 切换 ， 只 是 咀 们 
没 用 它 提供 的 方法 ， 当 然 这 是 后 话 ， 介 绍 到 后 面 时 您 就 清楚 了 ， 反 正 它 不 关心 咱们 眼中 的 任务 切换 是 在 干 
吗 , 甚至 还 以 为 这 是 任务 的 一 部 分 呢 。 因 为 处 理 器 只 知道 加 电 后 按照 程序 计数 器 中 的 地 址 不 断 地 执行 下 去 ， 
在 不 断 执行 的 过 程 中 ， 我 们 把 程序 计数 器 中 的 下 一 条 指令 地 址 所 组 成 的 执行 轨迹 称 为 程序 的 控制 执行 流 ， 
让 我 们 再 深入 描述 一 下 。 执 行 流 就 是 一 段 逻 辑 上 独立 的 指令 区 域 ， 是 人 为 给 处 理 器 安排 的 处 理 单元 。 指 
令 是 具备 “能 动 性 ”的 数据 ， 因 此 只 有 指令 才 有 “执行 ”的 能 力 ， 它 相当 于 是 动作 的 发 出 者 ， 由 它 指导 
处 理 器 产生 相应 的 行为 。 指 令 是 由 处 理 器 来 执行 的 ， 它 引领 处 理 器 “前 进 ” 的 方向 ， 用 “ 流 ”来 表示 处 
理 器 中 程序 计数 器 的 航向 ， 借 此 比喻 处 理 器 依次 把 此 区 域 中 的 指令 执行 完 后 ， 所 形成 的 像 河流 一 样 曲直 
不 一 的 执行 轨迹 、 执 行路 径 〈 由 顺序 执行 指令 及 跳 转 指令 导致 )。 
执行 流 对 应 于 代码 ,大 到 可 以 是 整个 程序 文件 ， 即 进程 , 小 到 可 以 是 一 个 功能 独立 的 代码 块 , 即 函数 ， 
而 线程 本 质 上 就 是 函数 。 
执行 流 是 独立 的 ， 它 的 独立 性 体现 在 每 个 执行 流 都 有 自己 的 栈 、 一 套 自 己 的 寄存 器 映像 和 内 存 资源 ， 




















这 是 Intel 处 理 






































器 在 硬件 上 规定 的 ， 其 实 这 正 是 执行 流 









































的 上 下 文 环境 。 因 此 ， 





























































































































我 们 要 想 构 造 一 个 执行 流 ， 





























































































































就 要 为 其 提供 这 一 整套 的 资源 。 不 知道 我 说 清楚 了 没有 , 我 的 意思 是 其 实 任 何 代 码 块 ,无 论 大 小 都 可 以 独 
立成 为 执行 流 ， 只 要 在 它 运行 的 时 候 ， 我 们 提前 准备 好 它 所 依赖 的 上 下 文 环境 就 行 ， 这 个 上 下 文 环 境 就 是 
它 所 使 用 的 寄存 器 映像 、 栈 、 内 存 等 资源 。 

成 为 独立 的 执行 流 有 什么 用 呢 ? 这 可 有 大 用 了 , 在 任务 调度 器 的 眼 里 ， 只 有 执行 流 才 是 调度 单元 ， 即 
处 理 器 上 运行 的 每 个 任务 都 是 调度 器 给 分 配 的 执行 流 ， 只 要 成 为 执行 流 就 能 够 独立 上 处 理 器 运行 了 ， 也 就 
是 说 处 理 器 会 专门 运行 执行 流 中 的 指令 。 

也 许 您 要 问 了 , 程序 中 哪些 才 是 独立 的 执行 流 呢 ?” 其 实 我 们 早已 经 耳熟能详 了 , 执行 流 就 是 我 们 要 介 
绍 的 线程 和 进程 。 

说 了 这 么 多 , 我 们 软件 中 所 做 的 任务 切换 ， 本 质 上 就 是 改变 了 处 理 器 中 程序 计数 器 的 指向 ， 即 改变 了 
处 理 器 的 “执行 流 ”。 























任务 只 是 人 为 划分 的 、 逻 辑 上 的 概念 ， 人 们 把 一 个 个 的 执行 
此 ， 独 立 的 执行 流 成 了 调度 器 的 调度 单元 ， 并 使 之 成 为 了 处 理 

















是 这 些 彼此 独立 的 执行 流 ， 因 
行 单位 。 








好 啦 ， 本 节 
9.1.2 ”线程 到 底 是 什么 


先 到 这 ， 兄 弟 们 下 节 再 见 。 




















说 实话 ， 本 节 我 考虑 了 几 次 要 不 要 写 ， 
。 但 今天 有 朋友 和 我 聊 起 他 





儿 比 我 还 清楚 












































同步 代码 的 功能 。 其 实 这 根本 








不 着 








毕竟 大 家 
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线程 用 









































单元 称 为 和 


得 很 频繁 ， 
j 多 线程 解决 了 工作 中 的 问题 ， 大概 内 容 是 他 
使 用 线程 来 做 这 事 ， 完 全 可 以 通过 把 N 个 同步 脚本 放 在 后 台 “ 


FE 务 ， 我 们 所 说 的 执行 单元 就 
器 的 基本 执 
































线程 到 底 是 什么 ,我 想 大 伙 
| 线程 实现 了 并 发 
并 行 2 
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来 解决 。 造成 这 种 认识 的 本 质 原因 就 是 不 明白 线程 的 原理 , 不 会 灵活 运用 其 他 更 简单 的 方法 来 做 线程 可 以 
完成 的 工作 。 因 此 ， 下 面 和 大 伙 说 下 我 个 人 对 线程 的 理解 。 

初次 接触 线程 是 在 高 级 语言 中 ， 解 铃 还 须 系 铃 人 ， 咀 们 还 是 用 高 级 语言 来 解释 它 。 要 不 咱们 先 看 看 实 
际 代码 吧 ， 回 忆 下 线程 是 怎么 用 的 。 
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代码 thread_test.c 


#include<stdio.h> 
#include<pthread.h> 


unsigned int * arg = arg; 


二 

2 

3 

4 void* thread func(void* arg) { 

3 

6 printf(" new thread: my tid is %u\n", *arg); 
7 


} 


8 

9 void main() { 
10 pthread t new thread id; 
汪汪 pthread create(&new thread id, NULL, thread func, &new thread id) : 
12 printf("main thread: my tid is Su\n", pthread self()); 

3 usleep (100)，; 

14 } 


这 个 thread_test.c 还 是 蛮 简 单 的 ， 我 们 在 第 2 行 包 含 了 pthread.h， 这 是 POSIX 版 本 线程 库 。 第 11 行 
利用 了 pthread_create 函数 创建 线程 ， 此 函数 的 原型 是 : 


int pthread create (pthread t * restrict _ newthread, 
_ Const pthread attr 七 * restrict _ attr, 

void *(* start routine) (void *), 

void * restrict arg) THROW nonnull ((1, 3)); 


此 函数 接受 4 个 参数 。 
第 1 个 参数 _newthread 用 于 存储 新 创建 线程 的 id， 也 就 是 tid， 这 里 保存 在 pthread_t 类 型 的 变量 
new_thread ld 中。 
第 2 个 参数 _attr 用 于 指定 线程 的 类 型 ， 我 们 这 里 就 用 默认 类 型 就 好 ， 因 此 实 参 是 NULL。 
第 3 个 参数 _ start_routine 是 个 函数 指针 ， 确 切 地 说 是 个 返回 值 为 void*、 参 数 为 void* 的 函数 指针 ， 
用 来 指定 线程 中 所 调用 的 函数 的 地 址 , 或 者 说 是 在 线程 中 运行 的 函数 的 地 址 。 这 里 的 实 参 就 是 在 上 面 定义 
的 函数 thread_func， 也 就 是 说 让 新 创建 的 线程 去 调用 执行 thread_func 函数 。 
第 4 个 参数 _arg， 它 是 用 来 配合 第 3 个 参数 的 ， 是 给 在 线程 中 运行 的 函数 _ start_routine 的 参数 ， 我 
们 此 处 把 new_thread_id 传 给 thread_func。 注 意 ， 由 于 给 _start_routine 函数 做 参数 的 只 有 这 一 个 形 参 ， 当 
参数 多 于 一 个 时 ， 最 好 把 参数 封装 为 一 个 结构 体 ， 把 此 结构 体 地 址 传 给 _arg， 然 后 在 _ start_routine 指向 
的 函数 体 中 再 去 解析 参数 。 
pthread_create 函数 的 返回 值 若 为 0， 则 表示 创建 线程 成 功 ， 否 则 就 表示 出 错 码 。 
您 看 ， 咱 们 为 了 简单 ， 也 没 去 判断 pthread_create 的 返回 值 ， 权 当 一 定 会 成 功 ， 去 除了 不 相关 的 东西 ， 只 剩 
下 赤裸 裸 的 真相 。 然 后 在 主线 程 main 和 新 线程 thread_func 中 分 别 打 印 自己 的 tid。 由 于 不 清楚 新 线程 是 否 是 
在 主线 程 结束 之 前 被 调用 ， 因 此 在 主线 程 main 的 最 后 调用 了 usleep 函数 使 其 阻塞 100 微 秒 。 
把 thread_test.c 编译 ， 运 行 结 果 如 图 9-3 所 示 。 
























































































































































































































































































































































































































































[work@localhost thread]$ gcc -o thread_test.bin -lpthread thread_ test.c 
[work@localhost thread]$ ./thread_test.bin 
main thread: my tid is 3078870720 


new thread: my tid is 3078867824 
[work@localhost thread]$ 目 








4 图 9-3 ”线程 测试 









































如 果 您 是 第 一 次 接触 到 线程 ， 通 过 这 个 简单 的 例子 ， 不 知道 您 是 否 看 出 点 什么 端倪 没有 ,线程 其 实 就 
是 运行 一 段 函 数 的 载体 。 
在 高 级 语言 中 ， 线 程 是 运行 函数 的 另 一 种 方式 ， 也 就 是 说 ， 构 建 一 套 线程 方法 ， 让 函数 在 此 线程 中 被 























目 ， 然 后 处 至 








器 去 执行 这 个 函数 ， 因 有] 











比 线程 实际 的 功能 就 是 相当 于 调 月 





Sok 


bb 
月 已 








那 它 和 普通 的 函 


要 回 
排 一 个 “执行 流 
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答 这 个 问题 ， 这 涉及 到 调度 器 允 
上 处 理 器 ， 执 行 流 肯定 是 独立 的 ， 独 立 的 意思 就 是 


数 调用 有 什么 





区 别 昵 ? 














矣 护 的 线程 表 或 进程 表 了 ， 这 属于 i 


周 度 单元 的 问题 。1 


日 了 这 个 函数 ， 从 而 让 函数 执行 。 


周 度 器 每 次 安 














已 有 自 





的 栈 ， 也 就 是 有 独立 的 j 
在 介绍 执行 流 的 时 候 强 i 


之 前 


上下 文 位 





环境 。 




















i 就 可 以 被 


至 


执行 
独 上 处 
在 一 般 的 函数 
元 也 许 是 整个 进程 





























备 好 它 所 依赖 的 上 下 文 环境 就 行 ， 
周 度 器 视 为 一 个 
器 的 代码 块 准备 好 它 所 
骨 用 中 ， 它 是 随 着 此 函数 所 在 的 调度 和 
也 的 线程 ， 总 之 是 混在 更 大 的 执行 流 中 被 “夹杂 








这 个 上 下 文 环境 就 是 它 所 使 月 
度 单元 ,就 可 以 享受 处 理 器 
依赖 的 上 下 文 环 境 , 从 而 使 其 具备 独立 和 
元 〈 执 行 流 ) 
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也 可 能 是 其 








至 有 可 能 还 未 执行 至 





行 此 函数 ， 说 是 被 顺便 执行 一 点 不 夸张 ， 因 为 调度 单元 是 被 调度 器 安排 上 处 到 
度 单 元 ， 人 家 调度 器 眼 里 看 不 到 此 函数 ， 当 然 不 





能 专门 运行 它 了 。 山 














1 此 函数 它 的 时 间 片 就 到 了 ， 从 而 被 换 下 了 处 理 器 ,您 懂 的 ， 处 王 





块 上 处 理 


己 的 





骨 过 了 ， 其 实 任何 代码 块 都 可 以 独立 ， 只 要 在 它 和 运行 的 时 候 ， 我 们 给 它 准 
上 的 寄存 器 映像 和 材 等 资源 。 只 要 是 独立 的 





的 单独 服务 。 我 们 要 做 的 就 是 : 给 任何 想 身 
E, 使 之 成 为 执行 流 ， 即 





套 寄存 器 映像 ， 有 自己 
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调度 单元 。 



































调度 单元 


情况 如 图 9-4A 所 示 。 为 进程 














图 9-4 中 ，j 


度 单元 ， 图 9-4A 所 
线程 是 一 套 机 征 
块 创造 它 所 依赖 的 J 








周 度 
任务 ， 因 此 它 将 左右 滑动 ， 选择 它 认 为 合适 的 调 


上 下 文 环 境 ,， 从 而 让 代码 块 具 








器 决定 把 处 理 器 分 配给 哪个 








进程 A 
func_al 
func_a2 


进程 B 








func_b2 


示 的 调度 单元 是 进程 级 别 。 
小 此 机 制 可 以 为 一 般 的 代码 








则 油光 





func_an func_bn 





把 处 理 器 分 配 
给 某 个 执行 流 








有 独立 性 , 因此 在 原 














调度 单元 (或 称 为 执行 流 )， 使 函数 能 被 i 
“认可 ” 从 而 能 够 被 专门 i 
[以 被 加 入 到 线程 





这 样 , 函数 就 可 








E 上 线程 能 使 一 段 函数 成 为 
周 度 器 
周 度 到 处 理 器 上 执行 。 


表 中 作为 调度 器 
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的 调度 


元 ， 从 而 有 机 会 单独 获得 处 到 
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也 就 是 说 ， 处 理 


器 不 是 
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巴 线程 中 1 





用 的 函数 和 其 

















他 和 


肯 令 混在 一 块 执行 





器 运行 的 ， 这 个 调度 单 
、 稍 带 着 ” 
器 毕竟 不 是 专门 去 执 





歧 


全 





执行 的 ， 

















器 的 ，] 








进程 A 


比 函数 不 是 单独 的 调 


调度 单元 
为 线程 


线程 a2 进程 B 线程 bl 





func_al 


func_an 
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func_a2 | func_b2 | func_b1 


func_bn 











把 处 理 器 分 配 
给 某 个 执行 流 


调度 器 


O_O 
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线程 的 作 
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举 个 例子 ， 就 拿 只 








们 在 




















的 ， 或 者 说 不 是 在 执行 整个 进程 时 顺便 执行 了 该 函数 ， 而 是 和 
E 饭 店 里 点 菜 来 说 , 一 般 都 是 咱们 点 好 了 菜 让 厨师 给 








和 独 、 








做 。 





什么 是 菜 ? 饭店 里 有 个 规 


专门 执行 了 此 函数 。 




















和 矩 ， 只 要 是 盛 在 单独 
单 中 。 比 如 咀 们 拿 着 菜单 ， 从 中 点 了 炒 宫 保 鸡 丁 这 道 末 ,咱们 顾客 相当 











大 





的 器 








中 ， 如 碟子 或 盘子 ， 就 可 以 成 为 一 道 菜 来 卖 ， 

















们 选择 了 让 厨师 襄 饪 
器 的 角色 ， 炒 沫 的 过 程 就 相当 于 进程 。 但 您 就 是 喜欢 吃 伦 生 ， 每 次 ] 





























局 -让 


下 这 十 ， 


那 道 菜 。 厨 师 在 熹 饪 过 程 中 ， 根 和 




















这 里 的 花生 便 是 厨 好 
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E 做 富 保 鸡 丁 时 “ 稍 带 着 ”加 


此 就 
于 调度 器 ， 
在 菜 里 加 了 鸡肉 丁 、 
上 这 道 荣 的 
进去 的 ， 它 相当 于 进程 中 的 音 


喧 





分 代码 


以 把 菜 名 放 到 饭店 的 大 沫 
羔 单 相当 于 进程 表 ， 是 咱 
花生 米 等 ， 此 时 厨师 就 扮 
时 候 会 先 挑 花 4 























来 吃 ， 
， 虽 然 它 也 是 宫 保 鸡 


























本 的 配料 ,但 它 毕 葛 





已 于 哆 个 契 


做 配料 ， 而 且 是 在 炒 


是 组 成 部 分 而 已 ， 此 时 可 以 理解 为 若 厨 电 




















菜 的 某 一 工序 中 加 进去 的 ， 通 














秒 钟 的 事 。] 





比 时 的 情 




















景 类 似 于 函数 在 进程 中 被 调 | 











限 的 ， 一 般 情况 下 只 
花生 米 就 














菜 ( 调 度 单元 )， 厨 师 用 


行 了 ， 由 于 花生 米 是 



































盘子 盛 上 来 的 〈 册 
专门 的 时 间 训 饪 这 道 染 。 因 此 ， 同 检 























变 成 了 一 i 


道 可 以 被 顾客 (i 


常 就 是 抓 一 把 花生 米 放 进 锅 
一 样 ， 是 顺便 执行 ， 而 不 是 专门 执行 ， 而 上 且 
占 进程 时 间 片 的 一 小 部 分 。 既 然 您 喜欢 吃 花生 ， 为 了 让 您 吃 个 爽快 ， 那 咱们 专门 点 一 盘 
处 的 盘子 相当 于 线程 )， 这 时 的 花生 就 从 配料 变 成 了 一 道 
都 是 花生 ， 但 就 是 因为 有 了 盘子 〈 线 程 )， 使 





昌 





做 了 宣 保 鸡 丁 这 道 菜 ， 就 要 加 入 少量 的 花生 
星 ， 此 过 程 很 短暂 ， 也 就 是 秘 














四 | 























度 器 ) 选择 的 菜 《〈 调 度 单 元 )， 厨 师 〈 处 理 器 ) | 




















加 | 








还 多 了 ， 此 情景 就 是 函数 以 
使 该 函数 单独 得 到 执行 。 因 此 ， 在 这 个 例子 9 





数 ， 从 而 





总 之 ,在 线程 中 调用 函 














线程 的 形式 变 成 了 调度 和 





执行 时 间 是 有 






































j 在 亮 饪 上 的 时 间 长 了 ， 做 的 量 
# 元， 被 加 入 到 调度 器 的 线程 表 ， 使 调度 器 可 以 看 到 该 函 








站， 











数 是 让 所 运行 的 函数 能 够 以 调度 单元 的 身份 独立 








线程 是 用 于 盛 菜 的 盘子 ， 盘 子 + 菜 便 是 
器 运行 ， 当 函数 可 以 独 





上 处 到 











立 运 行 时 ， 就 会 有 更 大 的 好 处 ， 习 











就 是 可 以 让 程序 中 











风度 单元 。 








的 多 个 函数 《执行 流 ) 以 并 行 的 方式 运行 (当然 是 伪 
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并 行 )， 为 程序 提速 。 
9.1.3 ”进程 与 线程 的 关系 、 区 别 简 述 
程序 是 指 静态 的 、 存 储 在 文件 系统 上 、 尚 未 运行 的 指令 代码 ， 它 是 实际 运行 时 程序 的 映像 。 
进程 是 指正 在 运行 的 程序 , 即 进行 中 的 程序 , 程序 必须 在 获得 运行 所 需要 的 各 类 资源 后 才能 成 为 进程 ， 
资源 包括 进程 所 使 用 的 栈 ， 使 用 的 寄存 器 等 。 
对 于 处 理 器 来 说 ， 进 程 是 一 种 控制 流 集合 ， 集 合 中 至 少 包含 一 条 执行 流 ， 执 行 流 之 间 是 相互 独立 的 ， 但 它 
们 共享 进程 的 所 有 资源 ， 它 们 是 处 理 器 的 执行 单位 ， 或 者 称 为 调度 单位 ， 它 们 就 是 线程 。 
可 以 认为 ， 线 程 是 在 进程 基础 之 上 的 二 次 并 发 。 
按照 进程 中 线程 数量 划分 ， 进 程 分 为 单线 程 进程 和 多 线程 进程 两 种 。 我 们 平时 所 写 的 程序 ,如 果 其 中 未 
“ 显 式 ”创建 线程 ， 它 就 属于 单线 程 进程 ， 这 就 是 我 们 平时 所 指 的 “传统 型 ”的 进程 ， 否 则 就 属于 多 线程 进 
程 。 对 于 这 种 传统 型 进程 ， 不 知道 大 伙 儿 是 否 觉得 奇怪 : 居然 里 面 还 有 1 个 线程 ? 也 许 您 的 反应 是 :“ 这 简 
直 颠 履 了 我 对 进程 的 认 知 ;…… ”是 的 ， 很 多 人 都 这 么 想 ， 但 是 当 您 意识 到 线程 仅仅 是 个 执行 流 ， 而 任何 程序 
至 少 都 有 一 个 执行 流 时 ， 您 对 此 还 感到 奇怪 吗 ? 此 处 觉得 证 异 也 不 要 紧 ， 在 后 面 会 渐渐 水 落石 出 。 
举 个 例子 ， 进 程 与 线程 的 关系 就 像 公司 部 门 和 部 门 内 的 人 员 ， 部 门 要 完成 一 个 项 目 ， 必 须要 发 动 部 门 
内 所 有 人 员 的 力量 ， 部 门 中 的 每 个 人 都 要 为 此 项 目 承担 不 同 的 工作 。 对 于 公司 来 说 ， 公 司 的 战略 要 落实 到 
各 个 部 门 上 ， 公 司 的 业绩 要 由 各 部 门 产 出 ， 因 此 ， 部 门 就 是 一 个 进程 ， 部 门 的 任务 便 是 要 完成 的 项 目 ， 也 就 
是 进程 运行 的 结果 。 部 门 内 人 员 是 具体 做 事 的 执行 单位 ， 项 目 被 拆 分 成 不 同 的 子 任务 分 派 给 个 人 ， 他 们 相当 
于 线程 ， 整 个 项 目 需 要 这 些 人 员 (线程 ) 共同 协作 ， 直 到 项 目 完成 ， 也 就 是 进程 运行 结束 。 部 门 〈 进 程 ) 中 
人 员 《 线 程 ) 可 多 可 少 ， 但 至 少 得 有 一 个 人 《线程 ) 才 行 ， 这 样 部 门 〈 进 程 ) 才 有 存在 的 必要 ， 否 则 没有 人 
(线程 ) 来 干 活 ， 部 门 〈 进 程 ) 就 不 存在 。 
我 们 在 操作 系统 课程 中 学 过 ， 每 个 进程 都 运行 在 自己 的 地 址 空间 中 ， 话 说 有 内 存 空 间 才能 存储 资源 
因此 进程 拥有 此 程序 运行 所 需 的 全 部 资源 。 默认 情况 下 进程 中 只 有 一 个 执行 流 ， 即 一 个 进程 只 能 干 一 件 事 。 
有 些 情况 下 ， 我 们 需要 在 一 个 地 址 空间 中 存在 多 个 执行 流 ， 即 让 进程 同时 “并 行 ” 做 很 多 事 ， 这 多 个 执行 
流 指 的 就 是 线程 。 执 行 流 就 是 调度 器 的 调度 单位 ， 是 处 理 器 的 执行 单元 ， 线 程 在 此 方面 和 进程 的 行为 是 一 
致 的 ， 只 不 过 线程 不 包括 位 于 进程 中 的 、 自 己 所 需要 的 资源 ， 言 外 之 意 是 线程 没有 自己 独 享 的 地 址 空间 ， 
没 空 间 就 无 法 存储 自己 的 资源 ,所 以 线程 必须 “ 活 ” 在 进程 的 世界 里 ， 借 助 进程 空间 中 的 资源 运行 。 因 此 ， 
线程 和 进程 比 ， 进 程 拥有 整个 地 址 空间 ， 从 而 拥有 全 部 资源 ， 线 程 没 有 自己 的 地 址 空间 ， 因 此 没有 任何 属 
于 自己 的 资源 ， 需 要 借助 进程 的 资源 “生存 ”， 所 以 线程 被 称 为 轻 量 级 进程 ( 照 理 说 ， 进 程 被 称 为 重量 级 
线程 也 未 党 不 可 )。 进 程 和 线程 都 是 执行 流 ， 它 们 都 具备 独立 寄存 器 资源 和 独立 的 栈 空 间 ， 因 此 线程 也 可 
以 像 进 程 那样 调用 其 他 函数 。 似 乎 这 么 说 还 是 显得 没什么 “干货 ” 别 急 ， 咱 们 慢 慢 解释 。 
线程 仅仅 是 个 执行 流 ， 并 不 是 什么 高 深 莫 测 的 东西 ， 它 只 是 被 一 些 线程 实现 机 制 增 加 了 神秘 感 。 比 如 像 
POSIX 线程 库 中 的 pthread_create 函数 ， 它 的 功能 是 用 来 创建 线程 ， 传 给 此 函数 的 第 三 个 实 参 必须 是 一 个 事 
先 定义 好 的 函数 ， 这 个 作为 参数 的 函数 就 是 我 们 所 说 的 代码 块 ， 也 就 是 前 面 所 解释 的 “执行 流 ” 可 见 ， 线 
程 创建 函数 pthread_create 仅仅 是 创建 执行 流 的 一 种 方式 而 已 ， 没 什么 神奇 的 ， 大 伙 儿 要 透 过 现象 看 本 质 。 
在 显 式 创建 了 线程 之 后 ， 任 务 调度 器 就 可 以 把 它 对 应 的 代码 块 从 进程 中 分 离 出 来 单独 调度 上 处 理 器 执行 了 ， 
否则 调度 器 会 把 整个 进程 当成 一 个 大 的 执行 流 ， 也 可 以 说 是 把 整个 进程 当成 一 个 线程 ， 从 头 到 尾 依次 执行 下 去 。 
线程 是 在 进程 之 后 才 提 出 的 概念 ,在 没有 线程 之 前 ， 进 程 就 是 理所当然 的 执行 流 ， 或 者 说 进程 只 是 一 个 大 的 
执行 流 〈 也 许 执行 流 没 有 大 小 之 分 ， 但 有 数量 之 别 )。 在 有 了 线程 的 概念 后 《仅仅 是 在 名 词 概念 之 后 ， 其 实 线程 
这 玩意 一 直 存 在 ， 后 面 会 提 到 )， 执 行 流 便 专 指 粒 度 更 细 的 线程 ， 因 此 线程 是 最 小 的 执行 单元 。 处 理 器 执行 任何 
程序 ， 其 过 程 都 是 一 步 步 跟随 程序 中 下 一 步 要 执行 的 指令 ， 所 以 说 程序 都 有 执行 流 ， 知 未 显 式 创建 线程 ， 则 当 
前 进程 中 的 指令 自然 也 是 执行 流 , 也 就 是 只 存在 一 个 线程 唆 。 因 此 纯粹 的 进程 实际 上 就 相当 于 单一 线程 的 进程 ， 
也 就 是 前 面 所 说 的 单线 程 进程 。 进 程 中 若 显 式 创建 了 多 个 线程 时 ， 就 会 有 多 个 执行 流 ， 也 就 是 多 线程 进程 。 
以 上 所 述 也 许 和 您 之 前 对 进程 和 线程 的 印象 有 些 出 入 ， 总 之 , 我 要 表达 的 是 线程 就 是 执行 流 ,不 是 说 只 
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9.1 实现 内 核 线 程 


有 “ 显 式 ” 创 建 的 线程 才 叫 线程 ， 线 程 是 后 来 提出 的 概念 名 词 ， 其 实质 上 就 是 一 段 引 导 处 理 器 执行 的 、 具 有 
能 动 性 的 代码 ， 而 它 早 就 存在 很 和 了， 只 不 过 之 前 程序 (我 们 现在 称 之 为 进程 ) 中 只 有 一 段 执行 流 而 已 ， 当 现 
在 的 程序 中 存在 多 个 执行 流 时 ， 我 们 用 这 个 新 名 词 “ 线 程 ” 来 称呼 它们 。 

为 什么 要 有 线程 这 一 称呼 ? 

我 想 大 家 肯定 都 知道 答案 ， 为 了 给 程序 提速 ， 确 切 地 说 是 给 进程 提速 ， 因 为 线程 必然 属于 某 一 进程 ， 
线程 要 运行 必须 要 有 相应 的 资源 ， 而 进程 就 是 这 个 资源 的 提供 者 ， 因 此 线程 存在 于 进程 之 中 (这 个 概念 我 
在 后 面 也 会 反复 阐述 )。 
利用 线程 提速 ， 原 理 就 是 实现 多 个 执行 流 的 伪 并 行 ， 如 图 9-2 右 图 所 示 。 任 务 其 实 就 是 执行 流 ， 要 么 
是 大 的 执行 流 一 一 单线 程 的 进程 ， 要 么 是 小 的 执行 流 一 一 线程 。 
进程 采用 多 个 执行 流 和 其 他 进程 抢 处 理 器 资源 ， 这 样 就 节省 了 单个 进程 的 总 执行 时 间 。 
提速 的 原理 很 简单 ， 就 是 想 办 法 让 处 理 器 多 执行 自己 进程 中 的 代码 ， 这 样 进程 执行 完成 得 就 快 。 就 像 
虽然 图 9-2 右 图 中 有 4 个 任务 ， 看 似 其 他 任务 都 是 在 和 自己 竞争 处 理 器 资源 ， 这 影响 了 任何 任务 的 执行 速 
度 。 但 如 果 其 他 任务 或 者 大 部 分 任务 都 是 帮 任 务 A 做 事 ， 任 务 A 不 就 很 快 执行 完成 了 吗 ? 这 就 是 线程 提 
速 的 原理 之 一 。 假 如 线程 是 在 内 核 中 实现 ， 此 时 系统 中 一 共有 2 个 任务 ， 进 程 A 和 进程 B， 进 程 A 为 了 
提速 ， 创 建 了 3 个 线程 ， 任 务 调度 器 中 便 有 了 4 个 执行 流 〈 不 包括 主线 程 )， 其 中 有 3 个 都 属于 进程 A， 
也 就 是 说 这 调度 器 把 所 有 任务 调度 一 圈 后 ， 进 程 A 相当 于 被 处 理 器 执行 了 三 次 ， 而 进程 B 只 在 处 理 器 上 
运行 了 一 次 ， 进 程 A 当然 执行 得 快 了 。 

线程 男 一 个 提速 的 原理 是 避免 了 阻塞 整个 进程 ,当然 这 指 的 是 内 核 级 线程 的 实现 , 一 会 儿 咱们 再 细 说 。 

比如 当 进 程 因 等 竺 用 户 输入 而 暂时 无 法 继续 运行 时 ， 此 时 操作 系统 会 把 整个 进程 挂 起 ， 也 就 是 将 其 从 
就 绪 队 列 中 去 除 ， 这样 便 无 法 获得 执行 的 机 会 ， 等 用 户 输入 完成 ， 可 以 继续 执行 后 ， 操 作 系 统 再 将 其 加 入 
到 就 绪 队 列 ， 这 样 调度 器 才 会 重新 调度 它 上 处 理 器 运行 。 然 而 ,并 不 是 进程 中 所 有 的 部 分 都 依赖 于 用 户 的 
输入 ， 对 于 那些 不 依赖 于 用 户 输入 的 代码 块 ， 可 以 为 其 单独 创建 一 线程 来 “并 行 ” 执 行 ， 这 样 进程 的 某 个 
执行 流 阻塞 于 用 户 输入 时 ， 此 进程 的 另 一 线程 还 能 运行 ， 还 能 继续 做 其 他 事 ， 相 当 于 给 进程 提速 了 ， 沁 不 
美 哉 。 因 此 ， 通 常 程 序 员 写 程 序 时 会 把 整个 任务 划分 成 几 个 独立 的 部 分 ， 每 一 部 分 就 用 线程 来 完成 ， 各 部 
分 是 独立 无 依赖 的 ， 因 此 这 几 个 线程 就 可 以 “并 行 ” 运 行 。 

进程 和 线程 同样 都 是 执行 流 ， 那 它们 为 什么 叫 不 同 的 名 字 ? 之 间 有 什么 区 别 吗 ? 

其 实 前 面 或 多 或 少 已 经 提 到 过 一 些 了 ， 最 初 进程 中 只 有 一 条 执行 流 , 大 家 的 想法 是 程序 就 应 该 沿 着 这 
条 路 执行 下 去 ， 谁 也 不 会 给 “理所当然 ”的 事情 起 个 名 字 ， 只 是 后 来 为 了 让 程序 提速 ， 进 程 中 的 执行 流 变 
成 两 条 以 上 了 ， 为 了 强调 进程 中 包含 不 同 的 程序 流 (执行 流 )， 这 才 出 现 了 线程 的 概念 。 其 实在 处 理 器 上 
运行 的 执行 流 都 是 “人 为 划分 的 “逻辑 上 独立 的 ”程序 段 ， 本 质 上 都 是 一 段 代码 区 域 ， 只 不 过 线程 是 纯 
粹 的 执行 部 分 , 它 运 行 所 需要 的 资源 存储 在 进程 这 个 大 房子 中 , 进程 中 包含 此 进程 中 所 有 线程 使 用 的 资源 ， 
因此 线程 依赖 于 进程 ， 存 在 于 进程 之 中 ， 用 表达 式 来 表示 : 进程 = 线程 + 资源 。 
举 个 例子 ， 比 如 在 饭店 里 ， 只 要 有 人 点 菜 ， 厨房 就 要 开始 忙活 。 厨 房 就 相当 于 进程 ， 里 面 有 食材 和 豪 饪 的 
锅 具 等 ， 这 些 都 是 资源 ， 在 厨房 中 工作 的 人 有 厨师 、 配 菜 员 、 和 餐具 清洁 员 等 ， 他 们 都 是 进程 中 的 线程 。 比 如 客 
人 点 了 一 盘 鱼 香 肉 丝 ， 厨 房 中 各 类 角色 就 要 开始 并 行 工作 ， 配 全 员 开始 准备 食材 ， 厨 师 负责 亮 饪 ， 配 菜 员 和 后 
师 这 两 个 线程 是 各 干 各 的 ， 但 他 们 只 能 在 厨房 里 工作 ， 他 们 出 了 厨房 后 ， 什 么 都 干 不 了 ， 毕 竟 他 们 工作 时 所 用 的 
资源 ， 即 食材 、 锅 有 具 等 都 在 厨房 里 ， 但 他 们 每 个 人 确实 都 可 以 分 开工 作 ， 都 是 单独 的 执行 流 ， 最 终 做 出 鱼 香 肉 丝 
的 是 这 些 具 有 能 动 性 的 人 ， 而 不 是 锅 具 食 材 等 静态 资源 。 不 知道 这 样 解释 ， 您 是 否 理解 了 进程 和 线程 的 关系 。 
通过 上 面 这 个 例子 , 进程 和 线程 的 关系 我 想 您 也 看 出 来 了 : 进程 拥有 整个 地 址 空间 , 其 中 包括 各 种 资源 ， 
而 进程 中 的 所 有 线程 共享 同一 个 地 址 空间 ， 原 因 很 简单 ， 因 为 这 个 地 址 空间 中 有 线程 运行 所 需要 的 资源 。 

由 于 各 个 进程 都 拥有 自己 的 虚拟 地 址 空间 , 正常 情况 下 它们 彼此 无 法 访问 到 对 方 的 内 部 , 因为 进程 之 间 
的 安全 性 是 由 操作 系统 的 分 页 机 制 来 保证 的 ， 只 要 操作 系统 不 要 把 相同 的 物理 页 分 配给 多 个 进程 就 行 了 。 

但 进程 内 的 线程 可 都 是 共享 这 同一 地 址 空间 的 ， 它 们 彼此 能 “见面 ” 这 就 暴露 出 一 个 问题 ， 既 然 进 
程 内 的 所 有 线程 共享 同一 个 地 址 空间 ， 也 就 意味 着 任意 一 个 线程 都 可 以 去 访问 同一 进程 内 其 他 线程 的 数 
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， 如 果 进 程 中 显 式 创建 了 多 个 线程 的 话 ，] 
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中 大量 忆 
WU 








片 和 多 个 CSS 样式 并 发 请 求 ， 这 检 








进程 而 









































解 进 





浏览 器 才 不 会 显得 “很 























其 实 它 
为 了 表 


oh 


| 








做 























而 思 虽 


已 
已 


编辑 工作 


只 外 
字 
Word 能 
放 视 频 文 们 





境 是 什么 ? 是 他 们 所 在 的 各 个 厨 
因此 厨房 中 的 工作 人 员 才 
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我 还 是 拿 厨 房 举例 了 
和 餐 ， 厨 房 C 专门 做 泰国 菜 ， 这 三 个 厨房 相当 
具有 执行 力 的 线程 ， 工 作 人 员 才 是 
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己 的 工作 ， 而 ] 
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它 访问 网 页 的 时 候 ， 必 然 是 同时 加 载 网 页 中 的 诸多 资源 ， 











已 ， 它 能 同时 做 这 么 多 事 ， 必 然 是 内 部 多 个 线程 同时 “发 力 ”的 结果 。 


说 了 这 么 多 ， 举 了 这 么 多 例子 ， 怎 样 理解 进程 与 线程 的 区 别 与 关系 呢 ? 


器 来 说 ， 浏 览 器 仅仅 
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(2) 多 线程 进程 


程 : 如 果 厨 房 ! 
那么 厨房 的 工作 效率 必然 会 很 低 ， 




















只 有 一 个 工作 人 员 ， 
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内 线程 的 数量 ， 进 程 可 分 为 。 
即 配 菜 、 炒 菜 、 洗 测 厨 具 等 这 几 样 了 
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FH 对 线程 而 言 的 ， 线 程 才 是 解决 问题 的 思路 、 步 又 ， 它 是 
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E 何 时 候 进 程 中 都 至 








止 空间 ,在 这 个 空间 中 净 有 线程 运行 所 需 的 资源 ， 所 以 地 址 空间 相当 于 资源 容器 ， 

































































就 像 鱼缸 为 鱼 提供 了 水 。 因 此 ， 进 程 与 线程 的 关系 是 进程 是 资源 容器 ， 线 程 是 资源 使 用 者 。 进 程 与 线程 的 
区 别 是 线程 没有 自己 独 享 的 资源 ,因此 没有 自己 的 地 址 空间 , 它 要 依附 在 进程 的 地 址 空间 中 从 而 借助 进程 
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村 
的 资源 运行 。 说 白 了 就 是 线程 没有 自己 的 页 表 ， 而 进程 有 。 

男 外 ， 由 于 我 们 对 进程 这 个 词 太 熟 悉 了 ， 为 方便 陈述 ， 以 后 再 提 到 进程 的 时 候 ， 大 家 知道 我 是 指 单线 程 
进程 就 好 ， 所 以 今后 的 内 容 介 绍 咱们 还 是 以 名 词 “ 进 程 ”为 主 ， 本 节 到 此 结束 。 


9.1.4 进程、 线程 的 状态 


程序 在 运行 时 ， 有 可 能 因为 某 种 情况 而 无 法 继续 运行 ， 比 如 茶 进 程 的 功能 是 分 析 日 志 ， 它 先 要 读 取 磁 
盘 ， 把 日 志 从 文件 系统 中 读 入 内 存 ， 之 后 再 从 内 存 中 分 析 日 志 。 访 问 文件 系统 需要 经 过 外 部 设备 的 操作 ， 
比如 硬盘 ， 这 通常 比较 耗 时 ， 因 此 在 等 待 IO 操作 的 时 间 内 ， 分 析 日 志 的 工作 是 无 法 进行 的 ， 该 进程 无 法 
做 任何 事 ， 只 能 等 待 。 当 日 志文 件 从 磁盘 调 入 到 内 存 后 ， 进 程 便 准 备 做 日 志 分 析 的 工作 了 ， 之 后 开始 运行 
日 志 分 析 的 代码 ， 处 理 日 志 ， 直 到 完成 。 

您 看 ， 程 序 从 执行 到 结束 的 整个 过 程 中 ， 并 不 是 所 有 阶段 都 一 直 开 足 马力 在 处 理 器 上 运行 ， 有 的 时 候 
也 会 由 于 依赖 第 三 方 等 “种 种 无 条 ”的 外 在 条 件 而 不 得 不 停 下 来 ， 当 这 种 情况 出 现时 ， 操 作 系统 就 可 以 把 
处 理 器 分 配给 其 他 线程 使 用 ， 这 样 就 可 以 充分 利用 处 理 器 的 宝贵 资源 了 。 

为 此 ， 操 作 系统 把 进程 “执行 过 程 ”中 所 经 历 的 不 同 阶段 按 状态 归 为 几 类 ， 注 意 ， 强 调 的 是 “执行 过 
程 ”， 意 为 进程 的 状态 描述 的 是 进程 中 有 关 “ 动 作 ” 的 执行 流 部 分 ， 即 线程 ， 而 不 包括 静止 的 资源 部 分 。 
把 上 述 需 要 等 竺 外界 条 件 的 状态 称 为 “阻塞 态 ”， 把 外 界 条 件 成 立时 ， 进 程 可 以 随时 准备 运行 的 状态 称 为 
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“就 绪 态 ” 把 正在 处 理 器 上 运行 的 进程 的 状态 称 为 “运行 态 ” 让 
只 要 “条 件 ” 成立， 进程 的 状态 就 可 以 改变 ,通常 这 种 状态 的 转变 是 由 操作 系统 的 












































调度 器 及 相关 代码 负责 的 ， 因 为 只 有 它们 才 知 道 “条件 ” 是 否 满足 了 ， 如 图 9-5 所 示 。 C3 
进程 的 状态 表示 进程 从 出 生 到 死亡 的 一 系列 所 处 的 阶段 ， 操 作 系 统 的 调度 器 
可 以 利用 它 更 加 高 效 地 管理 进程 调度 。 
以 上 虽然 是 以 进程 举例 ， 但 实际 上 已 经 和 大 伙 儿 强调 过 多 次 了 (希望 大 家 不 
要 嫌 我 顶 ， 有 些 陌生 的 内 容 需 要 量变 才能 到 质变 )， 调 度 器 的 调度 单位 是 执行 流 ， ^ 图 9-5 进程 的 状态 变化 
“状态 ”描述 的 也 是 执行 流 ， 而 “状态 ”又 主要 是 给 调度 器 用 的 ， 因 此 “状态 ”是 对 所 有 执行 流 而 言 的 概 
念 ， 这 里 所 说 的 进程 状态 其 实 就 是 指 单线 程 进程 中 线程 的 状态 ， 归 根 结 底 ， 状 态 是 描述 线程 的 。 

总 之 ， 进 程 或 线程 等 各 种 执行 流 都 是 人 为 创造 的 代码 块 ， 因 此 执行 流 的 各 种 状态 也 是 人 为 划分 的 ， 这 
些 都 是 操作 系统 自我 管理 、 自 圆 其 说 的 一 套 体系 ， 进 程 有 哪些 状态 ， 取 决 于 操作 系统 对 进程 的 管理 方法 ， 
这 没有 定律 ， 咱 们 也 可 以 创造 一 套 自 己 的 进程 状态 。 

9.1.5 ”进程 的 身份 证 一 一 PCB 

大 伙 儿 已 经 知道 现代 操作 系统 都 是 多 任务 操作 系统 , 每 个 任务 要 被 调度 到 处 理 器 上 分 时 运行 , 运行 
时 间 后 再 被 换 下 来 ， 由 调度 系统 根据 调度 算法 再 选 下 一 个 线程 上 处 理 器 , 是 这 回 事 吧 ? 于 是 问题 接连 不 
地 来 了 。 

(1) 要 加 载 一 个 任务 上 处 理 嚣 运行， 任务 由 哪 来 ?也 就 是 说 ， 调 度 器 从 哪里 才能 找到 该 任务 ? 

(2) 即使 找到 了 任务 ， 任 务 要 在 系统 中 运行 ， 其 所 需要 的 资源 从 哪里 获得 ? 

(3) 即使 任务 已 经 变 成 进程 运行 了 ， 此 进程 应 该 运行 多 久 呢 ?总 不 能 让 其 独占 处 理 器 吧 。 

(4) 即使 知道 何 时 将 其 换 下 处 理 器 ， 那 当前 进程 所 使 用 的 这 一 套 资源 《寄存 器 内 容 ) 应 该 存在 哪里 

(5) 进程 被 换 下 的 原因 是 什么 ? 下 次 调度 器 还 能 把 它 换 上 处 理 器 运行 吗 ? 

(6) 前 面 都 说 过 了 ， 进 程 独 享 地 址 空间 ， 它 的 地 址 空间 在 哪里 ? 
以 上 只 是 一 些 调 度 相 关 的 问题 ， 其 实 还 有 其 他 问题 呢 ， 和 暂且 列举 到 这 。 

为 解决 以 上 问题 ， 操 作 系统 为 每 个 进程 提供 了 一 个 PCB ，Process _ Control Block， 即 程序 控制 块 ， 它 就 是 进 
程 的 号 份 证 , 用 它 来 记录 与 此 进程 相关 的 信息 ， 比 如 进程 状态 、PID、 优 先 级 等 。 一 般 PCB 的 结构 如 图 9-6 所 示 。 
每 个 进程 都 有 自己 的 PCB， 所 有 PCB 放 到 一 张 表 格 中 维护 ， 这 就 是 进程 表 ， 调 度 器 可 以 根据 这 张 表 
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第 9 章 线程 
选择 上 处 理 器 运行 的 进程 ， 如 图 9-7 所 示 。PCB 就 成 了 进程 表 中 的 “项 ” 因此 ，PCB 又 可 称 为 进程 表 项 
PCB | PCB2 PCB N 
寄存 器 映像 寄存 器 映像 寄存 器 映像 寄存 器 映像 
栈 栈 栈 栈 
栈 指针 栈 指针 栈 指针 栈 指针 
pid pid pid pid 
进程 状态 进程 状态 进程 状态 进程 状态 
优先 级 优先 级 优先 级 优先 级 
时 间 片 时 间 片 时 间 片 时 间 片 
页 表 页 表 页 表 页 表 
打开 的 文件 描述 符 打开 的 文件 描述 符 | 一 > | 打开 的 文件 描述 符 | 一 一 一 一 > | 打开 的 文件 描述 符 
父 进程 父 进程 父 进程 父 进程 
^ 图 9-6 PCB 结构 4 图 9-7 ”进程 对 
PCB 没有 具体 的 格式 ， 其 实际 格式 取决 于 操作 系统 的 功能 复杂 度 ， 以 上 只 是 列 出 了 基本 该 有 的 内 容 。 
您 看 ，PCB 中 包含 “进程 状态 ”， 它 解决 了 上 面 第 5 个 问题 ， 比 如 进程 状态 为 阻塞 态 ， 下 次 就 不 能 把 
它 调度 到 处 理 器 上 了 。“ 时 间 片 ”解决 上 面 第 3 个 问题 ， 当 时 间 片 的 值 为 0 时 ， 表 示 该 进程 此 次 的 运行 时 
间 到 期 了 ， 该 下 CPU 啦 。“ 页 表 ” 解 决 了 上 面 第 6 个 问题 ， 它 代表 进程 的 地 址 空间 。 还 有 一 些 问 题 没 有 解 























决 ， 不 人 急 ， 俊 








们 慢 慢 来 。 











PCB 可 大 可 小 , 尺寸 不 定 , 不 知 
“寄存 器 映像 ”是 用 来 解决 
寄存 器 的 值 都 将 保存 到 此 处 。 


总 之 它 会 
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况 下 它 位 于 PCB 上 











Pp 就 行 了 。 








解决 了 
调度 器 直接 在 进程 表 
后 ， 新 进程 就 开始 运行 



































了 。 








SH 





顶端， 不 过 位 











道 大 伙 儿 注意 到 没有 , 在 PCB 的 最 上 面 是 寄存 器 映像 , 它 是 喻 意思 呢 ? 
第 4 个 问题 的 ， 即 保存 进程 的 “现场 ” 进程 在 处 理 器 上 运行 时 ， 所 有 
也 不 固定 ， 具 体位 置 取 决 于 0 级 



































总 明 的 您 一 定 想 到 了 : 进程 


在 PCB 中 上 下 滑动 。 其 实 第 4 个 问题 解决 了 ， 第 2 个 问题 也 就 
从 PCB 中 把 寄存 器 映像 加 载 到 寄存 器 
前 只 剩 下 第 1 个 问题 没有 
[ 载 到 此 表 
存 器 映像 加 载 到 处 到 
在 PCB 中 ， 还 有 个 “ 栈 ” 没 有 说 ， 不 过 


其 实 , 要 解决 此 问题 ,， 就 是 要 单独 乡 
P 找 相应 进程 的 PCB， 从 而 获取 到 对 应 进程 的 


使 























寺 





司 搞定 3 





个 进程 表 , 将 所 有 的 PCB 


言 息 ， 将 其 寄 


起 



































的 栈 也 属于 PCB 的 一 部 分 ， 





不 过 此 栈 是 进程 所 使 用 的 0 特权 级 下 内 核 栈 〈 并 不 是 3 特权 级 下 的 用 户 栈 )。 栈 在 PCB 中， 这 听 上 去 有 点 





田 


不 可 上 





上 想 一 下 还 是 觉得 合理 





议 ， 但 纪 


[wy 


您 看 ， 既 然 内 核 栈 都 要 放 在 PCB 中 ， 那 么 ，PCB 一 般 都 很 大 ， 
顺便 说 一 句 ， 上 面 所 说 的 “寄存 器 映像 ”的 位 置 并 不 固定 ， 原 因 就 是 “寄存 器 映像 ” 存 
动 在 TSS 中 获取 内 核 栈 指 针 ， 这 通常 是 PCB 
程 
FP 的 ， 而 是 在 内 核 态 下 工作 时 ， 
器 ， 这 时 候 就 得 保存 线程 的 现场 ， 此 时 “寄存 器 映像 ” 








PCB 只 占 一 页 。 
储 到 内 核 栈 中 ， 通 常情 
的 顶端 ， 因 此 通常 情况 
存 器 映像 ”， 并 不 是 在 
栈 中 保存 “寄存 器 映像 ” 比如 线程 
一 下 ， 内 核 态 未 必 都 是 关中 断 的 状态 ， 可 以 在 开 * 
调度 器 ， 也 就 无 法 进行 任务 调度 了 ， 本 章 介 绍 相 关内 容 时 大 伙 儿 
PF 还 要 维护 一 个 “ 栈 指针 ”成 员 ， 它 记 





必然 就 不 在 PCB 顶端 7 。 提 醒 
则 就 不 会 接收 时 钟 中 断 ， 进 而 就 不 会 j 
就 会 体会 到 。 鉴 于 “寄存 器 映像 ”的 位 置 并 不 固定 ， 我 们 在 PCB 上 
录 0 级 栈 栈 顶 的 位 置 ， 借 此 找到 进 





















































的 。 和 进程 相关 的 所 有 资源 都 应 该 集中 放 在 一 起 ， 这 样 才 方 便 
































管理 。 

















况 下 进程 或 线程 被 中 断 时 ， 处 理 














器 白 












































下 “寄存 器 映像 ”位 于 PCB 的 ] 





FP 断 发 生 时 保存 到 栈 
动 让 出 处 至 











日 

















周 ) 
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通常 以 页 为 单位 ， 咱 们 系统 比较 小 ， 




















页 端 。 但 有 时 候 进 








或 线程 的 “寄存 器 映像 ”。 








或 线程 的 上 下 文 ， 也 就 是 “ 寄 








栈 指 针 已 经 发 生 了 变化 时 才 向 








P 断 下 执行 内 核 代 码 ， 否 





好 啦 ，PCB 的 引入 就 是 为 了 解决 以 上 几 个 核心 问题 ， 因 此 PCB 乃 是 进程 的 核心 ， 更 多 内 容 还 是 留待 


实践 中 体会 吧 。 


9.1.6 ”实现 线程 的 两 种 方式 
起 初 ， 操 作 系 统 中 只 有 进程 的 概念 ， 人 们 那 时 候 对 并 发 没有 太 高 的 要 求 。 后 来 有 些 人 想 提高 程序 的 并 


发 ,这 才 有 了 线程 这 一 新 生 事物 。 任 何 新 生 事物 在 诞生 之 初 都 会 被 小 心 谨 


406 





内 核 或 用 户 进 程 























这 
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地 对 待 ， 人 们 提出 线程 的 需求 











时 ， 操 作 系 统 也 抱 着 “围观 ”的 心态 不 敢 轻 举 妄 动 ， 只 能 坐 看 其 发 展 ， oo 
一 级 来 实现 。 想 想 也 是 ， 如 果 稍 微 有 个 新 需求 就 往 内 核 里 面 塞 ， 内 核 开 发 成 本 很 高 不 说 ， 至 少 内 核 中 肯 
有 很 多 “不 切实 际 ”的 功能 ， 所 以 人 们 还 是 能 够 体谅 操作 系统 研发 厂商 的 。 

为 此 ， 既 然 不 能 说 服 操 作 系 统 支 持 线程 ， 人 们 只 好 在 用 户 进程 内 想 办 法 。 所 以 ， 线 程 的 实现 就 有 两 种 
方式 ， 要 么 由 操作 系统 原生 支持 ， 用 户 进 程 通过 系统 调用 使 用 线程 ， 要 么 操作 系统 不 支持 线程 ， 由 进程 自 
己 想 办 法 解决 。 因 此 ， 线 程 要 么 在 0 特权 级 的 内 核 空 间 中 实现 ， 要 么 在 3 特权 级 的 用 户 空间 实现 。 

强调 一 下 ， 这 里 所 说 的 “在 0 特权 级 的 内 核 空 间 中 实现 线程 ” 只 是 说 线程 机 制 由 内 核 来 提供 ， 并 不 是 
说 线程 中 所 运行 的 代码 也 必须 是 0 特权 级 的 内 核 级 代码 , 也 可 以 是 3 特权 级 的 用 户 级 代码 , 内核 毕 竟 是 为 用 
户 进程 提供 服务 的 。 而 “在 3 特权 级 的 用 户 空间 实现 线程 ” 是 指 线程 机 制 由 用 户 进 程 自 己 提 供 ， 相 当 于 用 
户 进程 除了 负责 业务 外 ， 还 要 在 进程 中 实现 线程 调度 器 ， 这 样 一 来 程序 员 负 担 比较 重 ， 所 以 通常 情况 下 很 少 
有 程序 员 愿 意 在 进程 中 写 线程 机 制 ， 故 标准 库 便 提供 了 用 户 级 线程 库 ， 程 序 员 直接 使 用 标准 线程 库 就 行 了 。 

用 户 特权 级 是 3， 因 此 线程 中 只 能 运行 自己 进程 内 的 代码 , 即 只 能 同 级 调用 , 不 能 调用 0 特权 的 内 核 代 码 。 

总 之 ,无论 线程 机 制 是 由 内 核 ， 还 是 用 户 进程 提供 ， 都 是 为 用 户 进程 服务 的 ， 线 程 中 必须 可 以 运行 用 
户 的 代码 。 

下 面 看 看 由 这 两 类 提供 方 实现 的 线程 各 自 的 优 缺 点 。 

线程 仅仅 是 个 执行 流 ， 在 用 户 空间 ， 还 是 在 内 核 空间 实现 它 ， 最 大 的 区 别 就 是 线程 表 在 哪里 ， 由 谁 
调度 它 上 处 理 器 。 如 果 线 程 在 用 户 空间 中 实现 ， 线 程 表 就 在 用 户 进程 中 ,用 户 进程 就 要 专门 写 个 线程 用 从 
线程 调度 器 ， 由 它 来 调度 进程 内 部 的 其 他 线程 。 如 果 线 程 在 内 核 空间 中 实现 ， 线 程 表 就 在 内 核 中 ， 该 线程 训 
会 由 操作 系统 的 调度 器 统一 调度 ， 无 论 该 线程 属于 内 核 ， 还 是 用 户 进程 。 

下 面 分 别 讨 论 下 这 两 种 情况 下 的 实现 方式 。 

1. 在 用 户 空间 中 实现 线程 
注意 ， 咱 们 这 里 讨论 的 是 线程 只 由 用 户 进程 来 实现 ， 操 作 系统 中 无 线程 机 制 。 

在 用 户 空间 中 实现 线程 的 好 处 是 可 移植 性 强 ， 由 于 是 用 户 级 的 实现 , 所 以 在 不 支持 线程 的 操作 系统 上 
也 可 以 写 出 完美 支持 线程 的 用 户 程序 。 

原理 很 简单 ， 在 用 户 空 间 中 实现 线程 ， 操 作 系统 根本 就 不 会 意识 到 线程 的 存在 ， 因 为 操作 系统 调度 器 只 
会 以 整个 进程 的 方式 调度 , 将 处 理 器 的 使 用 权 交 给 这 个 进程 , 由 进程 中 的 调度 器 自己 去 协调 分 配 处 理 器 时 间 。 

无 论 线程 在 哪里 实现 ， 目 的 都 是 要 到 处 理 器 上 运行 ， 因 此 必然 要 考虑 到 线程 调度 的 问题 ， 这 涉及 到 调 
度 器 及 线程 表 。 
如 果 在 用 户 空间 中 实现 线程 , 用户 线程 就 要 肩负 起 调度 器 的 责任 ,因此 除了 要 实现 进程 内 的 线程 调度 
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器 外 ， 还 要 自己 在 进程 内 维护 线程 表 ， 如 图 9.8 中 左 图 所 示 。 
用 户 级 线程 管理 内 核 级 线程 管理 
| | 

内 核 | miiE 。 上 多 上 村 日 


























进程 表 线程 表 线程 (执行 流 ) 

















4 图 9-8 线程 的 两 种 实现 方式 
用 户 进程 中 ， 很 少 有 人 杀 自 写 线程 调度 器 ， 因 此 ， 一 般 是 茶 个 权威 机 构 发 布 个 用 户 级 线程 包 ， 也 就 是 线程 


407 



































































































































































































































结束 线程 等 。 线 程 包 中 一 定 存在 着 线程 调度 器 ， 而 














时 实现 应 用 情况 为 茶 些 线程 加 权 调 度 。 
















































































陷入 到 内 核 态 ， 这 样 就 免 去 了 


第 9 章 线程 
库 ， 开 发 人 员 在 用 户 进程 中 调用 此 包 中 的 方法 去 创建 线程 、 
且 , 线程 包 中 的 方法 都 会 与 此 线程 调度 器 有 调用 关系 ， 这样 当 有 新 线程 产生 或 有 线程 退出 时 , 线程 调度 器 才 会 
被 调用 ， 从 而 在 内 部 维护 的 线程 表 中 找 出 下 一 个 线程 上 处 理 器 运行 。 
在 用 户 进程 中 实现 线程 有 以 下 优点 。 
。 线程 的 调度 算法 是 由 用 户 程序 自己 实现 的 ， 可 以 根 和 
。 将 线程 的 寄存 器 映像 装载 到 CPU 时 ， 可 以 在 用 户 空间 完成 ， 即 不 
进入 内 核 时 的 入 栈 及 出 栈 操作 。 
当然 ， 任 何事 物 都 有 两 方面 ， 用 户 级 线程 也 会 有 以 下 缺点 。 
。 进程 中 的 某 个 线程 若 出 现 了 阻塞 (通常 是 由 于 系统 调 
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可 ， 

























































































] 造 成 的 ), 操作 系统 不 知道 进程 中 存在 线程 ， 






























































它 以 为 此 进程 是 传统 型 进程 〈 单 线程 进程 ) 因此 会 将 整个 进程 挂 起 ， 即 进程 中 的 全 部 线程 都 无 法 运行 ， 
这 下 因 小 失 大 了 。 
除非 咱们 在 用 户 空 间 中 写 个 包 囊 函数 将 系统 调用 封装 起 来 , 在 包 衷 函数 里 面 判 断 该 系统 调用 是 否 会 造 
成 阻塞 〈 事 先知 道 哪些 系统 调用 会 引起 阻塞 )， 如 果 现 在 不 阻塞 ， 则 允许 马上 调用 ， 和 否则 ， 待 该 系统 调用 


不 阻塞 时 再 调用 
也 许 有 读者 会 说 :“ 你 之 前 说 过 ， 阻 于 
的 ? 听 上 去 是 可 以 的 , 但 这 有 点 
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， 即 推迟 调用 。 





图 
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是 操作 系统 管理 

















的 系统 调用 改 为 非 阻塞 式 











吗 ， 


中 的 


进程 
是 说 ， 要 想 让 操作 系统 调度 ， 操 作 系统 





也 序 

















如 果 把 操作 系统 改 了 ， 移 植 特 
线程 未 在 内 核 空间 中 实现 ， 因 
线程 ， 所 以 时 钟 中 断 只 能 影响 进程 
































Pl 





























此 对 于 
一 级 的 


进程 的 方法 ， 习 






































的 优势 从 何 谈 起 呢 ， 而 























BE 
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~、 能 影 
一 级 的 调度 实体 ， 它 要 么 把 处 理 
































几 进 程 ! 

















会 运行 。 也 就 是 说 ， 没 有 保险 的 机 秆 


没有 





方法 
度 器 有 机 会 选择 进程 内 的 其 


是 将 


度 器 ， 由 自 


确实 
所 以 


消耗 ， 反 而 抵 销 了 


进程 
程 ， 


个 线 


程 ， 


些 处 理 
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| 
调度 的 机 会 。 这 只 能 凭借 开发 人 





号 
风 


























“EE 二 








中 
| 入 

















4 是 
导 





操作 系统 来 说 ，j 


加 


Bp 自 介 











] 可 不 可 以 改 下 操作 系统 ， 把 引起 


自 相 了 矛盾, 在 用 户 空间 实现 线程 不 就 是 为 了 可 移植 
晶 代 价 有 点 大 不 是 




















执行 流 。 当 时 钟 ! 
器 交 给 进程 A， 要 么 交 给 进程 B， 绝 不 可 
知道 它 的 存在 才 行 ， 但 














断 发 生 后 ， 


























于 进程 自己 的 “家 务 事 ”， 操 作 系统 根本 不 知道 它 的 存在 。 这 就 导致 了 : 











rp 


运行 


线程 





使 线程 发 扬 


ss 
= 
7 





[ 梧 信 站 

















也 线 程 上 处 理 























周 度 器 的 调度 单元 是 整个 进 


于 线程 在 用 户 空 间 中 实现 ,线程 属 
妇 











程 ， 并 不 是 进程 
操作 系统 的 调度 器 只 能 感知 到 
能 交 给 进程 中 的 某 个 线程 


He 你 


























四 
是 
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I 果 在 用 户 空间 





实现 线程 ， 但 











的 某 个 线程 开始 在 处 理 器 上 执行 后 ， 只 要 该 线程 不 主动 让 出 处 理 器 ,此 进程 中 的 











让 出 处 理 器 使 用 权 ， 此 类 方法 通过 回 i 












































整个 进程 的 处 理 
己 的 

最 后 ， 线 程 在 用 

相当 于 提速 ,但 由 于 整个 进 





器 使 






























































程 占据 处 理 器 的 时 


器 运行 。 重 复 强 
j 权 通过 操作 系统 调度 器 交 给 其 他 进程 , 而 是 将 控制 权 交 给 此 进程 
周 度 器 将 处 理 器 使 用 权 交 给 此 进程 中 的 下 一 个 线程 ， 肥 水 不 流 外 人 
户 空 间 实 现 ， 和 在 内 核 空 





间 实 现 相 


“适时 ”， 即 避免 单一 线程 过 度 使 | 
“人 为 ”地 在 线程 中 调用 类 





其 他 线程 都 没 机 
他 线程 


























处 理 器 ， 而 














以 pthread_yield 或 pthread_exit 之 类 的 























骨 方 式 触发 进程 内 的 线程 调度 器 ， 让 刘 
调 : 这 里 所 说 的 











周 
使 用 权 ”， 不 
己 的 线程 调 
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“线程 让 出 处 理 器 


有 
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每 个 线程 执行 的 时 间 
内 部 调度 带 来 
空间 中 实现 线程 











2. 在 内 核 























注 
个 人 觉得 
(1) 相 比 在 ) 
A 和 一 传统 型 进程 B， 此 时 
加 上 进程 B， 内 核 调度 器 眼 
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Cl 




















便 有 ] 

















j 片 非常 非常 短 
的 提速 。 


线程 由 内 核 来 实现 ,进程 才 真正 
] 户 空间 中 实现 线程 ， 内 核 提供 的 线程 相当 于 
进程 A 中 显 式 创 建 了 3 个 线程 ， 这 样 
5 个 独立 的 执行 流 ， 尽 管 其 








暂 ,， 再 力 





Td 





FE 意 ， 这 里 所 说 的 “实现 线程 ”是 指 由 内 核 提 供 原 4 








限 的 时 | 
矣 护 线程 表 、 运 行 1 


比 ， 只 是 在 内 部 调度 时 少 了 陷入 内 核 的 代价 ， 
则 片 是 有 限 的 , 这 有 
上 进程 内 线程 调度 器 多 





AM 


分 给 内 部 的 线程 ， 
几 度 算法 的 时 间 片 


器 


司 片 还 要 再 























线程 机 制 ， 用 户 进 














不 再 单独 实现 。 








得 























程 和 进程 一 样 被 调度 ， 因 此 i 

















1 了 较 大 








ll 


中 度 的 提速 ,这 是 最 大 的 优点 , 这 




















程 ! 











本 现在 以 下 方面 。 























让 进程 多 占 了 





处 理 器 资源 ， 比 如 系统 中 运行 有 


























来 ， 
4 个 都 


























进程 A 加 上 主线 程 便 有 了 4 个 线 
属于 进程 A， 但 对 调度 器 来 说 这 4 























周 度 器 调度 完 一 图 后 ， 进 程 A 使 用 了 80% 的 处 理 器 资源 ， 这 才 是 真正 的 提速 。 























(2 让 男 二 沪 
所 以 就 只 会 阻 
缺点 是 用 户 进 
器 时 间 ， 但 和 


























这 一 个 线程 ， 
程 需 要 通过 系统 调 ) 


































































































看 的 优点 是 当 进 程 中 的 某 


线程 阻塞 后 ， 








于 线程 是 











内核 气 


间 实 现 的 ， 操 作 系统 认识 线 

















此 线程 所 在 进程 内 的 其 
j 陷 入 内 核 , 这 多 少 增加 了 一 些 
外 的 大 幅度 提速 相 比 ， 这 不 算 什么 大 事 。 





2 国人 
冯 尼 0 


也 线程 将 不 





见 场 保 护 


响 ， 这 又 相当 于 提速 了 。 


的 栈 操作 ,这 还 是 会 消耗 一 















































们 要 自 























梳理 下 思路 ， 进 程 中 实现 线程 ， 虽 
线程 机 制 肯定 就 不 唯 
容易 ， 




















一 了 ,或 者 为 了 唯一 , i 





己 写 线程 调度 算法 ， 而 且 将 来 用 户 


进程 是 由 用 户 自 


己 写 的 ， 

















自 们 得 专门 定 个 线程 库 ， 算 啦 ， 还 



























































而 且 还 比较 快 ， 就 定 它 吧 ， 下 一 节 咱 











在 内 核 空间 实现 线程 


门 开 始 写 代码 唆 。 





= 
A 








] 内 核 级 线程 实现 起 来 较 






































本 节 咱 们 要 在 内 核 空间 实现 线程 ， 为 了 大 伙 儿 易于 学 习 ， 咱 们 还 是 循序 渐进 ， 先 从 最 简单 的 做 起 ， 在 
今后 随 着 新 功能 的 添加 ， 逐 步 完善 。 
9.2.1 简单 的 PCB 及 线程 栈 的 实现 

下 面 咱们 先 构造 PCB 及 其 相关 的 基础 部 分 , 我 把 它 定义 在 thread.h 中 啦 , 这 是 咱们 新 增 的 两 个 文件 之 
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OOOAOGONPOLOOIOUUAODP 


DODDODDDDDODDD 
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， 男 一 个 文件 当然 就 是 thread.c， 说 完了 头 文 从 
代码 9-1-1 


#ifndef THREAD THREAD H 
#define THREAD THREAD H 


#include 











/下 











定义 通 








type 


def void 











hs 


}; 


/ 太 类 业 炎 火炎 炎炎 炎炎 类 中 断 
结构 中 断 发 
进程 或 线程 被 外 部 


TASK_RUNN 
TASK_ READY, 
TASK_ BLOCKED, 
TASK WAIT 
TASK_HANG 
TASK DIED 


vstoLrnt ny 


函数 类 型 ， 它 将 在 很 多 线程 函数 
thread func (voidqr) 





程 或 线程 的 状态 */ 
enum task status 


NG, 


NG, 
NG, 











栈 intr stack 








再 介绍 它 。 那 只 
































( project/c9/a/thread/thread.h ) 





大 大 大 大 大 大 大 大 大 大 大 


P 作 为 形 参 类 型 */ 





















































时 保护 程序 ( 线程 或 i 











P 断 或 软 中 断 




















程 ) 的 上 下 文 环境 : 





可 断 时 ， 会 按照 此 结构 


EE 入 上 下 文 








寄存 器 ，intr_exit 中 的 出 栈 操作 是 此 结构 的 逆 操作 

















上 栈 在 线程 














己 的 内 核 栈 中 位 置 区 








定 ， 所 在 页 的 最 顶端 











大 炎炎 大 火炎 大 类 类 大 大 类 类 大 炎炎 类 类 类 大大 类 类 大 类 类 大 大 大 大 大 类 大 大 大 大 大 大 大 大 大 大 大 大 了 


struct intr stack { 


// 


/* 以 下 


uint32 七 vec no; 
uint32 七 edi; 
uint32 t esi; 
uint32 t ebp; 


uint32 t esp dummy; 


EE 





uint32 t 
uint32 七 
uint32: t 
uint32t 
笋 于 到 下 世态 
3 
uint32 七 
牧 二 3 


gs; 
Fs 
es; 
ds 


























cpu 从 低 特 














void (*eip) 
int320 Tt Ca 


权 级 进 
uint32 t err code; 
(void); 











uint32 t eflags; 


void* esp; 
Hint322t Sa 


入 高 特权 级 时 压 入 */ 
// err_code 会 被 压 入 在 eip 之 














// kernel.S 宏 VECTOR 中 push sl1 压 入 的 9 





虽然 pushad 把 esp 也 压 入 ， 但 esp 是 不 断 变化 的 ， 所 以 会 被 popad 忽略 
ebx; 
edx; 
ecx; 
eax; 





ol 








们 先 看 代码 9-1-1。 
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在 代码 9-1-1 的 开头 ， 用 typedef 定义 了 thread_func， 它 用 来 指定 在 线程 中 运行 的 函数 类 型 。 我 们 在 
线程 中 打算 运行 某 段 代码 函数) 时， 需要 一 个 参数 来 接收 该 函数 的 地 址 ， 因 此 这 里 先 定义 这 个 返回 值 
void 的 函数 类 型 ， 以 后 在 介绍 其 他 函数 实现 时 大 家 会 多 次 见 到 它 。 

接 下 来 用 enum task_status 结构 定义 了 线程 的 状态 ， 当 然 这 也 是 进程 的 状态 ， 进 程 与 线程 的 区 别 是 它 
们 是 否 独自 拥有 地 址 空间 ， 也 就 是 是 否 拥 有 页 表 ， 程 序 的 状态 都 是 通用 的 ， 因 此 enum task_status 结构 同 
样 也 是 进程 的 状态 。 

这 里 先 定义 了 6 个 状态 ， 从 TASK_RUNNING 到 TASK_DIED, 但 目前 只 用 到 小 部 分 ， 先 提前 定义 好 了 
吧 ， 以 后 免得 老 提 到 它 。 

接 下 来 用 struct intr_stack 定义 了 程序 的 中 断 栈 ， 无论 是 进程 ， 还 是 线程 ， 此 结构 用 于 中 断 发 生 时 保护 
程序 的 上 下 文 环境 。 也 就 是 说 ， 进 入 中 断后 ， 在 kernel.S 中 的 中 断 入 口 程序 “intr%1entry” 所 执行 的 上 下 
文保 护 的 一 系列 压 栈 操作 都 是 压 入 了 此 结构 中 。 因 此 ， 进 程 或 线程 被 外 部 中 断 或 软 中 断 打 断 时 ， 中 断 入 口 
程序 会 按照 此 结构 压 入 上 下 文 寄 存 器 ， 所 以 ，kemelS 中 intr_exit 中 的 出 栈 操作 便 是 此 结构 的 逆 操 作 。 初 
始 情况 下 此 栈 在 线程 自己 的 内 核 栈 中 位 置 固定 ， 在 PCB 所 在 页 的 最 顶端 ， 每 次 进入 中 断 时 就 不 一 定 了 ， 
如 果 进 入 中 断 时 不 涉及 到 特权 级 变化 , 它 的 位 置 就 会 在 当前 的 esp 之 下 , 否则 处 理 器 会 从 TSS 中 获得 新 的 
esp 的 值 ， 然 后 该 栈 在 新 的 esp 之 下 ， 这 是 后 话 ， 有 关 TSS 这 方面 的 内 容 以 后 会 介绍 。 

咱们 继续 看 下 半 部 分 。 

















































































































































































































































































































































































































代码 9-1-2 (project/c9/a/thread/thread.h ) 


48 /类 类 大火 火炎 火炎 火炎 大 线程 栈 thread Stack * 火 火 火 火 火 火 火 火 火 火 




























































































































































































































































































49 ”* 线程 自己 的 栈 ， 用 于 存储 线程 中 待 执行 的 函数 

50 ”* 此 结构 在 线程 自己 的 内 核 栈 中 位 置 不 固定 

51 * 仅 用 在 switch to 时 保存 线程 环境 。 

52 * 实际 位 置 取决 于 实际 运行 情况 。 

S53 六 炎炎 炎炎 炎炎 炎炎 交大 火炎 大 类 大 类 类 大 类 大 类 类 大 类 大大 类 大 类 类 大 大 大 大 大 大 大 大 大 大 大 了/ 

54 struct thread stack { 

5 uint32 t ebp; 

56 uint32 七 ebx; 

57 uint32 t edi; 

58 Ulint32 t esi 

5.9: 

60 /* 线程 第 一 次 执行 时 ，eip 指向 待 调用 的 函数 kernel thread 
61 其 他 时 候 ，eip 是 指向 switch_to 的 返回 地 址 */ 

62 void (*eip) (thread func* func void* func arg); 
63 

64 /xxxxx ”以 下 仅 供 第 一 次 被 调度 上 cpu 时 使 人 

65 

66 /* 参数 unused_ret 只 为 占 位 置 充 数 为 返回 地 址 */ 

67 void (*unused retaddr); 

68 thread func* function; /% kernel thread 所 调用 的 函数 名 
69 void* func arg; Ve kernel thread 所 调用 的 函数 所 需 的 参数 
.0.3 

Fa 


72 /* 进程 或 线程 的 pcb， 程 序 控 制 块 */ 


73 struct task struct { 
























































74 uint32 tx self kstack; // 各 内 核 线程 都 用 自己 的 内 核 栈 
3 enum task status status; 

76 uint8 t priority; // 线程 优先 级 

77 char name[16]; 

78 uint32 t stack magic; // 栈 的 边界 标记 ， 用 于 检测 栈 的 溢出 
7.9: 

80 


i 以 下 至 结束 是 函数 声明 
84 #endif 
结构 体 struct thread_stack 定义 了 线程 栈 ， 此 栈 有 2 个 作用 ， 主 要 就 是 体现 在 第 5 个 成 员 eip 上 。 
(1) 大 家 都 知道 ,线程 是 使 函数 单独 上 处 理 器 运行 的 机 制 ， 因 此 线程 肯定 得 知道 要 运行 哪个 函数 ， 首 
次 执行 茶 个 函数 时 ， 这 个 栈 就 用 来 保存 待 运行 的 函数 ， 其 中 eip 便 是 该 函数 的 地 址 。 
(2) 将 来 咱们 是 用 switch_to 函数 实现 任务 切换 ， 当 任务 切换 时 ， 此 eip 用 于 保存 任务 切换 后 的 新 任务 
的 返回 地 址 。 
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虽然 这 么 说 有 些 粗糙 ， 但 不 看 实际 代码 的 话 还 真 说 不 清楚 ， 还 是 在 后 面 慢 慢 体 会 吧 。 



































那 线程 栈 结构 中 的 前 4 个 成 员 它 们 是 干吗 的 呢 ? 








uint32 七 ebp; 
uint32 t ebx; 
uint32 t edi; 
uint32 七 esi; 

















这 涉及 到 ABI 内 容 了 ，ABI 是 Application Binary Interface， 即 应 用 程序 二 进 制 接 口 ， 也 许 部 分 同学 只 
听 说 过 API，API 是 Application ProgrammingInterface， 即 应 用 程序 可 编程 接口 ， 不 过 这 是 库 函 数 和 操作 系 
统 的 系统 调用 之 间 的 接口 。ABI 与 此 不 同 ，ABI 规定 的 是 更 加 底层 的 一 套 规 则 ， 属 于 编译 方面 的 约定 ， 比 
如 参数 如 何 传递 ， 返 回 值 如 何 存储 ， 系 统 调用 的 实现 方式 ， 目 标 文 件 格式 或 数据 类 型 等 。 只 要 操作 系统 和 
应 用 程序 都 遵守 同一 套 ABI 规则 ， 编 译 好 的 应 用 程序 可 以 无 需 修改 直接 在 另 一 套 操 作 系统 上 运行 。 





























































































































好 啦 ， 有 关 ABI 的 介绍 就 到 这 ， 











样 一 段 话 ， 原 文 如 下 : 


















































们 还 是 说 说 这 4 个 寄存 器 的 故事 。 在 官方 规范 SysV_ABI 386-V4 中 有 这 








All registers on the Intel386 are global and thus visible to both a calling and a called function. Registers 


%ebp, Webx, Wedi, Wesi, and %esp“belong”to the calling function. In other words, a called function must 


preserve these registers” values for its caller Remaining registers “belong”to the called function. If a calling 


function wants to preserve such a register value across a function call, it must save the value in its local stack frame. 














大 概 意思 是 : 位 于 Intel386 硬 伯 








F 体 系 上 的 所 有 寄存 器 都 具有 全 局 性 ， 因 此 在 函数 调用 时 ， 这 些 寄存 器 对 主 
调 函 数 和 被 调 函 数 都 可 见 。 这 5 个 寄存 器 ebp、ebx、edi、esi、 和 esp 归 主 调 函 数 所 用 ， 其 余 的 寄存 器 归 被 调 





















































该 被 改变 。 因 此 被 调 函数 必须 为 














值 必须 和 运行 前 一 样 ， 它 必须 在 自己 上 
以 上 就 是 我 的 大 概 理 解 ， 我 怕 自 























为 什么 要 强调 ABI 呢 ? 





函数 所 用 。 换 句 话 说， 不 管 被 调 函数 中 是 否 使 用 了 这 5 个 寄存 器 ， 在 被 调 函数 执行 完 后 ， 这 5 个 寄存 器 的 值 不 
主 调 函 数 保护 好 这 5 个 寄存 器 的 值 ， 在 被 调 函数 运行 完 之 后 ,这 5 个 寄存 器 的 
的 栈 中 存储 这 些 寄 存 器 的 值 。 















































己 理 解 有 偏差 ， 所 以 贴 出 了 英文 原版 ， 请 大 家 辩证 地 看 。 



































原因 是 C 编译 器 就 是 按照 这 套 ABI 规则 来 编译 C 程序 的 ， 倘 车 咱 们 全 是 用 C 语言 来 写 和 程序， 咱们 就 不 
需要 考虑 ABI 规则 ， 这些 都 是 编译 器 考虑 的 事 。C 语言 和 汇编 语言 是 用 不 同 的 编译 器 来 编译 的 ，C 语言 代码 
要 先 被 编译 为 汇编 代码 ， 此 汇编 代码 便 是 按照 ABI 规则 生成 的 ， 因 此 ， 如 果 要 自己 手动 写 汇编 函数 ， 并 且 
此 函数 要 供 C 语言 调用 的 话 ， 咱 们 也 得 按照 ABI 的 规则 去 写 汇编 才 行 。 说 到 这 您 肯定 明白 了 ， 咱 们 一 定 是 
























































































































































































































































用 汇编 语言 写 了 个 函数 ， 而 且 是 











j C 


对 ! 确实 如 此 ， 程 序 中 处 处 都 是 











剧 透 : 这 个 汇编 函数 就 是 switch_ 


to， 














schedule 的 寄存 器 ， 咱 们 要 在 汇 乡 











程序 来 调用 这 个 汇编 函数 。 
大 笔 ， 很 多 结构 都 是 为 了 其 他 函数 准备 的 。 为 了 不 调 大 家 胃口 ， 开 始 
它 是 由 C 语言 函数 schedule 来 调用 的 ， 因 此 为 了 不 破坏 主 调 函 数 





























有 代码 中 保存 这 5 个 寄存 器 ， 保 存 的 位 置 就 是 这 个 线程 栈 。 这 内 容 有 点 超 





























通用 寄存 器 ， 如 用 指令 pushad。 


























前 了 ， 到 以 后 介绍 switch_to 的 实现 时 您 就 清楚 了 。 当 然 ， 如 果 您 想 图 省 事 的 话 ， 也 可 以 保存 所 有 的 32 位 



































esp 的 值 会 由 调用 约定 来 保证 
































对 此 我 们 不 打算 保护 esp 的 值 。 在 我 们 的 实现 中 ， 由 被 调 函数 保存 除 








esp 外 的 4 个 寄存 器 ， 这 就 是 线程 栈 thread_stack 前 4 个 成 员 的 作用 ， 我 们 将 来 用 switch_to 函数 切换 时 ， 











先 在 线程 栈 thread_stack 中 压 入 这 4 个 寄存 器 的 值 。 











这 块 内 容光 凭 局 部 描述 还 是 无 法 彻底 说 清楚 ， 还 是 结合 代码 9-4 从 全 局 上 体会 比较 好 ， 最 好 是 跟 一 下 
代码 从 整体 上 搞 清 楚 。 咱 们 先 继续 看 下 面 的 内 容 。 















































void (*unused retaddr);} 
thread func* function; 
void* func arg; 

















第 64 行 有 一 句 注释 :“ 以 下 仅 供 第 一 次 被 调度 上 CPU 时 使 用 ”这 指 的 是 下 面 的 三 行内 容 : 























其 中 ，unused_retaddr 用 来 充当 返 











I 








口 地 址 ， 在 返 








地 址 所 在 的 栈 帧 占 个 位 置 ， 因 此 unused_retaddr 中 的 值 






























































并 不 重要 ， 仅 仅 起 到 占 位 的 作用 。 
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function 是 由 函数 kernel_thread 所 调用 的 函数 名 (Kernel thread 在 thread.c 中 有 介绍 , 咱们 一 会 儿 说 )， 
即 function 是 在 线程 中 执行 的 函数 。 

func_arg 是 由 Kernel thread 所 调用 的 函数 所 需 的 参数 ， 即 function 的 参数 ， 因 此 最 终 的 情形 是 : 在 线 
程 中 调用 的 是 function(func_arg)。 

欲 知 详情 ， 咱 们 先 回顾 下 函数 调用 时 发 生 的 情况 〈 您 已 进入 属于 ABI 的 范畴 从 )。 

函数 在 执行 前 ， 如 果 该 函数 有 参数 的 话 ， 调 用 者 一 定 会 按照 调用 约定 ， 高 地 址 
先 把 参数 压 到 栈 中 。 参数 n | +nx*4 



















































































一 







































































































































































在 C 语言 层面 ， 函 数 的 执行 都 是 由 调用 者 发 起 调用 的 ， 这 通过 call 一 
指令 完成 ， 此 指令 会 在 栈 中 留 下 返回 地 址 。 因 此 被 调用 的 函数 在 执行 时 ， 过 加 地 十 | +4 
会 认为 调用 者 已 经 把 返回 地 址 留 在 栈 中 , 而 且 是 在 栈 顶 的 位 置 。 也 就 是 说 Sr 


















































当 进 入 到 被 调用 函数 中 执行 时 ， 栈 中 的 情形 应 该 如 图 9-9 所 示 。 
为 了 解释 清楚 ， 这 里 还 是 要 剧 透 一 下 ， 将 来 我 们 这 里 的 被 调用 者 是 eip ”低地 址 
所 指向 的 kernel thread 函数 ， 当 kernel_ thread 开始 执行 时 ， 处 理 器 会 认为 当 进入 被 调 函数 后 栈 中 布局 
前 栈 顶 “应 该 是 ”调用 者 的 返回 地 址 , 因此 它 会 从 当前 栈 顶 +4 的 位 置 找 参数 。 
我 们 在 线程 中 待 执 行 的 函数 function 及 其 参数 func_arg 是 由 kernel_ 
thread 去 调用 执行 的 ， 它 们 两 个 作为 kernel_thread 的 参数 ， 形 如 这 样 的 形式 : 


kernel thread(thread func* func, void* func arg) { 
func(func arg); 


} 


进入 到 函数 kernel_thread 时 ， 栈 顶 处 是 返回 地 址 ， 因 此 栈 顶 +4 的 位 置 保存 的 是 fanction， 栈 顶 +8 保 
存 的 是 func_arg。 

x86 处 理 器 被 程序 计数 器 CS 和 EIP“ 牵 着 鼻子 走 ” 这 两 个 寄存 器 中 的 值 才 是 它 下 一 条 要 执行 的 指令 
地 址 ， 因 此 ， 执 行 流 存在 的 原因 就 是 程序 中 包含 改变 CS 或 EIP 的 值 的 指令 ， 这 些 指令 有 call、jmp、ret 
等 (注意 ， 可 不 是 mov 哦 )。 

大 伙 儿 都 已 经 知道 ，call 指令 属于 “有 去 有 回 ” 的 指令 ， 它 在 “去 ”之 前 先 在 栈 中 (进入 被 调 函 数 时 的 栈 项 
处 ) 留 下 返回 地 址 ， 它 的 “ 回 ” 则 需要 在 ret 指令 的 配合 下 才能 完成 ，ret 将 栈 顶 的 值 当 作 call 留 下 的 返回 地 址 ， 
在 保证 栈 顶 值 正确 的 情况 下 ，ret 能 把 处 理 器 重新 带 回 到 主 调 函 数 中 。 这 里 我 们 灵活 运用 了 ret 指令 ， 即 在 没有 
call 指令 的 前 提 下 ， 直 接 在 栈 顶 装 入 函数 的 返回 地 址 ， 再 利用 ret 指令 执行 该 函数 ， 当 然 这 是 在 内 联 汇编 下 做 的 。 
我 们 说 下 有 具体 的 例子 ， 在 一 会 介绍 thread.c 时 大 伙 儿 就 会 知道 ，kernel_ thread 函数 并 不 是 通过 调用 call 指 
令 的 形式 执行 的 ， 而 是 咱们 用 汇编 指令 ret “返回 ”执行 的 ， 也 就 是 函数 kernel_ thread 作为 “ 某 个 函数 ”( 此 函 
数 暂 时 为 thread_start) 的 返回 地 址 ， 通 过 ret 指令 使 函数 kernel _ thread 的 偏 移 地 址 ( 段 基 址 为 0) 被 载 入 到 处 
理 器 的 EIP 寄存 器 ， 从 而 处 理 器 开始 执行 函数 kernel_thread， 但 
以 进入 到 函数 kernel thread 中 执行 时 ， 栈 中 并 没有 返回 地 址 。 
也 许 您 对 为 什么 要 用 ret 指令 执行 kernel_thread 函数 还 是 有 些 “ 耿 耿 于 怀 ” 哈哈 ， 理解， 小 弟 在 这 解 
释 一 下 。 大 伙 儿 已 经 知道 线程 栈 struct thread_stack 有 两 个 作用 。 
第 1 个 作用 是 在 线程 首次 运行 时 , 线程 栈 用 于 存储 创建 线程 所 需 的 相关 数据 。 和 线程 有 关 的 数据 应 该 都 在 该 
线程 的 PCB 中 ， 这 样 便于 线程 管理 ， 避 免 为 它们 再 单独 维护 数据 空间 。 创 建 线 程 之 初 ， 要 指定 在 线程 中 运行 的 
函数 及 参数 ， 因 此 ， 把 它们 放 在 位 于 PCB 所 在 页 的 高 地 址 处 的 0 级 栈 中 比较 合适 ， 该 处 就 是 线程 栈 的 所 在 地 址 。 
第 2 个 作用 是 用 在 任务 切换 函数 Switch_to 中 的 , 这 是 线程 已 经 处 于 正常 运行 后 线程 栈 所 体现 的 作用 。 
为 解释 清楚 这 个 疑惑 ， 现 在 不 得 不 告诉 大 家 switch_to 函数 是 我 们 用 汇编 语言 实现 的 ， 它 是 被 内 核 调 度 器 
函数 调用 的 ， 因 此 这 里 面 涉及 到 主 调 函数 寄存 器 的 保护 ， 就 是 ebp、ebx、edi 和 esi 这 4 个 寄存 器 ， 前 本 
那 段 英 文 已 经 前 述 了 ， 它 们 属于 主 调 函 数 〈 这 里 是 指 调度 器 函数 )， 咱 们 要 在 被 调用 函数 switch_to 中 将 它 
们 保护 起 来 ， 也 就 是 将 它们 保存 在 栈 中 ， 这 必然 涉及 到 压 栈 指令 push， 用 单纯 的 汇编 语言 比 C 语言 内 蔡 
汇编 的 方式 要 方便 一 些 ， 请 大 伙 儿 见谅 。 














































































































到 9-9 栈 帧 情况 













































































































































































































































































































































































于 它 的 执行 并 不 是 通过 call 指令 实现 的 ， 所 
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您 看 ，switch_to 既然 是 汇编 程序 ， 从 其 返回 时 ， 必 然 要 用 到 ret 指令 ， 因 此 为 了 同时 满足 这 2 个 作用 ， 
或 者 说 是 为 了 让 作用 1“ 配 合 ” 作 用 2， 我 们 最 初 先 在 线程 栈 中 装 入 适合 的 返回 地 址 及 参数 ， 使 作用 2 中 
switch_to 的 ret 指令 也 满足 创建 线程 时 的 作用 1。 

好 啦 , 在 不 了 解 全 局 的 情况 下 对 此 也 就 解释 这 么 多 了 , 在 后 面 看 实现 部 分 时 您 也 许 会 一 下 子 全 明白 了 。 

函数 调用 在 C 语言 中 只 有 高 级 语言 的 调用 形式 ， 即 fanction(args)， 在 C 语言 层面 ， 函 数 的 执行 通 销 
被 编译 为 call 指令 调用 的 形式 ， 很 少 有 通过 ret 来 执行 函数 的 ， 因 此 在 某 个 函数 中 执行 时 ， 按 照 规 定 ， 栈 
顶 应 该 是 某 个 主 调 函 数 通过 call 指令 调用 该 函数 时 留 下 的 返回 地 址 ， 在 栈 顶 之 上 (高 地 址 ) 的 栈 帧 中 是 被 调 函 
数 的 参数 ， 这 才 是 按照 正常 的 套路 出 牌 。 也 就 是 说 ， 栈 中 参数 的 位 置 是 以 栈 顶 为 基准 的 ， 如 图 9-9 所 示 ， 尽 管 
我 们 不 是 用 call 指令 调用 函数 ， 但 依然 必须 按照 这 个 规则 办 事 。 

为 了 满足 C 语言 的 调用 形式 ， 使 kernel_thread 以 为 自己 是 通过 “正常 渠道 ” 也 就 是 call 指令 调用 执 
行 的 ， 当 前 栈 顶 必须 得 是 返回 地 址 ， 故 参数 unused_ret 只 为 占 位置 充 数 ， 由 它 充 当 栈 顶 ， 其 值 充 当 返 回 地 
址 ， 所 以 它 的 值 是 多 少 都 没关系 ， 因 为 咱们 将 来 不 需要 通过 此 返回 地 址 “返回 ?”， 咱 们 的 目的 是 让 
kernel_ thread 去 调用 func(func_arge)， 也 就 是 “只 管 继续 癌 前 执行 ”就 好 了 ， 此 时 不 需要 “回头 ” 总 之 我 们 只 
要 保留 这 个 栈 帧 位 置 就 够 了 ， 为 的 是 让 函数 kernel_thread 以 为 栈 顶 是 它 自己 的 返回 地 址 ， 这 样 便 有 了 一 个 正确 
的 基准 ， 并 能 够 从 栈 顶 +4 和 栈 顶 +8 的 位 置 找到 参数 func 和 func_arg。 否 则 ， 若 没有 占 位 成 员 unused_ret 的 话 ， 
处 理 器 依然 把 栈 顶 当 作 返回 地 址 作为 基准 ， 以 栈 顶 向 上 +4 和 +8 的 地 方 找 参数 func 和 func_arg， 但 由 于 没有 返 
回 地 址 ， 此 时 栈 顶 就 是 参数 func， 栈 顶 +4 就 是 func_arg， 栈 顶 +8 的 值 目 前 未 知 ， 要 看 实际 编译 情况 ， 因 此 处 
理 器 便 找 错 了 栈 帧 位 置 ， 后 果 必 然 出 错 。 

注意 ， 这 里 所 说 的 “只 管 继续 向 前 执行 ” 只 是 函数 第 一 次 在 线程 中 执行 的 情况 ， 即 前 面 所 说 的 栈 
thread_stack 的 第 1 个 作用 。 在 第 2 个 作用 中 , 会 由 调度 函数 switch_to 为 其 留 下 返回 地 址 ， 这 时 才 需 要 返回 。 
再 说 明 一 下 func_arg 的 类 型 void* ， 其 是 无 类 型 指针 ， 目 的 是 为 表示 所 有 参数 类 型 ， 在 kernel_thread 
调用 这 些 函 数 时 ， 用 void* 来 通用 表示 参数 ， 在 kernel_thread 中 被 调用 的 函数 function， 它 知道 自己 需要 什 
么 类 型 的 参数 ， 因 此 在 function 函数 体 中 可 以 自己 转换 成 想 要 的 类 型 。 

代码 9-1-2 中 的 结构 体 struct task_struct 是 定义 的 PCB ， 这 是 最 最 简单 的 PCB 结构 了 ， 现 在 先 从 小 做 
起 ， 以 后 再 丰富 它 吧 。 其 中 self_kstack 是 各 线程 的 内 核 栈 顶 指针 ， 当 线程 被 创建 时 ，self_kstack 被 初始 化 
为 自己 PCB 所 在 页 的 顶端 。 之 后 在 运行 时 ， 在 被 换 下 处 理 器 前 ， 我 们 会 把 线程 的 上 下 文 信息 《也 就 是 寄 
存 器 映像 ) 保存 在 0 特权 级 栈 中 ，self_kstack 便 用 来 记录 0 特权 级 栈 在 保存 线程 上 下 文 后 的 新 的 栈 顶 ， 在 
下 一 次 此 线程 又 被 调度 到 处 理 器 上 时 ， 可 以 把 self_kstack 的 值 加 载 到 esp 寄存 器 ， 这 样 便 从 0 特权 级 栈 中 
获取 了 线程 上 下 文 ， 从 而 可 以 加 载 到 处 理 器 中 运行 。 

status 用 于 记录 线程 状态 ， 其 类 型 便 是 前 面 定 义 的 枚 举 结构 enum task_status 。 

priority 用 于 记录 线程 优先 级 ， 进 程 或 线程 都 要 有 个 优先 级 ， 此 优先 级 咱们 用 来 决定 进程 或 线程 的 时 
间 片 ， 即 被 调度 到 处 理 器 上 的 运行 时 间 。 

name[16] 用 于 记录 任务 (线程 或 进程 ) 的 名 字 ， 长 度 是 16， 即 任务 名 最 长 不 过 16 个 字符 。 

stack_magic 是 栈 的 边界 标记 ， 用 于 检测 栈 的 溢出 。 咱 们 PCB 和 0 级 栈 是 在 同一 个 页 中 ， 栈 位 于 页 的 顶端 
并 向 下 发 展 ， 因 此 担心 压 栈 过 程 中 会 把 PCB 中 的 信息 给 覆盖 ， 所 以 每 次 在 线程 或 进程 调度 时 要 判断 是 否 触 及 
到 了 进程 信息 的 边界 ， 也 就 是 判断 stack_magic 的 值 是 否 为 初始 化 的 内 容 ，stack_masgic 实际 上 就 是 个 魔 数 。 
最 后 说 明 一 下 ， 中 断 栈 intr_stack 和 线程 栈 thread_stack 都 位 于 线程 的 内 核 栈 中 ， 也 就 是 都 位 于 PCB 
的 高 地 址 处 。 
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9.2.2 ”线程 的 实现 

上 一 节 中 咀 们 花 了 较 大 篇 幅 介 绍 了 栈 相关 的 基础 数据 结构 , 但 说 实话 只 介绍 这 些 局 部 的 话 , 很 难 让 大 
伙 儿 把 整个 原理 搞 清楚 ， 必 须 得 结合 其 他 使 用 这 些 结构 的 代码 ， 让 您 知道 它们 是 如 何 配 合 使 用 的 才 行 ， 这 
就 是 本 节 要 做 的 事 。 请 看 代码 9-2。 
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代码 9-2 (project/c9/a/thread/thread.c ) 
1 #include "thread.n" 
2 #include "stdint.h" 
3 #include "string.h" 
4 #include "global.h" 
5 #include "memory.h" 
6 
8 
9 


#define PG SIZE 4096 











/* 由 kernel thread 去 执行 function (func arg) */ 
10 static void kernel thread(thread func* function void* func arg) { 
于波 function (func arg); 
2 











14 /* 初始 化 线程 栈 thread_stack,， 

































































将 待 执行 的 函数 和 参数 放 到 thread_stack 中 相应 的 位 置 */ 
15 void thread create(struct task struct* pthread, thread func function, void* func arg) { 
16 /* 先 预 留 中 断 使 用 栈 的 空间 ， 可 见 thread.nh 中 定义 的 结构 */ 
17 pthread->self kstack -= sizeof (struct intr stack); 
18 
19 /* 再 留 出 线程 栈 空间 ， 可 见 thread.h 中 定义 */ 
20 pthread->self kstack -= sizeof (struct thread stack); 
21 struct thread stack* kthread stack = (struct thread stack*)pthread->self kstack; 
22 kthread stack->eip = kernel thread; 
23 kthread stack->function = function; 
24 kthread stack->func arg = func arg; 
25 kthread stack->ebp = kthread stack->ebx = \ 


kthread stack->esi = kthread stack->edi = 0; 





28 /* 初始 化 线程 基本 信息 */ 


29 void init thread(struct task struct* pthread, char* name int prio) { 




































































30 memset (pthread, 0, sizeof (*pthread)); 
31 strcpy (pthread->name, name); 
32 pthread->status = TASK RUNNING; 
33 pthread->priority = prio; 
34 /* self kstack 是 线程 自己 在 内 核 态 下 使 用 的 栈 顶 地 址 */ 
35 pthread->self kstack = (uint32 t*) ((uint32 t)pthread + PG SIZE); 
36 pthread->stack magic = 0x19870916; // 自 定义 的 魔 数 
已 关于 
38 
39 /* 创建 一 优先 级 为 prio 的 线程 ， 线 程 名 为 name， 
线程 所 执行 的 函数 是 function (func arg) */ 





















































40 struct task struct* thread start (char* name \ 
Ey ho o> oh oa 
thread func function, \ 
void* func arg) { 
41 /* pcb 都 位 于 内 核 空间 ， 包 括 用 户 进程 的 pcb 也 是 在 内 核 空间 */ 
42 struct task struct* thread = get kernel pages (1); 
43 
44 init thread (thread, name, prio); 
45 thread create (thread, function, func arg); 
46 
47 asm volatile ("movl $0, %%esp; \ 
pop %S%ebp; pop %%ebx; pop SS%edi; pop Ss%esi; \ 
ret": : "g" (thread->self kstack) : "memory"); 
48 return thread; 
49 } 














本 节 仅 仅 是 先 让 线程 跑 起 来 ， 因 此 代码 9-2 中 内 容 比 较 少 ， 对 目前 来 说 够 用 了 。 

咱们 先 从 最 下 面 的 函数 thread_start 说 起 ， 此 函数 接受 4 个 参数 ，name 为 线程 名 ，prio 为 线程 的 优先 
级 ， 要 执行 的 函数 是 function, func_arg 是 函数 function 的 参数 。thread_start 的 功能 是 创建 一 优先 级 为 prio 
的 线程 ， 线 程 名 为 name， 线 程 所 执行 的 函数 是 function(func_arg)。 
在 函数 体内 ， 先 通过 get_kernel_pages(1) 在 内 核 空 间 中 申请 一 页 内 存 ， 即 4096 字 节 ， 将 其 赋值 给 新 创 
建 的 PCB 指针 thread， 即 struct task_struct* thread。 注 意 ， 由 于 get_kernel_page 返回 的 是 页 的 起 始 地 址 ， 
故 thread 指向 的 是 PCB 的 最 低地 址 。 
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EM 9.2 “在 内 核 空间 实现 线程 
请 大 伙 注 意 ， 无 论 是 进程 或 线程 的 PCB， 这 都 是 给 内 核 调 度 器 使 用 的 结构 ， 属 于 内 核 管理 的 数据 ， 
因此 将 来 用 户 进 程 的 PCB 也 依然 要 从 内 核 物 理 内 存 池 中 申请 。 
接 下 来 调用 init_thread (thread, name, prio) 来 初始 化 刚刚 创建 的 thread 线程 。 此 函数 定义 在 第 29 行 ， 
它 接受 3 个 参数 ，pthread 是 待 初始 化 线程 的 指针 ，name 是 线程 名 称 ，prio 是 线程 的 优先 级 ， 此 函数 功能 


是 将 3 个 参数 写 入 线程 的 PCB， 并 
































昌 完 成 PCB 一 级 的 其 他 初始 化 。 





























在 init_ thread 
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进程 的 统称 ) 在 处 理 器 








， 先 调用 
再 通过 strcpy(pthread->name, name) 将 线程 名 写 入 PCB : 
接 下 来 为 线程 的 状态 pthread->status 赋值 
以 后 再 按照 正常 的 逻辑 为 状态 赋值 。 
接 下 来 再 将 prio 赋值 给 pthread->priority， 目 
上 执行 的 时 间 片 长 度 ， 即 优先 级 越 








pthread->self_kstack 是 线程 自己 在 0 特权 级 下 所 


最 项 





山 ， 即 (uint32_Dpthread + PG_SIZE。 
PCB 的 上 端 是 0 特权 级 栈 ， 将 来 线程 在 内 核 态 下 的 从 
些 异 常 导 致 入 栈 操作 过 多 ， 这 会 破坏 PCB 低 处 的 线程 信息 。 











memset(pthread, 0, sizeof(*pthread)) 将 pthread 所 在 的 PCB 
的 name 数组 : 
























































， 由 于 





前 









































前 的 优先 级 没什么 用 ， 将 来 它 的 作 / 
高 ， 执 行 的 时 间 片 越 长 。 












































E 何 栈 操作 都 是 用 此 PCB 中 
为 此 ， 需 要 检 








的 栈 ， 妇 


清 0, 即 清 0 一 页 。 





ee ee 


] 体 现任 务 ( 线 程 和 





] 的 栈 , 在 线程 创建 之 初 , 它 被 初始 化 为 线程 PCB 的 





中 果 出 现 了 某 





测 这 些 线程 信息 是 否 被 破坏 了 ， 











stack_magic 被 安排 在 线程 信息 
测 它 。pthread->stack_magic 
回来 继续 看 thread_start 函数 。 
thread_create 接受 3 个 参数 , pthread 是 待 创建 的 线程 的 指针 , function 是 在 线程 中 
是 function 的 参数 。 函 数 的 功 





相应 的 位 置 。 











的 最 边缘 ， 作 为 它 与 栈 的 边缘 。 目 前 用 不 到 此 值 ， 
自 定义 个 值 就 行 ， 我 这 里 用 的 是 0x19870916， 这 与 代码 
在 调用 完 init_thread 后 ， 它 又 调用 了 thread_create 























能 是 初始 化 线程 栈 thread_stack， 将 待 


























struct intr_stack 的 空 


间 ， 


























的 中 断代 码 会 通过 此 栈 来 保存 上 











下 文 。 
































(2) 将 
因此 ， 必 须要 




















在 





巴 struct intr_stack 的 空 








会 将 用 户 进程 的 初始 信息 放 在 中 断 栈 中 。 
司 留 出 来 。 
j 的 地 址 。 

















init_thread 中 已 经 被 # 

















成 员 unused_retaddr 所 在 的 栈 。 


对 比 上 一 节 中 介 





绍 的 线程 栈 struct thread_stack 的 结构 ， 我 们 看 下 这 三 





行 赋值 : 








kthread stack->eip = kernel thread; 
kthread stack->function = function; 





kthread stack->func arg = func arg; 








的 形 参 func_arg 的 值 


其 中 的 function 就 是 函数 thread_start 的 形 参 

















， 这 三 











正如 我 们 上 一 节 
步 看 看 它 的 实现 。 


kerel_ thread 接受 7 


此 kernel thread 函数 























栈 中 ， 即 处 到 





中 说 过 





页 个 参数 ，function 是 kernel_thread 中 调 
的 功能 
上 一 节 中 说 过 了 ，kernel_thread 


以 后 在 线程 调度 时 
功能 无 关 。 

创建 了 线程 。 
运行 
执行 的 函数 和 参数 放 到 thread_stack 中 


定义 了 线程 栈 指针 ,这 个 就 是 上 一 节 中 我 们 介 








会 检 











的 函数 ,func_arg 





在 thread_create 中 ，pthread->self_kstack -= sizeof (struct intr_stack) 是 为 了 预 留 线程 所 使 用 的 中 断 栈 
这 有 两 个 目的 。 
(1) 将 来 线程 进入 中 断后 ， 位 于 kernel.S : 
来 实现 用 户 进 程 时 ， 
事先 把 
pthread->self _kstack 
时 pthread->self kstack 指向 PCB 中 的 中 断 栈 下 男 
在 下 一 行 中 ，struct thread_stack* kthread_stack 定 


， 所 以 现在 要 减 去 中 断 栈 的 大 小 。 


绍 的 占 位 





function 所 指向 的 函数 ,其 中 的 func_arg 就 是 thread_start 





行 就 是 为 能 够 在 kernel_thread 中 调用 function(func_arg) 做 准 


备 。 

















过 ，eip 指向 kernel thread， 它 定义 在 代码 9-2 的 最 












































就 是 调用 





function(func_arg)。 





















































并 不 是 通过 call 指令 调用 的 ， 而 是 通过 ret 来 执行 的 (一 会 儿 我 
续 介 绍 thread_start 时 您 就 知道 ret 在 哪里 了 )， 因 此 无 法 按照 正常 的 函数 调 
要 的 参数 ， 如 这 样 调用 是 不 行 的 : kernel_ 
器 进入 kernel thread 函数 体 时 ， 栈 顶 为 返回 


用 形式 传递 kernel_thread 
thread(function, func_arg)， 只 能 将 参数 放 在 kernel_ thread 所 
地 址 ， 栈 顶 +4 为 参数 function， 栈 顶 +8 为 参数 


而 第 10 行 处 ， 大 伙 儿 先 移 


j 的 函数 ，func_arg 是 function 的 参数 ， 


门 继 


而 


的 
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func_arg， 这 就 是 上 面 三 行 中 标 有 下 画 线 的 两 行 代码 的 作用 。 

接 下 来 把 ebp，ebx，esi，edi 这 4 个 寄存 器 初始 化 为 0， 因 为 线程 中 的 函数 尚未 执行 ， 在 执行 过 程 ， 
寄存 器 才 会 有 值 ， 此 时 置 为 0 即 可 。 

另外 说 一 下 kthread_stack->unused_retaddr 是 不 需要 赋值 的 ,就 是 用 来 占 位 的 , 因此 我 们 代码 中 并 没有 
对 它 处 理 。 

thread_create 就 介绍 完了 ， 咱 们 回来 继续 看 thread_start。 

目前 只 差 最 后 的 汇编 指令 没 说 了 。 汇 编 指令 在 第 47 行 ， 这 是 我 们 为 演示 线程 运行 的 临时 方案 ， 以 后 
就 没 这 么 “简陋 ”了 。 此 汇编 代码 是 开启 线程 的 钥匙 ， 不 过 这 个 钥匙 还 是 蛮 长 的 ， 哈 哈 ， 咱 们 逐 句 分 析 。 
在 输出 部 分 ，"g”(thread->self_kstack) 使 thread->self_kstack 的 值 作为 输入 ， 采 用 通用 约束 g， 即 内 存 
或 寄存 器 都 可 以 。 
在 汇编 语句 部 分 ，movl %0，%%esp， 也 就 是 使 thread->self_kstack 的 值 作为 栈 顶 ， 此 时 
thread->self_kstack 指向 线程 栈 的 最 低 处 ， 这 是 我 们 在 函数 thread_create 中 设 定 的 。 

接 下 来 的 这 连续 4 个 弹 栈 操作 : pop %%ebp; pop W%%ebx; pop %%edi; pop W%%esi 使 之 前 初始 化 的 0 弹 
入 到 相应 寄存 器 中 。 

到 了 关键 时 刻 了 ， 我 们 马上 要 执行 ret 了 ， 我 们 知道 ，ret 会 把 栈 顶 的 数据 作为 返 
EIP 寄存 器 。 

回忆 下 此 时 栈 顶 的 数据 是 什么 ， 我 想 您 早已 经 知道 了 ， 就 是 在 thread_create 中 为 kthread_stack->eip 所 赋 的 
值 kernel _ thread。 因此 ， 在 执行 ret 后 ， 处 理 器 会 去 执行 kernel thread 函数 。 接 着 在 kernel _ thread 函数 
中 会 调用 传 给 函数 function(func_arg)。 
在 执行 完 这 名 汇编 后 ， 线 程 就 会 开始 执行 ， 好 啦 ， 代 码 9-2 介绍 完了 。 接 下 来 得 找 个 地 方 调 用 
thread_start， 这 是 我 们 创建 线程 的 入 口 。 您 猜 到 了 ， 还 是 在 主 函 数 main 中 。 请 见 代 码 9-3。 

代码 9-3 (project/c9/a/kernel/main.c ) 
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地 址 送 上 处 理 器 的 











































































































#include "Pint .hn 
#include "init .hn 
#include "thread.h" 


void k thread al(void*); 
int main(void) { 


put_str("I am kernel\n"); 
9 init all(); 


OONPRODP 


法 thread start ("k thread a", 31, k thread a, "argA "); 


13 while(1); 
14 return 0; 





17 /* 在 线程 中 运行 的 函数 */ 
18 void k thread al(voidqx arg) { 
19 /* voidqx 来 通用 表示 参数 








































































































被 调用 的 函数 知道 自己 需要 什么 类 型 的 参数 ， 自 己 转换 */ 
20 char* para = arg; 
21 while(1) 
22 put_str(para); 
23 
24 } 



































代码 9-3 中 ， 我 们 在 头 文件 中 加 入 了 thread.h， 并 且 在 第 11 行 中 调用 thread_start("k_thread_a", 31, 
k_thread_a, "argA 站) 创建 了 新 线程 。 线 程 名 字 为 kk thread_a， 优 先 级 为 31〈 此 时 没什么 用 ， 先 留 着 )， 此 线 
时 运行 的 函数 是 k_thread_a， 它 定义 在 第 18 行 ， 功 能 就 是 打印 参数 arg。 我 们 传 给 thread_start 的 第 4 个 参 
数 是 字符 串 “argA” 因此 线程 在 运行 时 会 在 屏幕 上 循环 输出 arg_A。 
编译 运行 ， 结 果 如 图 9-10 所 示 。 
如 图 ， 满 屏 的 argA， 这 说 明 我 们 暂时 成 功 了 。 线 程 初战 告捷 ， 本 节 工 作 暂 告 一 段落 ， 下 节 再 见 。 
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A 图 9-10 ”线程 运行 结果 


和 核心 数据 结构 ， 双 向 链表 


程序 = 算法 + 数据 结构 。 

说 来 断 愧 ， 把 这 么 著名 的 一 句 话 写 在 本 节 开 头 ， 我 还 是 有 些许 脸红 的 。 限 于 咱们 为 了 简单 以 及 本 人 的 
能 力 实 在 有 限 ， 到 目前 为 止 我 们 并 没有 采用 什么 高 深 的 算法 。 

不 过 算法 再 怎么 简单 ,数据 结构 还 是 必 不 可 少 的 , 数据 需要 存储 到 合适 的 数据 结构 中 才能 获得 更 高 效 
的 管理 。 就 拿 队 列 来 说 ， 它 是 一 种 先入 先 出 的 数据 结构 ， 很 多 需要 保证 时 序 的 数据 一 般 都 用 队列 来 存储 ， 
实现 队列 的 方式 有 很 多 ， 最 简单 的 就 是 用 数组 ， 稍 微 复杂 一 些 可 以 用 链表 。 
在 咱们 的 内 核 中 也 要 用 到 队列 , 比如 进程 的 就 绪 队 列 、 锁 的 等 待 队列 等 , 为 了 维护 内 核 中 的 各 种 队列 ， 
咱们 本 节 要 实现 自己 的 链表 一 一 双向 链表 。 

数据 结构 课程 我 估计 大 家 都 学 过 , 我 看 还 是 直接 上 代码 吧 ， 由 于 队列 属于 内 核 的 数据 结构 ， 故 我 们 在 
lib/kernel/ 下 创建 list.h 及 list.c， 我 们 先 看 看 头 文件 的 定义 ， 请 见 代 码 9-4。 


代码 9-4 (project/c9/b/lib/kernel/list.h ) 


#ifndef LIB KERNEL LIST H 
#define _LIB KERNEL LIST H 
#include "global.h" 























































































































































































































































































































#define offset (struct type,member) (int) (& ((struct type*)0)—->member) 
#define elem2entry(struct type, struct member name, elem ptr) \ 
(struct type*) ((int)elem ptr - offset (struct type, struct member name)) 


oo~OU 必 WwWNR 哺 


日 /类 类 类 类 太太 大大 大 大 定义 链表 结 点 成 员 结 构 大 大 大大 大 大大 大 大 大 大 
10 * 结 点 中 不 需要 数据 成 元 ， 只 要 求 前 驱 和 后 继 结 点 指针 */ 
11 struct list elem { 




















12 struct list elem* prev; // 前 躬 结 点 
13 struct list elem* next; // 后 继 结 点 
14 }; 
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16 /* 链表 结构 ， 用 来 实现 队列 */ 
17 Struct Tist 














































































































18 /* head 是 队 首 ， 是 固定 不 变 的 ， 不 是 第 1 个 元 素 ， 第 1 个 元 素 为 head.next */ 
19 struct list elem head; 

20 /* tail 是 队 尾 ， 同 样 是 固定 不 变 的 */ 

pa struct list elem tail; 

22 }} 

i 

24 /* 自 定义 函数 类 型 function， 用 于 在 1ist traversal 中 做 回调 函数 */ 
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25 typedef bool (function) (struct list elem*, int arg) 


27 Yoid list tiit (Struct ‘Tist*yy 

28 void list insert before(struct list elem* before, struct list elem* elem); 
29 void list push(struct list* plist, struct list elem* elem); 

30 void list iterate(struct list* plist); 

31 void list append(struct list* plist, struct list elem* elem); 

32 void list remove(struct list elem* pelem); 

33 struct list elem* list popl(struct list* plist); 

34 bool list empty(struct list* plist); 

35 uint32 t list lenl(struct list* plist); 

36 struct list elem* list traversal(struct list* plist, function func int arg); 
37 bool elem find(struct list* plist, struct list elem* obj elem); 










































































38 #endif 
第 11 行 定义 的 是 结构 体 struct list_elem， 它 是 链表 中 结 点 的 结构 ， 这 是 链表 的 核心 。 一 般 的 链表 结 点 中 除 
了 前 驱 或 后 继 结 点 的 指针 外 ， 还 包括 数据 成 员 ， 即 链表 结 点 是 数据 的 存储 单元 。 您 看 到 了 ， 本 结 点 只 有 前 驱 结 
点 指针 prev 和 后 继 结 点 指针 next， 不 包含 数据 成 员 ， 结 点 中 为 什么 没有 数据 成 员 呢 ?哈哈 ， 因 为 不 需要 























的 链表 单纯 是 为 了 将 已 有 的 数据 以 一 














存储 数据 只 是 链表 的 部 分 功能 ， 它 最 主要 的 功能 是 “ 链 ”， 咱 信 
定 的 时 序 链 起 来 ， 因 此 不 是 为 了 存储 ， 所 以 结 点 中 不 需要 数据 成 员 。 
第 16 一 22 行 是 定义 双向 链表 的 结构 体 ， 链 表 都 有 访问 的 起 始 入 口 ， 我 们 这 里 定义 首尾 两 个 入 口 ， 用 
head 表示 链表 开头 ，tail 表示 链表 结尾 ， 这 样 链表 就 可 以 按照 从 前 到 后 或 从 后 到 前 的 顺序 来 遍历 了 。 

head 和 tail 这 两 个 成 员 是 固定 不 变 的 ， 它 们 是 链表 固定 的 两 个 入 口 。 新 插入 的 结 点 不 会 蔡 代 它们 的 位 置 ， 
只 是 会 插入 在 head 和 tail 之 间 。 就 像 火车 一 样 ， 两 头 的 火车 头 是 不 变 的 ， 要 增加 车 厢 ， 只 是 往 中 间 加 。 

你 看 ，head 和 tail 的 数据 类 型 都 是 struct list_elem，head.next 是 链表 中 第 1 个 元 素 结 点 ，tail.prev 是 链 
表 中 最 后 一 个 元 素 结 点 , 以 后 在 链表 中 插入 结 点 时 , 都 是 插入 在 head 和 tail 之 间 。 至 于 head.prev 和 tail.next， 
它们 的 值 无 意义 ， 在 初始 化 时 会 被 置 为 空 。 

文件 开头 定义 的 两 个 宏 elem2entry 和 offset， 这 是 为 了 将 结 点 元 素 转 换 成 实际 元 素 项 ， 将 来 用 到 时 再 
讨论 介绍 啦 。 

list.c 中 用 到 了 关中 断 的 函数 intr_disable, 在 介绍 list.c 之 前 ， 有 必要 先 和 大 伙 儿 交待 一 下 为 什么 这 样 做 。 

系统 中 有 些 数据 是 公共 资源 ， 对 于 它 的 修改 应 该 保证 是 原子 操作 。 学 过 操作 系统 的 同学 都 知道 有 个 临 





二 


















































































































































































































































局 






























































界 区 的 概念 ， 简 单 来 说 ， 访 问 公共 资源 的 程序 片段 叫 临 界 区 ， 临 界 区 通常 是 指 在 不 同 线程 中 的 、 修 改 同一 
公共 资源 的 指令 区 域 。 临 界 区 中 的 代码 应 该 属于 原子 操作 ， 要 么 不 执行 ， 要 么 就 全 部 执行 完 〈 就 像 数据 库 
中 的 事务 一 样 )， 说 白 了 就 是 怕 某 线程 临界 区 中 的 代码 未 全 部 执行 完 就 被 换 下 处 理 器 ， 然 后 另 一 个 线程 的 






























































的 
临界 区 代码 又 对 此 公共 资源 有 读 写 ， 于 是 造成 公共 资源 数据 的 错误 ， 这 就 是 资源 竞争 的 问题 。 即 使 现在 不 
清楚 这 些 概念 也 没关系 ， 过 些 天 咱们 介绍 “ 锁 ” 的 时 候 会 和 大 家 细 说 。 

咱们 刚 学 过 位 图 ， 我 还 是 用 位 图 的 操作 给 大 伙 举 个 例子 吧 。 

比如 当 内 核 线程 A 在 位 图 中 找到 空闲 位 (bit 值 为 0) 时， 还 没 来 得 及 将 其 分 配 出 去 〈 也 就 是 将 位 图 
中 该 bit 的 值 改 为 1)， 这 时 候 运 行 的 时 间 片 到 了 ， 被 换 下 了 CPU。 将 线程 B 换 上 CPU 运行 ， 线 程 B 也 要 
扫描 位 图 ， 同 样 也 找到 了 线程 A 当初 发 现 的 空闲 位 ， 于 是 将 该 位 的 值 置 为 1， 表 示 已 分 配 。 当 线程 A 又 
被 换 上 CPU 进行 的 时 候 ， 由 于 它 不 知道 曾经 找到 的 空闲 位 已 经 被 线程 B 抢 走 了 ， 所 以 它 的 下 一 步 工 作 是 
将 该 空闲 位 置 1 (已 经 由 线程 B 置 过 1 了 )， 然 后 重复 使 用 已 经 分 配给 线程 B 的 资源 ， 于 是 引起 了 冲突 。 
咱们 将 来 的 进程 调度 机 制 依靠 时 钟 中 断 ， 此 处 把 中 断 关 闭 ， 就 避免 了 在 检索 位 图 时 被 换 下 CPU 的 可 
能 。 所 以 ， 对 于 此 例子 中 的 位 图 操作 ， 一 定 要 保证 是 在 关中 断 的 情况 下 进行 。 
有 没有 同学 疑惑 : 哎 ? 那 咱 们 之 前 的 位 图 操作 也 没 关 中 断 啊 ,， 这 里 不 是 要 求 关 中 断 吗 ?是 这 样 的 ， 实 
现 原子 操作 ， 关 中 断 只 是 一 种 方式 ， 将 来 咱们 会 用 锁 来 保证 。 
好 , 我 就 当 大 伙 儿 已 经 理解 使 用 intr_disable 函数 关中 断 的 意义 了 , 那 咱们 下 面 看 下 listc， 见 代码 9-5。 


代码 9-5 (project/c9/b/lib/kernel/list.c ) 

































































































































































































































































































































































1 #include "list.h" 
2 #include "interrupt.h" 
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3 
4 /* 初始 化 双向 链表 list */ 
Svvold Irst innit (StruUct ~ List LLSE), 4 
6 list->head.prev = NULL; 

7 list->head.next = &list->tail; 
8 list->tail.prev = &list->head; 
9 list->tail.next = NULL; 

01 











12 /* 把 链表 元 素 elem 插入 在 元 素 before 之 前 */ 
13 void list insert before(struct list elem* pefore, struct list elem* elem) { 





































































































14 enum intr status old status = intr disable(); 

5 

16 /* 将 before 前 驱 元 素 的 后 继 元 素 更 新 为 elem， 和 暂时 使 before 脱离 链表 */ 
7 before->prev->next = elem; 

18 

19 /* 更 新 elem EE 忆 的 前 驱 结 点 为 before 的 前 驱 ， 

20 * 更 新 elem 自己 的 后 继 结 只 点 为 before， 于 是 before 又 回 到 链表 */ 
21 elem->prev = before->prev,; 

22 elem->next = before; 

23 

24 /* 更 新 before 的 前 驱 结 点 为 elem */ 

25 before->prev = elem; 

26 

23 intr_set_status (olq_status) ; 

28 } 

29 

30 /* 添加 元 素 到 列表 队 首 ， 类 似 栈 Push 操作 */ 























31 void list push(struct list* plist, struct list elem* elem) { 





32 list insert before(plist->head.next，elem); // 在 队 头 插入 elem 
33 
34 























35 /* 追加 元 素 到 链表 队 尾 ， 类 似 队 列 的 先进 先 出 操作 */ 
36 void list append(struct list* plist, struct list elem* elem) { 



























































37 list insert before(g&plist->tail, elem); // 在 队 尾 的 前 面 插入 
38 } 

39 

40 /* 使 元 素 pelem 脱离 链表 */ 

41 void list remove(struct list elem* pelem) { 

42 enum intr status old status = intr disable(); 
43 

44 pelem->prev->next = pelem->next; 

45 pelem->next—->prev = pelem->prev; 

46 

47 intr set status(old status);} 

48 } 

49 

50 /* 将 链表 第 一 个 元 素 弹出 并 返回 ， 类 似 栈 的 pop 操作 */ 

51 struct list elem* list popl(struct list* plist) { 





























52 struct list elem* elem = plist->head.next; 

分 学 list remove (elLlem) ; 

54 return elem; 

955 

56 

57 /* 从 链表 中 查找 元 素 obpj elem， 成 功 时 返回 true， 失 败 时 返回 false */ 
58 bool elem find(struct list* plist, struct list elem* obj elem) { 
59 struct list elem* elem = plist->head.next; 

60 while (elem != &plist->tail) { 

61 if (elem == ob]j elem) { 

62 return true; 

63 } 

64 elem = elem->next; 

65 } 

66 return false; 

67 } 

68 























69 /* 把 列表 plist 中 的 每 个 元 素 elem 和 arg 传 给 回调 函数 func， 
70 * arg 给 func 用 来 判断 elem 是 否 符合 条 件 . 
71 * 本 函数 的 功能 是 遍历 列表 内 所 有 元 素 ， 逐 个 判断 是 否 有 符合 条 件 的 元 素 。 

72 * 找到 符合 条 件 的 元 素 返回 元 素 指 针 ， 否 则 返回 NULL */ 

73 struct list elem* list traversall(struct list* plist, function func int arg) { 
74 struct list elem* elem = plist->head.next; 


























口 
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75 /* 如 果 队 列 为 空 ， 就 必然 没有 符合 条 件 的 结 点 ， 故 直接 返回 NULL */ 
76 if (1List_empty(P1List)) { 

77 return NULL; 

78 } 

9 

80 while (elem != &plist->tail) { 

再 于 if (func(elem, arg)) { 

// func 返回 ture， 则 认为 该 元 素 在 回调 函数 中 符合 条 件 ， 命 中 ， 故 停止 继续 遍历 
82 return elem; 

83 } // 若 回调 函数 func 返回 true， 则 继续 遍历 

84 elem = elem->next; 

85 } 

86 return NULL; 

87 } 

88 











89 /* 返回 链表 长 度 */ 





90. Uint32 tt Iist Len(striet List pliSt) 渤 


91 struct list elem* elem = plist->head.next; 
92 uint32 t length = 0; 

93 while (elem != &plist->tail) { 

94 length++; 

95 elem = elem->next; 

96 } 

97 return length; 

98 } 

99 























100 /* 判断 链表 是 否 为 空 ， 空 时 返回 上 true， 否则 返回 false 











101 bool list empty(struct list* plist) 


{ 


大 


// 判断 队列 是 否 为 空 


102 return (plist->head.next == &plist->tail ? true : false); 


103. 于 


咱们 从 上 往 下 把 函数 逐个 介绍 下 。 











函数 list_init 只 接受 一 个 参数 list， 功 能 是 初始 化 双向 链表 list。 此 时 钟表 是 空 的 ， 因 此 函数 内 部 的 
初始 化 工作 就 是 把 表 头 head 和 表 尾 tail 连接 起 来 ， 即 “list->head.next = &list->tail” 和 “list->tail.prev = 











&list>head”。head.prev 和 tail.next 的 值 无 意义 ， 因 此 被 置 为 NULL。 
函数 list_insert_before 接受 两 个 参数 ，before 和 elem， 它 们 皆 为 链表 结 点 的 指针 ， 此 函数 功能 是 把 链 
表 元 素 elem 插入 在 元 素 before 之 前 。 














由 于 队列 是 公共 资源 ， 对 于 它 的 修改 一 定 要 保 说 j 
将 中 断 关 闭 , 旧 中 断 状态 用 变量 old_status 保存 ， 以 此 保证 下 面 的 4 个 操作 的 原子 性 〈 不 可 拆 4 





















































FE 为 原子 操作 ， 所 以 在 函数 体 的 第 14 行 通过 intr_disable 
分 





、 连 续 性 )， 





























操作 结束 后 在 第 27 行 通过 “intr_set_status(old_status)” 将 中 断 恢复 。 








人 全 














素 更 新 为 elem， 和 暂时 使 before 脱离 链表 。 











第 17 行 的 “before->prev->next = elem”， 其 中 before->prev 是 获取 before 的 前 驱 元 素 , 之 后 再 用 ->next 














获取 此 前 躯 元 素 的 下 个 结 点 ， 此 时 将 其 赋值 为 lem， 医 
































行 。 






































码 


向 elem， 于 是 在 第 25 行 用 














“elem->next = before” 完 成 。 此 时 elem 已 


于 这 是 双向 链表 ， 第 17 行 只 是 完成 了 从 前 至 
对 此 在 第 21 行 ， 将 elem 的 前 驱 结 点 更 新 为 before 的 前 驱 ， 即 代码 “elem->prev = before->prev”。 
1 于 是 将 elem 插入 在 before 之 前 ， 故 需要 将 elem 的 后 继 结 点 更 新 为 before， 因 此 在 第 22 行 , 通过 代 
经 替代 了 before 在 链表 中 的 位 置 。 




















I 后 单 向 的 更 新 ， 还 要 保证 从 后 往 


此 本 行 代码 的 功能 是 将 before 前 驱 元 素 的 后 继 元 




















前 也 能 链接 上 才 































































































接 下 来 ， 要 保证 从 后 往 前 能 访问 到 elem， 由 于 before 已 经 在 elem 的 后 面 ， 故 需要 将 before 的 前 驱 结 点 指 












































代码 “before->prev = elem” 完 成 。list_insert_before 就 是 这 么 简单 。 





函数 list_push 接受 两 个 参数 ，plist 是 链表 ，elem 是 链表 结 点 ， 功 能 是 添加 元 素 elem 到 列表 plist 的 队 








首 > 












































head.next, elem)” 实 现 的 ， 即 在 队 头 head.next 


的 队 尾 ,其实 这 就 是 队列 的 特性 ， 先 进 先 出 ， 基 
before(&plist->tail elem)” 实 现 的 ， 就 是 在 队 尾 tail 的 前 
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函数 list_append 接受 两 个 参数 ，plist 是 链表 




















其 实 这 就 是 栈 的 特性 , 后进 先 出 , 因此 相当 于 用 链表 实现 了 栈 。 其 内 部 是 调用 “1list_insert_before(plist-> 




















的 前 面 插入 elem。 
，elem 是 链表 结 点 ， 功 能 是 添加 元 素 elem 到 列表 plist 
































此 相当 于 












































链表 实现 了 线性 队列 。 其 内 部 是 调用 “list_insert_ 








函数 list_remove 接受 一 个 参数 ， 链 表 结 点 pelem， 
Pp 


面 插 入 elem。 

















功能 是 将 pelem 从 链表 中 去 除 。 原 理 就 是 让 pelem 





9.4 多 线程 调度 


前 躯 的 后 继 结 点 ， 指 向 pelem 的 后 继 结 点 ， 即 “pelem->prev->next = pelem->next”， 让 pelem 后 继 的 前 躯 
结 点 指向 pelem 的 前 躯 结 点 ， 即 “pelem->next->prev = pelem->prev”。 此 函数 也 是 对 链表 修改 ， 所 以 咱们 
为 了 保证 原子 性 ， 同 样 先 将 中 断 关 闭 ， 完 成 操作 后 再 恢复 。 
函数 list_pop 只 接受 一 个 参数 ， 链 表 plist， 功 能 是 将 链表 plist 的 第 一 个 结 点 弹出 ， 类 似 出 栈 操作 。 内 部 
实现 就 是 先 获取 链表 第 一 个 元 素 plist->head.next， 将 其 存 到 指针 elem 中 ， 即 “struct list_elem* elem = 
plist->head.next”， 然 后 再 调用 “list_remove(elem)” 将 其 从 链表 中 删除 ， 随 后 再 通过 “return elem” 将 其 返回 。 
函数 elem_find 接受 两 个 参数 ， 链 表 plist 和 待 查找 的 结 点 obj_elem， 功 能 是 从 链表 plist 中 查找 元 素 
obj_elem， 成 功 时 返回 true， 失 败 时 返回 false。 实 现 原 理 是 把 链表 的 第 一 个 结 点 作为 入 口 ， 通 过 while 循 
环 遍 历 链 表 中 所 有 结 点 ， 如 果 找 到 就 返回 tue， 人 否则 遍历 完整 个 链表 后 都 没有 找到 的 话 就 返回 false。 
函数 list_traversal 接受 三 个 参数 ， 链 表 plist、 回 调 函 数 func 及 回调 函数 的 参数 arg， 功 能 是 遍历 列表 
内 所 有 元 素 ， 逐 个 判断 是 否 有 符合 “条 件 ” 的 元 素 结 点 ， 找 到 符合 条 件 的 结 点 返回 结 点 指针 ， 和 否则 返回 
NULL。 其 中 的 “条 件 ” 是 由 回调 函数 func 来 判断 的 ， 如 果 条 件 成 立 ，func(arg) 会 返回 true， 和 否则 会 返 匠 
false (list_traversal 有 些 类 似 ruby 中 的 枚 举 用 法 )。 内 部 实现 也 是 遍历 所 有 结 点 ， 用 变量 elem 保存 每 一 个 
结 点 ， 对 各 个 结 点 都 调用 “func(elem, arg)” 如果 func 返回 tue， 则 表示 找到 了 目标 结 点 ， 不 再 继续 遍历 ， 
通过 retum elem 返回 找到 的 结 点 指针 ,否则 整个 链表 遍历 结束 也 没有 找到 符合 条 件 的 结 点 时 就 返回 NULL。 
函数 list_len 只 接受 一 个 参数 ， 链 表 plist， 功 能 是 返回 链表 长 度 ， 即 链表 中 结 点 的 个 数 。 实 现 原理 也 
是 通过 循环 遍历 所 有 结 点 ， 用 变量 length 计数 ， 最 后 再 将 计数 返回 ， 不 再 细 说 。 
函数 list_empty 只 接受 一 个 参数 ， 链 表 plist， 功 能 是 判断 链表 plist 是 否 为 空 ， 空 时 返回 tue， 和 否则 返 
回 false。 其 内 部 实现 较 直接 ， 就 一 句 代 码 ， 即 “return (plist->head.next == &plist->tail ? true : false)”， 原 理 
是 判断 链表 plist 第 一 个 结 点 是 否 指向 链表 plist 的 尾 。 
好 啦 ，listc 就 介绍 完了 ， 由 于 链表 只 是 基础 组 件 ， 目 前 还 未 派 上 用 场 ， 所 以 本 节 无 实验 可 做 ， 大 伙 
就 早点 休息 啦 。 


多 线程 调度 
之 前 咀 们 已 经 完成 了 单个 线程 的 执行 , 那 只 是 咱们 小 试 身手 的 第 一 步 ， 本 节 咀 们 要 完成 真正 意义 上 的 

多 线程 ， 让 多 个 线程 在 调度 器 的 调度 下 轮流 执行 。 

9.4.1 简单 优先 级 调度 的 基础 


本 节 任 务 是 把 thread.c 和 thread.h 进一步 完善 ， 在 原 有 线程 的 基础 上 添加 新 的 功能 ， 咱 们 的 目标 是 完 
成 线程 的 轮 询 调度 。 
为 实现 这 一 目标 ， 这 里 有 一 些 基 础 工作 要 先 完成 ， 咱 们 先 看 看 thread.h 又 增加 的 内 容 ， 请 见 代码 9-6。 


代码 9-6 (project/c9/c/thread/thread.h ) 
































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































… 略 

73 /* 进程 或 线程 的 pcb， 程 序 控制 块 */ 

了 和 ET 寺 

75 uint32 t* self kstack; // 各 内 核 线程 都 用 自己 的 内 核 栈 

76 enum task status status; 

31 char name[16]; 

78 uint8 七 priority; 

79 uint8 t ticks; // 每 次 在 处 理 器 上 执行 的 时 间 咬 哄 数 
80 

81 /* 此 任务 自 上 cpu 运行 后 至 今 占用 了 多 少 cpu 咬 哄 数 ， 





82 ”也 就 是 此 任务 执行 了 多 久 */ 
























































83 uint32 t elapsed ticks; 

84 

85 /* general tag 的 作用 是 线程 在 一 般 的 队列 中 的 结 点 */ 

86 struct list elem general tag; 

87 

88 /* all 1ist tag 的 作用 是 线程 队列 thread all 1ist 中 的 结 点 */ 
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OO 
89 struct list elem all list tag; 
90 
91 uint32 tx pgdir; // 进程 自己 页 表 的 虚拟 地 址 
92 uint32 t stack magic; // 用 这 串 数字 做 栈 的 边界 标记 
/ i 仿 测 栈 的 溢出 
9303}3 
以 下 是 函数 声明 ……: 
struct task_struct 结构 中 新 增 了 几 个 成 员 。 
ticks 之 前 咱们 也 添加 过 了 ， 当 时 限于 演示 ,没有 给 出 其 实际 用 途 。 它 是 任务 每 次 被 调度 到 处 理 器 上 执 
行 的 时 间 咬 噶 数 ， 也 就 是 我 们 所 说 的 任务 的 时 间 片 ， 每 次 时 钟 中 断 都 会 将 当前 任务 的 ticks 减 1， 当 减 到 0 
时 就 被 换 下 处 理 器 。 
ticks 和 上 面 的 priority 要 配合 使 用 。priority 表示 任务 的 优先 级 ， 咱 们 这 里 优先 级 体现 在 任务 执行 的 时 
间 片 上 ， 即 优先 级 越 高 ， 每 次 任务 被 调度 上 处 理 器 后 执行 的 时 间 片 就 越 长 。 当 ticks 递减 为 0 时 ， 就 要 被 


时 间 中 断 处 班 
度 时 ， 将 再 次 在 处 理 器 
elapsed _ticks 用 于 记录 企 





general_tag 的 类 型 


被 加 入 到 就 








为 管理 






















































































程序 和 调度 器 换 下 处 理 器 ， 调 度 器 把 priority 重新 赋值 给 
上 运行 ticks 个 时 间 片 。 





























ticks， 这 样 当 此 线程 下 一 次 又 被 调 





























FE 务 在 处 到 





























型 是 struct list_elem， 也 就 是 general_tag 是 双 问 链表 中 的 结 点 
绪 队 列 thread_ready_list 或 其 他 等 待 队列 中 时 ， 就 把 该 线程 

一 个 struct list_elem 类 型 的 结 点 只 有 一 对 前 躯 和 后 继 指 针 ， 
所 有 线程 ， 还 存在 一 个 全 部 线程 队列 thread_all_list， 










































































all_list_tag 的 类 型 也 是 struct list_elem， 
也 许 大 伙 儿 可 
这 两 个 标签 仅仅 是 加 入 队列 时 
的 “ 反 操 作 ” 
两 个 线程 
pgdir 是 人 
表 , 而 线程 共享 所 在 进程 的 地 址 空 
会 被 赋予 页 表 的 虚拟 地 址 ,注意 此 处 是 








它 专用 于 线程 被 加 入 全 部 线程 队列 时 使 用 。 
这 两 个 标签 又 不 是 线程 ， 加 入 队列 后 就 能 | 
的 ， 将 来 从 队列 中 把 它们 取出 来 时 ， 
实现 从 &general_tag 到 &thread 的 地 ] 
“标签 ” 
任务 后 


























疑惑 ， 











能 










































































定义 在 新 的 thread.c 中 ， 一 会 儿 在 介绍 时 咱们 会 引 
己 的 页 表 。 线 程 与 进程 的 最 大 区 别 就 是 进程 独 享 自 
间 ， 即 线程 无 页 表 。 
虚拟 地 址 ， 页 表 加 载 时 还 是 


| 






















































































要 被 转换 成 物 到 











容 咱 
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们 将 来 ) 

















j 到 时 再 介绍 








好 啦 ，thread.h 就 这 点 变化 ， 接 下 来 中 























们 再 看 thread.c， 请 看 代码 9-7。 

















代码 9-7 (project/c9/c/thread/thread.c ) 


#define PG SIZE 4096 


struct task struct* main thread; // 主线 程 PCB 
struct list thread ready list; // 就 绪 队 列 





list thread all list; 
struct list elem* thread tag;// 于 保存 队列 了 


struct 
static 

















中 的 线程 结 点 











extern void switch tol(struct task struct* cur, struct task struct* next); 


/* 获取 当前 线程 pcb 指针 */ 
struct task struct* running thread() { 
uint32 t esp; 
asm ("mov %$%esp, $0" : "=g" (esp)); 
/* 取 esp 整数 竣 8 分 ， 即 pcb 起 始 地 址 */ 
return (struct task struct*) (esp & Oxfffff000); 








kernel thread 去 执行 function (func arg) */ 
static void kernel thread(thread func* function void* func arg) { 
执行 function 前 中 断 ， 
避免 后 面 的 时 钟 中 断 被 屏蔽 ， 而 无 法 调度 其 他 线程 */ 
intr enable(); 
function(func arg); 













































































己 的 地 址 空间 ， 即 进程 有 
如 果 该 任务 为 线程 ,pgdir 则 为 NULL， 
地 址 的 ， 不 过 ; 


器 上 运行 的 时 钟 咬 哄 数 ， 从 开始 执行 ， 历 的 总 时 钟 数 。 
是 线程 的 标签 ， 当 线程 
PCB 中 有 的 地 址 加 入 队列 。 
它 只 能 被 加 入 一 个 队列 ， 但 在 咱们 的 系统 中 ， 
羽 此 线程 还 需要 另外 一 个 标签 ， 即 all_list_tag。 








于 某 种 管理 了 ? 此 处 先 提 一 下 
还 需要 再 通过 offset 宏 
址 转换 ， 将 它们 还 原 成 线程 的 PCB 地 址 后 才能 


与 elem2entry 宏 











使 用 


























否则 pgdir 


… 略 
48 /* 初始 化 线程 基本 信息 */ 


49 void init thread(struct task struct* pthread, char* name int prio) { 









































































































































50 memset (pthread, 0, sizeof (*pthread)); 
与 二 strcpy (pthread->name, name); 
52 
5 if (pthread == main thread) { 
54 /* 由 于 把 main 函数 也 封装 成 一 个 线程 ， 
它 是 运行 的 ， 故 将 其 直接 设 为 TASK_RUNNING */ 
a pthread->status = TASK RUNNING; 
56 else { 
SF pthread->status = TASK READY; 
58 
59 
60 /* self kstack 是 线程 自己 在 内 核 态 下 使 用 的 栈 项 地 址 */ 
61 pthread->self kstack = (uint32 t*) ((uint32 t)pthread + PG SIZE); 
62 pthread->priority = prio; 
63 pthread->ticks = prio; 
64 pthread->elapsed ticks = 0; 
65 pthread->pgdir = NULL; 
66 pthread->stack magic = 0x19870916; // 自 定义 的 魔 数 
67 } 
68 





69 /* 创建 一 优先 级 为 prio 的 线程 ， 线 程 名 为 name， 
线程 所 执行 的 函数 是 function (func arg) */ 
70 struct task struct* thread start (char* name \ 
int prio, \ 
thread func function, \ 
void* func arg) { 



























































71 /* pcb 都 位 于 内 核 空间 ， 包 括 用 户 进程 的 pcb 也 是 在 内 核 空间 */ 

了 之 struct task struct* thread = get _ kernel pages (1) ; 

73 

74 init thread (thread, name, prio); 

3 thread create(thread, function, func arg); 

76 

77 /* 确保 之 前 不 在 队列 中 */ 

78 ASSERT (!elem find(&thread ready list, &thread->general tag)); 
79 /* 加 入 就 绪 线程 队列 */ 

80 list append(&thread ready list, &thread->general tag); 

81 

82 /* 确保 之 前 不 在 队列 中 */ 

83 ASSERT (!elem find(&thread all list, &thread->all list tag)); 
84 /* 加 入 全 部 线程 队列 */ 

85 list append(g&thread all list, &thread->all list tag); 

86 

87 return thread; 

88 } 

89 


90 /* 将 kernel 中 的 main 函数 完善 为 主线 程 */ 
91 static void make main thread(void) f{ 
92 /* 因为 main 线程 早已 运行 ， 
* 咱们 在 loader .Ss 中 进入 内 核 时 的 mov esp, 0xc009f000， 
93 * 就 是 为 其 预 留 pcb 的 ， 因 此 pcb 地 址 为 0xc009e000， 
* 不 需要 通过 get_kernel page 另 分 配 一 页 */ 




































































94 main thread = running thread(); 
95 init thread (main thread, "main", 31);} 
96 














97 /* main 函数 是 当前 线程 ， 当 前 线程 不 在 thread ready list 中 ， 
98 * 所 以 只 将 其 加 在 thread all 1ist 中 */ 

99 ASSERT (!elem find(&thread all list, &main thread->all list tag)); 
100 list append(&thread all list, &main thread->all list tag); 

OT-} 


代码 9-7 看 上 去 有 点 长 ， 但 我 告诉 大 家 ， 里 面 要 看 的 内 容 并 不 多 ， 这 只 是 有 过 改动 的 部 分 ， 全 贴 出 来 
方便 大 伙 知 道 在 哪里 有 过 变化 。 
在 开头 定义 了 一 些 全 局 的 数据 结构 。 
第 12 行 的 “struct task_struct* main_thread” 是 定义 主线 程 的 PCB， 咱 们 进入 内 核 后 一 直 执行 的 是 main 函 
其 实 它 就 是 一 个 线程 ， 我 们 在 后 面 会 将 其 完善 成 线程 的 结构 ， 因 此 为 其 先 定义 了 个 PCB。 




































































































































































溢 
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调度 器 要 选择 某 个 线程 上 处 至 
队列 。 在 第 13 行 的 “struct list thread_ready_list” 便 是 名 
就 绪 队 列 中 的 线程 都 是 可 用 
绪 队 列 中 ， 但 我 们 得 有 个 地 方 能 找到 它 ， 
程 队 列 ， 它 就 是 第 14 


























struct list_elem。 我 们 对 线程 以 
转换 成 PCB 。 在 转换 过 程 中 需要 记录 tag 的 住 


的 话 , 必然 要 




































































行 的 thread_all_list。 
在 队列 中 的 结 点 并 不 是 线程 的 PCB ， 而 是 线程 PCB 中 的 tag， 即 general_tag 或 all_list_tag， 其 类 型 是 



































里 都 是 基于 线程 PCB 的 ， 其 类 型 

















E 将 所 有 线程 收集 到 某 个 地 方 , 这 个 地 方 就 是 线程 就 绪 
tC 绪 队 列 ， 以 后 每 创建 一 个 线程 就 将 其 加 到 此 队列 中 。 
里 器 运行 的 ,可 有 时 候 线程 因为 某 些 原因 阻塞 了 ， 不 能 放 在 就 












































知道 我 们 共 创 建 了 多 少 线程 ， 为 此 我 们 创建 了 所 有 《全 部 ) 线 











struct task_struct， 因 此 必须 要 将 tag 









































说 一 句 ， 其 实 可 以 用 局 部 变量 来 完成 ， 形 式 不 限 。) 
接 下 来 用 extern 声明 了 外 部 函数 switch_to， 在 后 面 
新 增 了 个 函数 running_thread， 它 的 功 

栈 都 是 在 自己 的 PCB 当中 , 因此 取 当 前 栈 指针 的 高 20 

汇编 ， 相 信 大 伙 儿 都 能 
本 版 本 的 kernel_thread 函数 有 ] 












































有 天 过 























对 此 在 第 15 行 定义 了 全 局 变量 thread_tag 来 存储 。(〈 悄 悄 

















会 介 

















能 是 返回 线程 的 PCB 地 址 。 原 理 很 简单 ， 各 个 线程 所 用 的 0 级 





























务 调度 的 保证 。 原 











是 我 们 的 任务 调度 




















的 执行 ， 借 此 将 控 和 
虑 将 处 理 器 使 用 权 发 放 到 某 个 
操作 系统 不 会 被 “架空 ”而 






































内 核 的 



































线程 的 首次 运行 是 
中 断 ， 因 此 在 执行 function 前 要 打 玫 



































周 用 
































是 时 钟 中 断 被 屏蔽 了 ， 再 也 不 会 调度 到 
在 介绍 init_thread 之 
有 个 执行 流 ， 这 个 执行 流 



































几 制 基于 时 钟 中 断 ， 
EF 务 调度 器 
王 务 的 手中 ， 下 次 中 断 再 发 生 昌 
任务 都 有 运行 
王 务 调度 器 schedule 完成 的 , 进入 中 断后 处 理 器 会 自动 关 
， 和 否则 kernel thread 中 的 function 在 关中 断 的 情况 下 运行 ， 也 就 
新 的 线程 ，function 会 狐 
了 些 事情 要 和 大 伙 交 待 清楚 。 












































立 作为 当前 运行 线程 的 PCB 。 里 面 都 是 简单 的 内 联 








很 重要 的 变化 ， 在 函数 体 中 增加 了 开 中 断 的 函数 intr_enable， 它 是 任 
I 时 钟 中 断 这 种 “不 可 抗力 ”来 中 断 所 有 任务 
schedule (后 面 有 小 节 专 门 论 述 schedule) 考 






































被 回收 ， 周 而 复 始 ， 这 样 便 保证 























的 机 会 。 






































里 姨 








其 实 我 们 从 帮 



























































现在 我 们 要 创建 新 线程 了 ,并 























断 ， 时 钟 中 断 的 处 开 















































F 机 到 创建 第 一 个 线程 前 ， 程 序 都 





我 们 从 BIOS 到 mbr 到 loader 到 kernel， 其 实 它 就 是 我 们 所 说 的 主线 程 。 为 此 
我 们 还 在 loader 中 把 esp 置 为 0xc009f000， 这 是 有 意 为 之 的 设计 ,意图 





巴 0xc009e000 作为 主线 程 的 PCB 。 




















LE 六 数 会 判断 当前 线程 所 用 的 栈 是 否 会 























坏 了 线程 信息 ， 也 就 是 判断 thread->stack_magic 是 否 等 于 0x19870916。 可 是 新 创建 的 线程 在 首次 运行 前 





一 直 是 主线 程 在 跑 ， 但 此 时 3 


还 没有 身份 证 ， 也 衣 














是 错误 的 值 ， 所 以 我 们 提前 调用 
好 啦 ， 现 在 大 伙 儿 知道 3 



































make_main_thread 函数 为 主线 条 
线程 main_thread 已 经 有 PCB 了 ， 它 到 
init_thread 函数 也 有 了 一 些 改变 ， 第 53 一 $8 行 ， 我 们 加 入 了 对 主线 程 

















是 还 没有 PCB ， 因 此 main_thread->stack_magic 就 
赋予 了 PCB， 到 后 面 都 有 介绍 。 

见 在 是 有 “身份 证 ”的 线程 了 ， 所 以 
main_thread 的 判断 ， 如 果 待 初始 化 的 线 









































程 是 主线 程 ， 也 就 是 代码 “if (pthread == main_thread)” 的 判断 ， 那 就 将 线程 的 状态 置 为 TASK_RUNNING,， 











因为 主线 程 早 已 经 在 运行 了 。 否 由 
此 置 其 状态 为 TASK_READY。 

在 第 64 行 的 “pthread->elapsed_ticks = 0”， 表 示 线 程 尚 未 执 
pthread->pgdir = NULL ”。 




















65 行将 线程 的 页 表 置 


























thread_start 函数 也 有 了 变化 ， 此 函 
通过 list_append 函数 
按理 说 线程 不 应 该 H 











ASSERT 中 调 


址 &thread_ready_list， 稀 


























现在 就 绪 队 列 thread_ready_list 中 ， 因 
































点 ， 如 果 找 到 就 返 


I 














数 是 创建 线程 的 入 口 , 








的 标签 general_tag 的 地 址 。elem_find 的 功能 是 在 队列 中 找 结 





\ 行 过 。 线 程 没 有 自己 的 地 址 空间 ， 因 此 第 


上 的 话 ， 就 表示 竺 初始 化 的 线程 不 是 主线 程 ， 它 们 的 状态 为 准备 运行 ， 


























要 变化 是 在 执行 完 init_ thread 和 thread_create 后 
新 创建 的 线程 加 入 了 就 绪 队 列 和 全 部 线程 队列 。 拿 就 绪 队 列 来 说 ， 在 加 入 队列 之 前 ， 
此 在 加 入 队列 之 前 ， 先 通过 ASSERT 来 保证 这 一 点 。 
的 是 elem_find(&thread_ready_list, &thread->general_tag), 第 1 个 参数 是 就 绪 队 列 的 地 
2 个 参数 是 新 线程 









































， 耕 则 返回 0。 由 此 可 见 ， 队 列 中 的 结 点 就 是 线程 PCB 中 的 成 员 general_tag。 





这 一 点 可 以 在 接 下 来 的 list_append 中 得 到 验证 ，list_append 的 功能 就 是 在 队列 thread_ready_list 中 加 





入 新 创建 线程 的 general_tag 成 员 ， 














因此 传 入 的 参数 是 general_tag 的 地 址 ， 即 “&thread->general_tag”。 一 

















定 要 清楚 ， 链 表 〈 队 列 ) 中 的 结 点 并 不 是 PCB， 因 此 这 里 并 不 是 把 PCB 加 到 队列 中 ， 我 们 链表 的 结 点 类 
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型 是 struct list_elem， 只 能 将 struct list_elem 类 型 的 结 点 插入 到 队列 中 ， 而 PCB 中 general_tag 的 类 型 就 是 





struct list_elem， 这 是 在 设计 PCB 时 有 意 安 排 的 。 这 样 做 是 有 好 处 的 ，struct list_elem 类 型 中 只 有 两 个 指针 
成 员 : struct list_elem* prev 和 struct list_elem* next， 因 此 它 作 为 结 点 的 话 ， 结 点 尺寸 就 8 字 节 ， 整 个 队列 
显得 轻 量 小 巧 ， 如 果 换 成 PCB 做 结 点 ， 尺 寸 也 太 大 了 

线程 在 内 存 中 的 位 置 是 散落 的 ， 
形成 队列 。 线 程 在 队列 中 的 组 织 结构 如 图 9-11 所 示 。 


















































由 不 同 的 链表 将 它们 各 自 的 general_tag 和 all_list_tag 串联 起 来 , 从 而 



























































各 线程 在 内 存 中 散落 ， 由 链表 将 它们 串联 起 来 








thread_ready_list.head 


all_list tag 
PCB 了 PCB 
\ a 线程 2 / 
general tag general tag 
all_list tag all_list tag 























线程 1 


thread_all_list.head 


pcB 物理 内 存 








general tag 





thread_ready _list.tail 



































线程 3 


thread_all_list.tail 














thread al 

















]_list thread_ready _list 


4 图 9-11 线程 在 队列 中 的 组 织 结构 








接 下 来 的 函数 是 前 面 提 到 过 的 make_main_thread， 它 在 主线 程 的 PCB 中 写 入 线程 信息 。 正 如 前 面 介绍 ， 主 
线程 已 经 跑 起 来 了 ， 所 以 不 需要 再 为 其 申请 页 安装 其 PCB ， 也 不 需要 再 通过 thread_create 构造 它 的 线程 栈 ， 只 需 


























































































































要 通过 init_thread 填充 其 名 称 和 优先 级 。 咱 们 只 有 两 个 队列 ,“ 就 绪 队 列 ” 只 存储 准备 运行 的 线程 ,“ 全 部 队列 ” 
存储 所 有 线程 ， 包 括 就 绪 的、 阻塞 的 、 正 在 执行 的 ， 因 此 ， 只 需要 将 主线 程 加 入 到 全 部 队列 thread_all_list 中 。 























本 节 到 此 结束 ， 下 节 星 





们 介绍 和 调度 相 











9.4.2 任务 调度 器 和 任务 切换 


本 节 要 实现 调度 器 和 作 








E 务 切换 ，j 





























关 的 代码 。 











周 度 器 的 工作 就 是 根据 任务 的 状态 将 其 从 处 理 器 上 换 上 换 下 ， 任 务 的 









































状态 是 咱们 定义 的 ， 因 此 定义 任务 状态 目的 就 是 为 了 方便 虽 们 设计 任务 调度 的 方法 。 您 看 ， 操 作 系统 设计 























并 非 死板 ， 每 个 数据 的 定义 都 是 为 了 “上 E 
调度 器 主要 任务 就 是 读 写 就 绪 队 列 ， 增 删 里 面 的 结 点 ， 结 点 是 线程 PCB 中 的 general_tag,“ 相 当 于 ” 














其 说 ”。 


























线程 的 PCB， 从 队列 中 将 其 取出 时 一 定 要 还 原 成 PCB 才 行 。 

咱们 的 调度 原理 比较 简单 ， 看 看 我 们 是 如 何 自圆其说 的 。 

线程 每 次 在 处 理 器 上 的 执行 时 间 是 由 其 ticks 决定 的 ， 我们 在 初始 化 线程 的 时 候 ， 己 经 将 线程 PCB 中 
的 ticks 赋值 为 prio， 优 先 级 越 高 ，ticks 越 大 。 每 发 生 一 次 时 钟 中 断 ， 时 钟 中 断 的 处 理 程 序 便 将 当前 运行 
线程 的 ticks 减 1。 当 ticks 为 0 时， 时 钟 的 中 断 处 理 程序 调用 调度 器 schedule， 也 就 是 该 把 当前 线程 换 下 




































































处 理 器 了 ， 让 调度 器 选择 另 一 个 线程 上 处 理 
调度 器 是 从 就 绪 队 列 thread_ready_list 中 “取出 ”上 处 理 器 运行 的 线程 ， 所 有 待 执行 的 线程 都 在 




























































































器 。 






































thread_ready_list 中 ， 我 们 的 调度 机 制 很 简单 ， 就 是 Round-Robin Scheduling， 俗 称 RR， 即 轮 询 调度 ， 说 























thread_ready_list 中 保存 ， 


程 。 就 绪 队 列 thread_ready_list 器 











白 了 就 是 让 候选 线程 按 顺 序 一 个 一 个 地 执行 ， 咀 们 就 是 按 先进 先 出 的 顺序 始终 调度 队 头 的 线程 。 注 意 ， 这 
里 说 的 是 “取出 ”， 也 就 是 从 队列 中 弹出 ， 














意思 是 说 队 头 的 线程 被 选中 后 ， 其 结 点 不 会 再 从 就 绪 队 列 




















因此 ， 按 照 先 入 4 


























出 的 顺序 ， 位 于 队 头 的 线程 永远 是 下 一 个 上 处 理 器 运行 的 线 




















FP 的 线程 都 属于 运行 条 件 已 具备 ， 但 还 在 等 待 被 调度 运行 的 线程 ， 因 此 




















thread_ready_list 中 的 线程 的 状态 都 是 TASK_READY。 而 当前 运行 线程 的 状态 为 TASK_RUNNING， 它 仅 
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保存 在 全 部 队列 thread_all list 当中 。 

调度 器 schedule 并 不 仅 由 时 钟 中 断 处 理 程序 来 调用 , 它 还 有 被 其 他 函数 调用 的 情况 ， 比 如 后 面 要 介绍 
的 函数 thread_block。 因 此 ， 在 schedule 中 要 判断 当前 线程 是 出 于 什么 原因 才 “沦落 到 ”要 被 换 下 处 理 器 
的 地 步 。 是 线程 的 时 间 片 到 期 了 ? 还 是 线程 时 间 片 未 到 , 但 它 被 阻塞 了 ， 以 至 于 不 得 不 换 下 处 理 器 ?其 从 
这 就 是 查看 线程 的 状态 ， 如 果 线 程 的 状态 为 TASK_RUNNING， 这 说 明 时 间 片 到 期 了 ， 将 其 ticks 重新 赋 
值 为 它 的 优先 级 prio, 将 其 状态 由 TASK_RUNNING 置 为 TASK_READY, 并 将 其 加 入 到 就 绪 队 列 的 末尾 。 
如 果 状 态 为 其 他 ， 这 不 需要 任何 操作 ， 因 为 调度 器 是 从 就 绪 队 列 中 取出 下 一 个 线程 ， 而 当前 运行 的 线程 并 
不 在 就 绪 队 列 中 。 

调度 器 按照 队列 先进 先 出 的 顺序 , 把 就 绪 队 列 中 的 第 1 个 结 点 作为 下 一 个 要 运行 的 新 线程 ,将 该 线程 的 
状态 置 为 TASK_RUNNING, 之 后 通过 函数 switch_to 将 新 线程 的 寄存 器 环境 恢复 ， 这 样 新 线程 便 开 始 执行 。 

因此 ， 完 整 的 调度 过 程 需要 三 部 分 的 配合 。 

(1) 时 钟 中 断 处 理 函 数 。 

(2) 调度 器 schedule。 

(3) 任务 切换 函数 switch_to。 

以 上 只 是 个 理论 框架 ， 咱 们 按照 这 个 顺序 在 后 面 几 节 介绍 有 具体 的 内 容 。 

1. 注册 时 钟 中 断 处 理 函数 

大 伙 儿 都 知道 , 中 断 处 理 函 数 一 定 得 在 中 断 描 述 符 表 中 ,与 此 中 断 向 量 对 应 的 中 断 描述 符 里 提前 注册 好 
才能 用 。 咱 们 自己 的 中 断 处 理 逻 辑 是 由 kernel.S 提供 统一 的 中 断 入 口 ， 即 中 断 向 量 0 一 30 全 是 用 统一 的 中 断 
处 理 程序 “模板 ” 在 该 模板 中 通过 中 断 向 量 号 调用 中 断 处 理 程序 数组 idt_table 中 的 C 版 本 的 处 理 程序 ， 也 
就 是 文件 kernel.S 中 代码 call [idt_table + %1*4] 的 作用 。 因 此 ， 为 设备 注册 中 断 处 理 程序 的 工作 变 得 很 简单 ， 
我 们 不 用 去 修改 中 断 描述 符 ， 直 接 把 中 断 向 量 作 为 数组 下 标 ， 去 修改 idt_table[ 中 断 问 量 ] 数 组 元 素 即 可 。 

大 伙 儿 还 记得 ， 之 前 的 时 钟 中 断 处 理 函 数 还 是 用 通用 的 函数 来 处 理 的 ， 即 general_intr_handler， 此 函数 作为 
默认 的 中 断 处 理 函 数 , 即 某 个 中 断 源 没有 中 断 处 理 程序 时 才 用 它 来 代替 。 不 过 为 了 调度 方便 ，general_intr_handler 
也 改进 了 一 小 下 ， 那 咱们 先 来 段 小 插曲 ， 看 看 代码 9-8。 
代码 9-8 (project/c9/c/kernel/interrupt.c ) 


74 /* 通用 的 中 断 处 理 函 数 ， 一 般 用 在 异常 出 现时 的 处 理 */ 
75 static void general intr handler (uint8 t vec nr) { 
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76 if (vec nr == 0x27 | vec nr == Ox2f) { 
// 0x2f 是 从 片 8259A 上 的 最 后 一 个 irq 引 脚 ， 保 留 
77 return; //IRQ7 和 IRQ15 会 产生 伪 中 断 ( spurious interrupt ), 无 需 处 理 
78 } 
79 /* 将 光标 置 为 0， 从 屏幕 左上 角 清 出 一 片 打 印 异 常 信息 的 区 域 ， 方 便 阅 读 */ 
80 set cursor (0); 
81 int cursor pos = 0; 
82 while(cursor pos < 320) { 
83 Put char(. Ty 
84 Cursor postt+; 
85 } 
86 
87 set cursor (0) ; // 重 置 光标 为 屏幕 左上 
88 | excetion message begin LIIIIIIINn") 7 
89 set_cursor (88) ; // 从 第 2 行 第 8 个 字符 开始 打印 
90 Put_str(intr name[vec nr]); 
91 if (vec nr == 14) { // 若 为 Pagefault， 将 缺失 的 地 址 打印 出 来 并 悬 停 
92 int page fault vaddr = 0; 
93 asm ("movl %%cr2, $0" : "=r" (page fault vaddr)); 


// cr2 是 存放 造成 page_fault 的 地 址 


94 put_ str("\npage fault addr is ");put int (page fault vaddr); 
95 } 
96 put_str(™\n!l!l!l!l!l!! excetion message end LN 


























97 // 能 进入 中 断 处 理 程序 就 表示 已 经 处 在 关中 断 情况 
98 // 不 会 出 现 调度 进程 的 情况 。 故 下 面 的 死 循环 不 会 再 被 中 断 
99 while (1); 

































































较 之 前 的 版 本 相 比 ， 此 版 本 内 容 虽 然 还 是 很 少 ,但 改进 
是 0~1999)。 
了 分， 因此 这 上 








二 | 


它 接受 一 个 参数 ， 就 是 光标 值 〈 光 标 值 范 
文 从 函数 put_char 的 .set_cursor 剖 





























F print.S : 














地 方 可 不 少 ， 这 里 有 个 新 的 函数 set_cursor， 
它 的 功能 就 是 设置 光标 的 值 ， 其 函数 实现 就 是 



























































不 再 和 


和 独 贴 出 。 








为 什么 需要 这 个 函数 呢 ? 有 时 候 屏幕 上 的 内 容 太 多 了 , 扩 
必须 在 异常 中 将 光标 位 置 纠 1 
可 能 会 造成 异常 的 死 循 环 ， 





常 是 由 光标 错误 值 引 发 的 ， 因 上 
错误 的 光标 值 将 再 次 导致 异常 ， 
9 们 还 是 在 异常 处 理 程序 中 将 其 置 























Et 











为 正确 的 值 。 













































































印 的 提示 信息 不 利用 阅读 。 甚 至 有 时 候 的 异 




















E， 和 否则 在 通过 put_str 输出 报错 信息 的 时 候 ， 











了 | 
a 





大 





此 更 谈 不 上 输出 异常 信息 了 , 所 以 稳妥 起 见 ， 



































开 吊 大 
程序 运行 时 最 后 输出 的 有 用 信息 
出 在 屏幕 左上 角 ， 因 此 先 调用 

为 方便 阅读 ， 在 输 
符 数 是 80 个 ， 因 此 共 320 个 空格 输 
上 角 ， 这 样 异常 信息 将 在 刚刚 清空 
此 外 还 加 进 了 Pagefault 的 处 表 











般 都 在 
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的 地 方 输 昌 


D 
Do 









































出 异常 信息 之 前 先 通过 while 循环 ; 
的 循环 。 接 着 再 次 调用 “set_cursor(0)” 将 光标 置 为 0， 也 就 是 屏幕 左 


屏幕 最 下 方 ,Hh 
“set_cursor(0)” 将 光标 置 为 0。 














们 最 好 不 占 ) 





将 异常 信息 


J 下 方 的 屏幕 ,而 是 




















空 4 行内 容 ， 也 就 是 填 入 了 4 行 空格 ， 一 行 字 














Hea 














EE。Pagefault 就 是 
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常 所 说 的 缺 页 





外 沼 ， 症 > 


开 虽 ， 叫 











表示 虚拟 地 址 对 应 的 物理 地 











口 用 


0 物 








址 不 存在 ， 也 就 是 虚拟 地 址 尚未 在 页 表 中 分 
地 址 会 被 存放 到 控制 寄存 器 CR2 中 ， 我 们 加 
的 值 转 储 到 整 型 变量 page_fault_vaddr 中 ， 并 i 
异常 Pagefault 时 ， 将 会 打印 















































下 





入 的 内 联 汇 多 


出 导致 Pagefault 出 现 的 虚拟 








Fm | 
Lj 











以 后 各 设备 都 会 注册 自 
册 相 应 的 中 断 处 理 程序 ， 这 本 
general_intr_handler 的 功能 是 打印 
要 执行 至 
处 到 


的 ! 


三 
EE AE 


新 处 到 



















































































页 ， 这 样 会 导致 Pagefault 异常 。 导 致 Pagefault 的 虚拟 








通过 put_str 函数 打印 日 
| 





有 代码 就 是 让 Pagefault 发 和 





E 时 ， 将 寄存 器 cr2 中 
bb 来。 因此 ， 如 果 程 序 运行 过 程 中 出 现 
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程序 ， 不 会 再 使 
general_intr_handler 作为 
周 试 信息 并 将 程序 停止 ， 

| general_intr_handler 中 就 表示 出 了 某 些 异常 。 
器 进入 中 断后 会 自动 把 标志 寄存 器 eflags 中 的 正 位 置 0, 即 ， 








general_intr_handler。 我 们 没有 为 各 种 异常 注 
























































因此 ， 通 过 后 面 的 while(1) 语 句 便 能 够 将 程 























口 





general_intr_handler 就 介绍 完了 ， 咱 们 





Na 











专门 的 处 理 函 数 。 我 们 先 看 看 它 的 内 容 是 什么 ， 








序 悬 停 在 此 ， 这 样 便 于 观察 报错 信 
上 正题。 既然 时 钟 中 断 有 专门 的 


通用 的 中 断 处 理 程序 来 “假装 处 理 ” 异 常 的 ， 


通 
也 就 是 提醒 咱们 出 问题 了 ， 该 调试 了 ， 因 此 只 
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行 。 











新 处 理 程序 在 关中 断 的 情况 下 运 


息 
2 上 





E 程 
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j 途 了 ， 我 们 就 要 为 其 





册 

















会 儿 



































先 看 代码 9.9， 这 是 改进 后 的 时 钟 中 断 处 





月 








代码 9-9 
略 
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再 来 说 尘 


E 册 的 事 。 





( project/c9/c/device/timer.c ) 

















oO 
17 uint32 t ticks; // ticks 是 内 核 











33 /* 时 钟 的 中 断 处 理 函 数 */ 
34 static void intr timer handler (void) 
35 











中 断 开启 以 来 总 共 的 咬 哄 数 


struct task struct* cur thread = running thread(); 












































































































































36 

37 ASSERT (cur thread->stack magic == 0x19870916); // 检查 栈 是 否 溢 出 

38 

39 cur thread->elapsed ticks++;  ”// 记录 此 线程 占用 的 cpu 时 间 

40 tickstt+; // 从 内 核 第 一 次 处 理 时 间 中 断后 开始 至 今 的 滴 叭 数 ， 内 核 态 和 用 户 态 总 共 的 哎 数 
41 

42 if (cur thread->ticks == 0) {  // 若 进程 时 间 片 用 完 ， 就 开始 调度 新 的 进程 上 cpu 
43 schequle (); 

44 } else { // 将 当前 进程 的 时 间 片 - 

45 cur thread->ticks-——; 

46 } 

47 } 

48 

49 /* 初始 化 PIT8253 */ 

50 void timer init() { 

5 下 put_str("timer init start\n"); 

52 /* 设置 8253 的 定时 周期 ， 也 就 是 发 中 断 的 周期 */ 

53 frequency set (CONTRERO PORT, \ 


COUNTERO_NO, \ 
READ WRITE LATCH, \ 
COUNTER MODE, \ 
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COUNTERO VALUE ) ; 


54 register handler (0x20, intr timer handler); 
SD put_str("timer init done\n"); 
与 6 站 














计算 机 中 是 用 时 钟 来 表示 节奏 ， 咱 们 也 有 “ 跑 哄 ”来 表示 中 断 次 数 ， 借 以 表示 时 间 。 

代码 9-9 的 开头 定义 了 ticks， 它 用 来 保存 系统 自 开 中 断 以 来 所 运行 的 咬 噶 数 ， 类 似 于 系统 运行 时 长 的 
概念 ， 以 后 在 写 用 户 程 序 的 时 候 也 许 会 用 到 。 

新 创建 的 时 钟 处 理 函数 是 intr_timer_handler， 它 先 通过 “running_thread()” 获 取 当 前 正在 运行 的 线程 ， 
将 其 赋值 给 PCB 指针 cur_thread。 

第 37 行 通过 ASSERT 来 判断 stack_magic 是 否 等 于 0x19870916， 也 就 是 检查 栈 是 否 溢出 ， 破 坏 了 线程 信 
上 息 。 正 常情 况 下 不 会 出 现 栈 滋 出 ， 因 此 只 要 ASSERT 报警 就 表示 哪里 出 了 问题 ， 不 用 处 理 了 ， 直 接 调试 吧 。 
第 39 行 “cur_ thread->elapsed_ticks++”， 将 线程 总 执行 的 时 间 加 1。 

第 40 行 的 ticks++ 将 系统 运行 时 间 加 1， 实 际 上 这 就 是 中 断 发 生 的 次 数 。 

每 个 线程 在 处 理 器 上 运行 期 间 都 会 有 很 多 次 时 钟 中 断 发 生 ， 每 次 中 断 处 理 程序 都 会 将 线程 的 时 间 片 
ticks 减 1。 
第 42 一 46 行 判断 当前 线程 的 时 间 片 ticks 是 否 用 完了 ， 如 果 ticks 等 于 0, 说 明 当前 线程 cur_thread 时 间 片 耗 
尽 ， 该 下 处 理 器 了 ， 此 时 调用 schedule 函数 。 否 则 将 当前 线程 的 时 间 片 ticks 减 1。 

之 后 退出 中 断 处 理 程序 ， 也 就 是 退出 中 断 ， 让 当前 线程 cur_thread 继续 执行 。 

在 下 面 的 timer_init 中 ， 我 们 加 入 了 注册 时 钟 中 断 处 理 程序 的 代码 ， 即 “register_handler(Ox20，intr_timer 
handlen ”，timer_init 是 由 init_all 调用 的 ， 它 在 内 核 运行 开始 处 执行 的 ， 故 ， 时 钟 中 断 会 被 提前 注册 好 。 

下 面 看 看 register_handler 的 实现 原理 ， 见 代码 9-10。 













































































































































































































































































































































































代码 9-10 (project/c9/c/kernel/interrupt.c ) 
… 略 
163 /* 在 中 断 处 理 程序 数组 第 vector_no 个 元 素 中 
注册 安装 中 断 处 理 程序 function */ 
164 void register handler (uint8 t vector no, intr handler function) { 
165 /* idt_table 数组 中 的 函数 是 在 进入 中 断后 根据 中 断 向 量 号 调用 的 
166 * 见 kernel/kernel.S 的 call [idqt table + $1*4] */ 
167 idt table[vector no] = function; 
168 } 
… 略 


register_handler 接受 两 个 参数 ，vector_no 是 中 断 向 量 号 ，function 是 中 断 处理 程 序 。 功 能 是 在 中 断 处 
理 程序 数组 第 vector_no 个 元 素 中 注册 安装 中 断 处 理 程序 function 。 
看 函数 实现 ， 就 是 “idt table[vector_no] = function”， 太 简单 了 是 吧 ? 哈哈 ， 好 ， 本 节 到 此 结束 。 
2. 实现 调度 器 schedule 
本 节 实 现任 务 切换 的 第 二 个 重要 环节 ， 调 度 器 。 
虽然 本 节 为 单独 的 小 节 ， 但 还 是 属于 thread.c 中 的 代码 ， 其 实 代 码 9-11 是 代码 9-7 的 延续 。 


代码 9-11 (project/c9/c/thread/thread.c ) 




































































































































































i 
下 






































103 /* 实现 任务 调度 */ 
104 void schedule () { 

































































105 
106 ASSERT (intr get status() == INTR OFF); 
107 
108 struct task struct* cur = running thread(); 
109 if (cur->status == TASK RUNNING) { 
// 若 此 线程 只 是 cpu 时 间 片 到 了 ， 将 其 加 入 到 就 绪 队 列 尾 
110 ASSERT (!elem find(&thread ready list, &cur->general tag)); 
让 list append(&thread ready list, &cur->general tag); 
112 Cur->ticks = cur->priority; 
// 重新 将 当前 线程 的 ticks 再 重 置 为 其 priority 
lt3 cur->status = TASK READY; 
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114 } else { 

115 /* 若 此 线程 需要 某 事件 发 生 后 才能 继续 上 cpu 运行 ， 
116 不 需要 将 其 加 入 队列 ， 因 为 当前 线程 不 在 就 绪 队 列 中 */ 
117 } 

18 

Tk9 ASSERT(!list empty(&thread ready list)); 

120 thread tag = NULL; // thread tag 清空 








121 /* 将 thread ready_1list 队列 中 
准备 将 其 调度 上 cpu */ 























122 thread tag = list pop(&thread ready list); 

2 struct task struct* next = elem2entry(struct task struct, \ 
general tag, \ thread tag); 

124 next—->status = TASK RUNNING; 

于 之 号 Switch tol(cur, next); 

126 } 

12:7 











schedule 的 原理 之 前 已 介绍 ， 它 的 功能 是 将 当前 线程 换 下 处 理 器 ， 并 在 就 绪 队 列 中 找 出 下 个 可 运行 的 
程序 ， 将 其 换 上 处 理 器 。schedule 主要 内 容 就 是 读 写 就 绪 队 列 ， 因 此 它 不 需要 参数 。 


















































第 108 行 ， 通 过 running_thread0 获 取 了 当前 运行 线程 的 PCB ， 将 其 存 入 PCB 指针 cur 中 《〈 它 就 是 代 


表 cur thread， 只 是 简写 了 )， 接 下 来 的 判断 都 是 基于 cur 的 ， 可见 PCB 对 任务 来 说 确实 是 非常 重要 的 “ 身 





份 证 ”， 操 作 系统 通过 此 身份 证 来 了 解 进程 的 一 切 。 
















































































接 下 来 分 两 种 情况 来 考虑 ， 如 果 当 前 线程 cur 的 时 间 片 到 期 了 ,就 将 其 通过 list_append 函数 重新 加 入 



































为 TASK _ READY。 














到 就 绪 队 列 thread_ready_list。 由 于 此 时 它 的 时 间 片 ticks 已 经 为 0， 为 了 下 次 运行 时 不 至 于 马上 被 换 下 处 
理 器 ， 将 ticks 的 值 再 次 赋值 为 它 的 优先 级 prio， 使 其 下 次 能 够 “ 满 血 复活 ” 最 后 将 





cur 的 状态 status 置 


























如 果 当 前 线程 cur 并 不 是 因为 时 间 片 到 期 而 被 换 下 处 理 器 ， 肯 定 是 由 于 某 种 原因 被 阻塞 了 〈 比 如 对 0 




















值 的 信号 量 进行 P 操作 就 会 让 线程 阻塞， 到 同步 机 制 时 会 介绍 )， 这 时 候 不 需要 处 理 就 绪 队 列 ， 因 为 当前 
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运行 线程 并 不 在 就 绪 队 列 中 ， 

















下 面 是 将 thread_tag 置 为 NULL， 
失败 时 排查 起 来 困难 。 








3 们 下 面 来 看 当前 运行 的 线程 是 如 何 从 就 绪 队 列 中 “出 

我 们 尚未 实现 idle 线程 , 因此 有 可 
(!list_empty(&thread_ready_list))” 来 保障 。 
由 于 它 是 全 局 变量 ， 个 人 习惯 使 用 前 先 将 其 清空 ， 避 免 在 下 面 赋值 














一 | 





队 ” 的 。 




















能 就 绪 队 列 为 空 , 为 避免 这 种 无 线程 可 调度 的 情况 , 暂时 用 “ASSERT 

































































接 下 来 通过 “thread_tag = list_pop(&thread_ready_list)” 从 就 绪 队 列 中 弹出 一 个 可 用 线程 并 存 入 thread_tag。 
注意 啦 ，thread_tag 并 不 是 线程 ， 它 仅仅 是 线程 PCB 中 的 general_tag 或 all_list_tag， 要 获得 线程 的 信息 ， 必 须 


























将 其 转换 成 PCB 才 行 ， 因 此 我 们 用 到 了 宏 elem2entry， 是 时 候 好 好 说 说 它 了 。 
elem2entry 定义 在 list.h 中 ， 我 把 和 它 相 关 的 宏 都 贴 过 来 了 。 


5 #define offset (struct type,member) (int) (& ((struct type*)0)—->member) 
6 #define elem2entry(struct type, struct member name, elem ptr) \ 

















7 (struct type*) ((int)elem ptr 


宏 elem2entry 接受 三 个 参数 ， 咱 人 


参数 elem_ptr 是 待 转换 的 地 址 ， 它 属于 某 个 结构 体 9 





— offset (struct type, struct member name)) 


门 从 后 往 前 说 。 




















所 在 结构 体 中 对 应 地 址 的 成 员 名 字 ， 也 就 是 说 参数 struct_ member_name 是 个 字符 串 ， 参数 $ 
所 属 的 结构 体 的 类 型 。 宏 elem2entry 的 作用 是 将 指针 elem_ptr 转换 成 struct_type 类 型 的 指针 ， 其 原理 是 用 
struct_type 中 的 偏 移 量 ， 此 地 址 差 便 是 结构 体 struct_type 的 起 始 地 址 ， 

















elem_ptr 的 地 址 减 去 elem_ptr 在 结构 体 
最 后 再 将 此 地 址 差 转 换 为 struct_type 指 




































































FP 某 个 成 员 的 地 址 ,参数 struct_member_name 是 elem_ptr 


truct_type 是 elem_ptr 



































针 类 型 。 这 里 涉及 到 了 另外 一 个 宏 offset， 一 会 儿 








咱们 再 讨论 它 。 


























一 般 的 转型 转换 ， 只 是 改变 了 数 和 
址 处 连续 获取 多 少 字 节 的 数据 。 比 如 : 


0x12345678 








int four bytes 
char one bytes 











eal 


Intel 是 小 端 字 节 





四 类 型 ， 并 不 改变 地 址 ， 不 同 的 数据 类 型 仅仅 是 

















(char) four bytes; 


部 ， 因 此 单字 节 变 量 one_bytes 的 值 为 0x78。 





5 诉 编译 器 在 同一 地 
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我 们 这 里 要 做 的 转换 , 不 仅 包 括 类 型 , 还 涉及 到 地 址 的 转换 。 从 队列 中 弹出 的 结 点 元 素 并 不 能 直接 用 ， 
因为 咱们 链表 中 的 结 点 并 不 是 PCB， 而 是 PCB 中 的 general_tag 或 all_list_tag， 需 要 将 它们 转换 成 所 在 的 
PCB 的 地 址 。 比 如 咱们 的 办 公 地 点 是 某 大 厦 七 层 ， 有 人 要 给 咱们 寄 快 递 ， 咱 们 不 能 再 告诉 人 家 楼 层 了 ， 
必须 要 告诉 人 家 大 厦 的 地 址 ,这 种 由 楼 层 地 址 到 大 厦 地 址 的 转换 就 类 似 由 以 上 两 个 tag 的 地 址 到 PCB 的 地 
址 转换 。 

所 以 ， 整 个 转换 过 程 要 分 为 两 步 ， 先 完成 地 址 转换 ， 再 完成 类 型 转 
换 。 另 外 ， 为 叙述 方便 ， 暂 时 将 general tag 和 all_list_tag 统称 为 Xx tag。 | 

虽 们 看 看 x_tag 在 PCB 中 的 布局 ， 如 图 9-12 所 示 。 plod ed 

下 面 开始 讨论 如 何 完成 地 址 转换 。 i 

无 论 PCB 的 地 址 是 多 少 ，x_tag 在 PCB 中 的 偏 移 量 是 固定 的 ， sa PCB 起 始 地 址 
如 果 要 将 它们 的 地 址 转换 成 PCB 地 址 的 话 ， 有 两 种 方法 。 

(1) PCB 是 在 自然 页 的 起 始 地 址 ， 也 就 是 PCB 的 地 址 =Oxfffff000& 
(&(PCB.general_tag))。 

(2) 用 x_tag 的 地 址 减 去 它们 在 PCB 中 的 偏 移 量 。 

我 们 在 函数 running_thread 中 利用 栈 指针 esp 获取 线程 PCB 就 是 用 的 第 1 种 方法 。 似乎 这 种 方法 最 简 
单 ， 但 您 不 想 试 试 第 2 种 方法 吗 ? 看 上 去 似乎 有 点 繁琐 ， 但 也 更 有 魅力 ， 多 学 习 一 种 方法 不 是 更 好 吗 ? 这 
让 我 想起 了 那 句 话 : 折腾 是 对 生命 的 尊重 ， 咀 们 就 用 第 2 种 方法 吧 。 

访问 结构 体 成 员 的 两 种 方法 是 “结构 体 变 量 .成 员 ” 和 “结构 体 指 针 变 量 -> 成 员 ”。 它 们 的 访问 原理 是 
“结构 体 变量 的 地 址 + 成 员 的 偏 移 量 ” 这 种 寻 址 方式 相当 于 “ 基 址 + 变 址 ” 其 中 “结构 体 变量 的 地 址 ” 相 
当 于 基 址 ,“ 成 员 的 偏 移 量 ”相当 于 变 址 ， 可 以 近似 认为 访问 结构 体 成 员 的 方法 等 效 于 “ 基 址 -> 变 址 ” 结 
构 体 成 员 的 地 址 等 于 “&〈 基 址 -> 变 址 )”。 

还 是 看 图 9-12，&PCB 相当 于 基 址 。general_tag 在 PCB 中 的 偏 移 量 = &(PCB.general tag)-&PCB =n， 这 里 的 
&PCB 恰恰 是 趾 们 最 终 要 求解 的 ， 因 此 这 是 绕 了 个 圈子 又 回来 了 。 但 咱们 此 时 关注 的 是 偏 移 量 n， 倘 若 令 
基 址 &PCB 的 值 等 于 0，&(PCB.general_tag) 不 就 等 于 偏 移 量 n 了 吗 。 

因此 , 我 们 有 办 法 直接 获得 x_tag 的 偏 移 量 , 看 看 宏 offset 的 定义 您 就 清楚 了 , 它 接受 两 个 参数 , struct_type 
是 结构 体 类 型 ，member 是 结构 体 成 员 的 名 字 ， 其 核心 代码 “&((struct_type*)0)->member” 则 为 结构 体 成 员 
member 在 结构 体 中 的 偏 移 量 。 

有 了 地 址 后 就 好 说 了 , 咱们 还 差 类 型 转换 没 做 , 现在 再 回头 看 看 宏 elem2entry 的 原理 , 它 将 转换 分 为 两 步 。 
(1) 用 结构 体 成 员 的 地 址 减 去 成 员 在 结构 体 中 的 偏 移 量 ， 先 获取 到 结构 体 起 始 地 址 。 

(2) 再 通过 强制 类 型 转换 将 第 1 步 中 的 地 址 转换 成 结构 体 类 型 。 

好 啦 ， 宏 elem2entry 就 介绍 完了 ， 咱 们 继续 说 代码 ， 插 了 这 么 大 一 段 插曲 有 点 不 适应 了 。 

在 代码 9-11 的 第 123 行 通过 elem2entry 获得 了 新 线程 的 PCB 地 址 ， 将 其 赋值 给 next， 紧 接着 通过 
“next-> status = TASK_ RUNNING” 将 新 线程 的 状态 置 为 TASK_RUNNING， 这 表示 新 线程 next 可 以 上 处 
理 器 了 , 于 是 准备 切换 寄存 器 映像 , 这 是 通过 调用 switch_to 函数 完成 的 , 调用 形式 为 “switch_to(cur next)”， 
意 为 将 线程 cur 的 上 下 文保 护 好 ， 再 将 线程 next 的 上 下 文 装载 到 处 理 器 ， 从 而 完成 了 任务 切换 。 有 关 这 个 
函数 咱们 下 节 再 说 。 

3. 实现 任务 切换 函数 Switch_to 

本 节 是 任务 切换 的 最 后 一 个 环节 ， 任 务 切换 ， 这 是 由 汇编 函数 switch_to 完成 的 工作 。 

操作 系统 存在 的 主要 目的 就 是 方便 人 们 编写 程序 ， 为 了 方便 、 安 全 等 原因 ， 操 作 系统 把 和 硬件 或 安全 
相关 的 工作 自己 独自 揽 下 来 ， 当 然 这 并 不 是 出 于 操作 系统 的 “奉献 ”精神 ， 而 是 把 这 么 重要 的 工作 交 给 别 
人 它 不 放心 ， 操 作 系 统 只 相信 自己 。 这 样 一 来 ， 程 序 所 做 的 完整 工作 可 以 分 为 两 部 分 ， 一 部 分 是 “重要 工 
作 ” 这 由 操作 系统 代码 来 完成 ， 另 一 部 分 是 “普通 工作 ” 这 由 用 户 代 码 完 成 。 比 如 某 程序 想 在 硬盘 上 创 
建文 件 ， 用 户 代 码 的 工作 只 是 提供 文件 名 及 相关 属性 ， 这 属于 普通 工作 ,将 文件 在 硬盘 上 创建 属于 重要 工 
作 ， 这 是 由 操作 系统 完成 的 。 实 际 上 ， 完 整 的 程序 就 也 因此 分 为 两 部 分 ， 一 部 分 是 做 重要 工作 的 内 核 级 代 
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地 址 























































struct task_struct (PCB) 
4 图 9-12 x_tag 在 PCB 中 的 分 布 


































































































































































































































































































































































































































































































































































































































































































































































































9.4 多 线程 调度 



































码 ， 另 一 部 分 就 是 做 普通 工作 的 用 户 级 代码 。 所 以 ,“ 完 整 的 程序 = 用 户 代码 + 内 核 代 码 ”。 而 这 个 完整 的 程 
序 就 是 我 们 所 说 的 任务 ， 也 就 是 线程 或 进程 ， 也 就 是 说 ， 任 务 在 执行 过 程 中 会 执行 用 户 代 码 和 内 核 代 码 ， 
当 处 理 器 处 于 低 特 权 级 下 执行 用 户 代码 时 我 们 称 之 为 用 户 态 ， 当 处 理 器 进入 高 特权 级 执行 到 内 核 代码 时 ， 
我 们 称 之 为 内 核 态 ， 当 处 理 器 从 用 户 代 码 所 在 的 低 特权 级 过 渡 到 内 核 代码 所 在 的 高 特权 级 时 ， 这 称 为 陷入 
内 核 。 因 此 一 定 要 清楚 ， 无 论 是 执行 用 户 代 码 ， 还 是 执行 内 核 代 码 ， 这 些 代 码 都 属于 这 个 完整 的 程序 ， 即 
属于 当前 任务 ， 并 不 是 说 当前 任务 由 用 户 态 进入 内 核 态 后 当前 任务 就 切换 成 内 核 了 ， 这 样 理解 是 不 对 的 。 
王 务 与 任务 的 区 别 在 于 执行 流 一 整套 的 上 下 文 资源 ， 这 包括 寄存 器 映像 、 地 址 空间 、1IO 位 图 等 ， 在 将 来 
介绍 任务 状态 段 TSS 之 后 ， 您 就 会 了 解 这 套 上 下 文 资源 恰恰 就 是 TSS 结构 中 的 内 容 ， 拥 有 这 些 资 源 才 称 
得 上 是 任务 。 因 此 ， 处 理 器 只 有 被 新 的 上 下 文 资源 重新 装载 后 ， 当 前 任务 才 被 替换 为 新 的 任务 ， 这 才 叫 任 
务 切换 。 当 任务 进入 内 核 态 时 ， 其 上 下 文 资源 并 未 完全 蔡 换 ， 只 是 执行 了 “更 厉害 ”的 代码 。 这 有 点 像 咱 
们 在 游戏 中 打 怪 ， 用 不 同 的 武器 打 不 同 的 怪 ， 游 戏 的 人 物 角 色 始 终 没 有 变 。 

用 户 代码 完成 的 普通 工作 当然 就 和 内 核 所 负责 的 “重要 工作 ”没什么 关系 ， 所 以 即使 出 错 了 也 不 会 对 
计算 机 造成 致命 的 伤害 ， 当 程序 需要 做 “重要 工作 ”时 , 就 通过 系统 调用 让 内 核 帮 忙 完成 , 也 就 是 执行 “ 重 
要 工作 ”的 内 核 代 码 。 因 此 ， 任 何 一 个 程序 要 想 完整 地 做 一 件 事 ， 它 必须 执行 两 部 分 代码 ， 这 下 您 应 该 清 
楚 了 ， 我 们 平时 所 写 的 用 户 程序 如 果 需 要 内 核 帮忙 ， 它 顶 多 只 是 个 半成品 (一 点 系统 调用 都 不 需要 的 用 户 
程序 才 算 完整 的 成 品 )， 它 在 执行 过 程 中 需要 与 内 核 代码 组 合成 完整 的 程序 。 有 关 这 一 点 大 伙 儿 可 以 参考 
图 5-18 一 一 进程 共享 操作 系统 和 图 5-19 一 一 完整 的 程序 。 

好 啦 ， 热 身 结束 ， 步 入 正题 。 为 什么 要 保护 任务 的 上 下 文 ? 

每 个 任务 都 有 个 执行 流 ， 这 都 是 事先 规划 好 的 执行 路 径 ， 按 道理 应 该 是 从 头 执行 到 结束 。 不 过 实际 的 
情况 是 执行 流 经 常 被 临时 改道 ， 突 然 就 执行 了 规划 外 的 指令 ， 这 在 多 任务 系统 中 是 很 正常 的 ， 因 为 操作 系 
统 是 由 中 断 驱 动 的 ,每 一 次 中 断 都 将 使 处 理 器 放下 手头 的 工作 转 去 执行 中 断 处 理 程序 。 为 了 在 中 断 处 理 完 
成 后 能 够 恢复 任务 原 有 的 执行 路 径 ， 必 须 在 执行 流 被 改变 前 ， 将 任务 的 上 下 文保 护 好 。 执 行 流 被 改变 后 ， 
在 其 后 续 的 执行 过 程 中 还 可 能 会 再 次 发 生 被 改变 “流向 ”的 情况 ， 也 就 是 说 随 着 执行 的 深入 ， 这 种 改变 的 

























































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































深度 很 可 能 是 多 层 的 。 如 果 希 望 将 来 能 够 返回 到 本 层 的 执行 流 ， 依 然 要 在 改变 前 保护 好 本 层 的 上 下 文 。 总 
之 ， 凡 是 涉及 到 执行 流 的 改变 ， 不 管 被 改变 了 几 层 ， 为 。。 i 
了 将 来 能 够 恢复 到 本 层 继续 执行 ,必须 在 改变 发 生前 将 一] 一 一 一 禾 1 
本 层 执行 流 的 上 下 文保 护 好 。 因 此 ， 执 行 流 被 改变 了 几 [9 [可 
层 就 要 做 几 次 上 下 文保 护 ， 如 图 9-13 所 示 。 

在 咱们 的 系统 中 ， 任 务 调度 是 由 时 钟 中 断 发 起 ， 由 [一 
中 断 处 理 程序 调用 switch_to 函数 实现 的 。 假 设 当前 任 本 
务 在 中 断 发 生前 所 处 的 执行 流 属于 第 一 层 ， 受 时 钟 中 上 
的 影响 ， 处 理 器 会 进入 中 断 处 理 程序 ， 这 使 当前 的 任务 一 
执行 流 被 第 一 次 改变 ， 因 此 在 进入 中 断 时 ， 我 们 要 保护 Ra 
好 第 一 层 的 上 下 文 ， 即 中 断 前 的 任务 状态 。 之 后 在 内 核 
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中 执行 中 断 处 理 程序 ， 这 属于 第 二 层 执 行 流 。 当 中 断 处 
理 程序 调用 任务 切换 函数 switch_to 时 ， 当 前 的 中 断 处 人 
理 程序 又 要 被 中 断 ， 因 此 要 保护 好 第 二 层 的 上 下 文 ， 即 中 断 处 理 过 程 中 的 任务 状态 。 
因此 ， 咱 们 系统 中 的 任务 调度 ， 过 程 中 需要 保护 好 任务 两 层 执行 流 的 上 下 文 ， 这 分 两 部 分 来 完成 。 
第 一 部 分 是 进入 中 断 时 的 保护 , 这 保存 的 是 任务 的 全 部 寄存 器 映像 ， 也 就 是 进入 中 断 前 任务 所 属 第 一 
层 的 状态 ， 这 些 寄 存 器 映像 相当 于 任务 中 用 户 代 码 的 上 下 文 。 

这 些 寄存 器 是 由 kernel.S 中 定义 的 中 断 处 理 入 口 程序 intr%lentry 来 保护 的 ， 里 面 是 一 些 push 寄存 器 
的 指令 ， 这 是 由 汇编 下 的 宏 “%macro VECTOR 2” 定 义 的 ， 因 此 前 面 在 介绍 注册 中 断 处 理 程序 时 曾 称 之 为 
中 断 处 理 程 序 “ 模 板 ”。 当 把 这 些 寄存 器 映像 恢复 到 处 理 器 中 后 ， 任 务 便 完 全 退出 中 断 ， 继 续 执 行 自 己 的 代 
码 部 分 。 换 名 话说 ， 当 恢复 寄存 器 后 ， 如 果 此 任务 是 用 户 进程 ， 任 务 就 完全 恢复 为 用 户 程序 继续 在 用 户 态 下 
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执行 ， 如 果 此 任务 是 内 核 线程 ， 任 务 就 完全 恢复 为 另 一 段 被 中 断 执行 的 内 核 代 码 ， 依 然 是 在 内 核 态 下 运行 。 
第 二 部 分 是 保护 内 核 环境 上 下 文 , 根据 ABI, 除 esp 外 ， 只 保护 esi、edi、ebx 和 ebp 这 4 个 寄存 器 就 够 了 。 
这 4 个 寄存 器 映像 相当 于 任务 中 的 内 核 代 码 的 上 下 文 , 也 就 是 第 二 层 执行 流 , 此 部 分 只 负责 恢复 第 二 层 的 执行 
流 ， 即 恢复 为 在 内 核 的 中 断 处 理 程序 中 继续 执行 的 状态 。 下 面 需要 结合 咱们 的 实现 来 解释 为 什么 这 么 做 了 。 
当 任 务 开始 执行 内 核 代码 后 , 任务 在 内 核 代码 中 的 执行 路 径 由 这 4 个 寄存 器 决定 , 将 来 恢复 这 4 个 寄 
存 器 ， 也 只 是 让 处 理 器 继续 执行 任务 中 的 内 核 代码 ， 并 不 是 让 任务 恢复 到 中 断 前 ， 依 然 还 是 在 内 核 中 。 那 
为 什么 还 要 保护 这 几 个 寄存 器 昵 ? 因为 这 几 个 寄存 器 的 值 会 让 处 理 器 把 程序 执行 到 内 核 代 码 的 结束 处 , 在 
那里 可 以 用 第 一 部 分 中 保护 的 全 部 寄存 器 映像 来 恢复 任务 ， 从 而 退出 中 断 , 使 任务 彻底 恢复 为 进入 中 断 前 
的 状态 。 另 外 ， 其 实 这 4 个 寄存 器 主要 是 用 来 恢复 主 调 函数 的 环境 ， 只 是 当前 我 们 在 讨论 内 核 函 数 。 
中 断 发 生 时 ， 当 前 运行 的 任务 《线程 或 用 户 进程 ) 被 打 断 ， 随 后 会 去 执行 中 断 处 理 程序 ， 不 管 当前 任 
务 在 中 断 前 的 特权 级 是 什么 ， 执行 中 断 处 理 程序 时 肯定 都 是 0 特权 级 。 现 在 咱们 已 经 达成 共识 ,任务 的 代 
码 包 括 用 户 代 码 + 内 核 代码 ， 即 使 是 3 特权 级 的 用 户 进 程 进入 中 断后 ， 当 前 的 任务 依然 是 进入 中 断 前 的 那 
个 任务 ， 只 是 此 任务 目前 陷入 了 内 核 态 ， 执 行 的 是 内 核 的 代码 而 已 ， 并 不 是 我 们 平时 自己 写 的 那 部 分 用 户 
代码 ， 因 此 进入 中 断后 所 执行 的 一 切 内 核 代 码 也 依然 属于 当前 任务 ， 只 是 由 内 核 来 提供 这 一 部 分 而 已 。 
内 核 代 码 也 是 人 为 设计 出 来 的 , 这 套 代码 保证 了 任务 进入 中 断后 也 能 顺利 退出 中 断 并 恢复 到 中 断 前 的 
状态 。 强 调 了 这 么 久 , 无 非 是 想 和 大 家 说 ， 站 都 拥有 这 同 
一 套 上 下 文 资源 ， 无 论 任务 是 出 于 何 种 原因 号 处 内 核 ， 作 为 一 个 能 够 “自圆其说 ”的 系统 ， 既 然 能 够 让 任 
务 进 到 内 核 ， 就 同样 得 能 让 任务 从 内 核 中 走出 去 ， 因 此 任务 在 进入 内 核 后 ， 无 论 中 间 过 程 有 多 少 分 支 ， 最 
终 一 定 会 走 到 出 口 ， 从 而 退出 内 核 中 断 。 
虽然 内 核 代 码 是 任务 的 一 部 分 ， 但 任务 不 可 能 老 留 在 内 核 中 做 客 ， 毕 竟 这 种 中 断 只 是 临时 的 ， 它 还 得 
赶紧 回去 忙 其 他 事 呢 ， 因 此 内 核 代码 有 责任 包含 使 任务 回去 的 “出 口 ”。 咱 们 是 在 内 核 中 实现 线程 机 制 的 ， 
因此 任务 切换 由 内 核 代码 完成 ， 这 表示 当前 任务 还 未 执行 到 “出 口 ” 就 会 被 换 下 处 理 器 停止 执行 ,“ 出 口 ” 
在 剩 下 未 执行 的 代码 中 ， 待 将 来 再 次 被 调度 到 处 理 器 上 才 会 继续 执行 ， 才 会 找到 “出 口 ” 因此 ， 为 了 
务 在 将 来 再 次 被 换 上 处 晶 器 时 能 够 顺利 地 找到 退出 中 断 的 出 口 , 我 们 更 有 理由 在 任务 切换 前 把 任务 的 内 
上 下 文保 护 好 ， 这样 当 该 任务 再 次 被 换 上 处 理 器 时 ， 才 能 继续 把 剩 下 的 内 核 代 码 执行 完 ， 任 务 才 能 找到 
去 的 路 ， 也 就 是 返回 到 进入 中 断 前 的 状态 ， 继 续 执行 未 完成 第 一 层 执 行 流 的 工作 。 我 们 所 提 的 “出 
指 kernel.S 中 的 intr_exit, 这 是 退出 中 断 的 出 口 , 中 断 处 理 完 成 后 , 执行 流程 会 通过 jmp intr_exit 跳 转 到 此 
此 处 的 指令 会 用 进入 中 断 时 保护 的 寄存 器 映像 装载 处 理 器 ， 从 而 彻底 走出 中 断 ， 恢 复 任 务 。 


总 结 


(1) 上 上 下 文保 护 的 第 一 部 分 负责 保存 任务 进入 中 断 前 的 全 部 寄存 器 ， 目 的 是 能 让 任务 恢复 到 中 断 前 。 

(2) 上 下 文保 护 的 第 三 部 分 负责 保存 这 4 个 寄存 器 : esi、edi、ebx 和 ebp， 目的 是 让 任务 恢复 执行 在 
任务 切换 发 生 时 剩 下 尚未 执行 的 内 核 代 码 ， 保 证 顺利 走 到 退出 中 断 的 出 口 ， 利 用 第 一 部 分 保护 的 寄存 器 环 
境 彻 底 恢 复 任务 。 

好 啦 ， 扯 得 够 多 了 ,任务 上 下 文保 护 的 第 一 部 分 已 经 在 kernel.S 中 由 intr%lentry 完成 ， 咱 们 现在 要 完 
成 第 二 部 分 。 给 大 伙 儿 上 代码 ， 本 节 在 thread 目录 下 创建 了 switch.S 文件 ， 其 中 的 函数 switch_to 用 于 任 
务 切 换 ， 详 情 请 看 代码 9-12。 
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代码 9-12 (project/c9/c/ thread/switch.S ) 
1 [bits 32] 
2 section .text 
3 global switch to 
4 switch t 





5 ; 栈 中 此 处 是 返回 地 址 
6 push esi 

3 push edi 

8 push ebx 

9 push ebp 
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| mov eax，， [esp + 20]; 得 到 栈 中 的 参数 cur，cur = [esp+20] _ 
12 mov [eax], esp ; 保存 栈 顶 指针 esp. task_ struct 的 self kstack 字段 
13 ; self kstack 在 task struct 中 的 偏 移 为 0 
14 ; 所 以 直接 往 thread 开头 处 存 4 字 节 便 可 
15 生生 大 = 竺 以 上 是 备份 当前 线程 的 环境 ， 下 面 是 恢复 下 一 个 线程 的 环境 --------- 
16 mov eax, [esp + 24] ; 得 到 栈 中 的 参数 next ，next = [esp+24] 
17 mov esp, [eax] ; pcb 的 第 一 个 成 员 是 self kstack 成 员 

来 记录 0 级 栈 顶 指针 ， 被 换 上 cpu 时 用 来 恢复 0 级 栈 












































Fal 
18 ; 0 级 栈 中 保存 了 进程 或 线程 所 有 信息 ， 包 括 3 级 栈 指针 
























































19 pop ebp 

20 pop ebx 

21 pop edi 

22 pop esi 

23 ret ; 返回 到 上 面 switch to 下 面 的 那 句 注释 的 返回 地 址 ， 

24 ; 未 由 中 断 进入 ， 第 一 次 执行 时 会 返回 到 kernel thread 












































switch.S 其 实 就 写 了 一 个 函数 switch_to， 此 函数 接受 两 个 参数 ， 第 1 个 参数 是 当前 线程 cur， 第 2 个 
参数 是 下 一 个 上 处 理 器 的 线程 ， 此 函数 的 功能 是 保存 cur 线程 的 寄存 器 映像 ,将 下 一 个 线程 next 的 寄存 器 
映像 装载 到 处 理 器 。 

程序 第 3 行 global switch_to 将 函数 switch_to 导出 为 全 局 符 写 ， 这 样 thread.c 中 的 schedule 便 能 够 使 用 它 了 。 
第 6 一 9 行 是 遵循 ABI 原则 ， 保 护 好 esi、edi、ebx、ebp 寄存 器 ， 在 函数 的 开头 进行 寄存 器 保护 是 个 
好 习惯 ， 避 免 后 面 的 操作 会 影响 它们 的 值 。 栈 是 自 高 地 址 向 低地 址 扩展 的 ， 因 此 这 4 个 push 操作 步骤 与 
线程 栈 struct thread_stack 的 结构 是 逆序 的 。 顺 便 强调 一 句 ， 线 程 栈 struct thread_stack 仅仅 是 个 数据 结构 ， 
是 个 存储 数据 的 格式 ， 表 述 了 结构 中 各 成 员 的 存储 顺序 ， 我 们 仅仅 按照 此 格式 中 数据 成 员 的 顺序 来 压 栈 ， 
























































































































































































































































所 以 它 并 不 一 定 在 某 个 固定 的 内 存 位 置 。 任务 切换 时 的 楼 
我 们 先 看 下 此 时 栈 中 的 情况 ， 如 图 9-14 所 示 。 地 址 [高 
9-14 中 最 下 面 的 4 个 寄存 器 是 咱们 进入 switch_to 时 压 入 的 ， 咱 们 要 关注 i 
的 是 switch_to 的 两 个 参数 ，cur 和 next 的 位 置 。 ee 本 
在 PCB 结构 struct task_struct 中 ， 第 一 个 成 员 是 self_kstack， 它 用 来 记录 每 返回 地 址 | +4*4 
个 线程 自己 的 栈 顶 指针 。 我 们 已 经 知道 , 任务 在 内 核 中 的 寄存 器 映像 是 保存 在 栈 和 Eh 
中 的 ， 这 正 是 进入 switch_to 函数 时 立即 把 那 4 个 寄存 器 入 栈 的 原因 。 任 务 在 下 te | 
次 被 调度 运行 时 ， 还 得 把 寄存 器 映像 从 栈 中 恢复 ， 因 此 ， 为 了 恢复 寄存 器 映像 ， ebp | ESsP 
先 得 知道 寄存 器 映像 被 保存 在 哪个 栈 中 , 也 就 是 咱们 得 在 切换 前 把 当前 的 栈 指针 一 







































































保存 在 某 个 地 方 ， 下 次 再 被 调度 上 处 理 器 前 ， 再 从 相同 的 地 方 恢 复 栈 指针 ， 将 栈 “图 9 14 syiton to 中 的 本 
中 的 寄存 器 映像 重新 装载 到 处 理 器 。 为 了 方便 编程 ， 这 个 地 方 就 选 PCB 中 的 成 员 self_kstack。 当 然 这 是 有 
意 为 之 的 ，self_kstack 在 PCB 中 的 偏 移 量 为 0， 因 此 在 后 面 可 以 直接 用 PCB 的 地 址 作为 保存 esp。 

您 看 ， switch_to 和 PCB 是 配合 工作 的 , 在 switch_to 中 self_kstack 已 被 固定 引用 为 偏 移 PCB 0 字 节 的 
地 方 ， 因 此 必须 要 把 self_kstack 放 在 PCB 的 起 始 处 ， 即 task_struct 的 开头 。 
第 11 行 的 “mov eax, [esp + 20]” 结合 图 9-13 可 发 现 ， 其 中 “[esp + 20]” 是 为 了 获取 栈 中 cur 的 值 ， 
也 就 是 当前 线程 的 PCB 地址， 再 将 它 mov 到 寄存 器 eax 中 ， 因 为 self_kstack 在 PCB 中 偏 移 为 0， 所 以 此 
时 eax 可 以 认为 是 当前 线程 PCB 中 self_kstack 的 地 址 。 
第 12 行 mov [eax], esp 将 当前 栈 顶 指针 esp 保存 到 当前 线程 PCB 中 的 self_kstack 成 员 中 。 
好 啦 ， 至 此 ， 当 前 线程 的 上 下 文 环 境 算是 保存 完毕 。 下 面 要 准备 往 处 理 器 上 装载 新 线程 的 上 下 文 啦 。 
第 16 行 “mov eax, [esp + 24]” 结合 图 9-13， 其 中 “[esp + 24]” 是 为 了 获取 栈 中 的 next 的 值 ， 也 就 
是 next 线程 的 PCB 地 址 ,之 后 将 它 mov 到 寄存 器 eax, 同样 此 时 eax 可 以 认为 是 next 线 程 PCB 中 self_kstack 
的 地 址 。 因 此 ,“[eax]” 中 保存 的 是 next 线程 的 栈 指针 。 
第 17 行 “mov esp, [eax]” 是 将 next 线程 的 栈 指针 恢复 到 esp 中 ， 经 过 这 一 步 后 便 找到 了 next 线程 的 
栈 ， 从 而 可 以 从 栈 中 恢复 之 前 保存 过 的 寄存 器 映像 。 

接 下 来 的 第 19 一 22 行 按 照 寄存 器 保存 的 道 顺序 ， 依 次 从 栈 中 弹出 。 
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注意 ， 不 要 误 以 为 此 时 恢复 的 寄存 器 映像 是 在 上 面 刚刚 保存 过 的 那些 寄存 器 。 在 同一 次 switch_to 的 调用 执 
行 中 ， 第 15 行 之 前 保存 的 寄存 器 属于 当前 线程 cur， 第 15 行 之 后 恢复 的 寄存 器 映像 属于 下 一 个 上 处 理 器 运行 的 
线程 next， 这 些 被 恢复 的 寄存 器 映像 是 在 之 前 某 次 执行 switch_to 时 ， 由 现在 的 这 个 next 线程 作为 那 时 候 的 当前 
线程 cur， 被 换 下 处 理 器 前 保存 的 ， 也 是 用 前 15 行 代码 保存 的 ， 只 是 它们 分 属于 不 同 的 switch_to 调用 次 序 。 
第 23 行 的 ret 便 将 当前 栈 顶 处 的 值 作为 返回 地 址 加 载 到 处 理 器 的 eip 寄存 器 中 , 从 而 使 next 线程 的 代 
码 恢复 执行 。 

如 果 此 时 的 next 线程 之 前 尚未 执行 过 ， 马 上 开始 的 是 第 一 次 执行 ,此 时 栈 顶 的 值 是 函数 kernel_thread 
的 地 址 ， 这 是 由 thread_create 函数 设置 的 ， 执 行 ret 指令 后 处 理 器 将 去 执行 函数 kernel_ thread。 如 果 next 
之 前 已 经 执行 过 了 ， 这 次 是 再 次 将 其 调度 到 处 理 器 的 话 ， 此 时 栈 项 的 值 是 由 调用 函数 switch_to 的 主 调 函 
数 schedule 留 下 的 ， 这 会 继续 执行 schedule 后 面 的 流程 。 而 switch_to 是 schedule 最 后 一 名 代码 ， 因 此 执 
行 流程 马上 回 到 schedule 的 调用 者 intr_timer_handler 中 。schedule 同样 也 是 intr_timer_handler 中 最 后 一 句 
代码 ， 因 此 会 完成 intr_timer_handler， 回 到 kernel.S 中 的 jmp intr_exit， 从 而 恢复 任务 的 全 部 寄存 器 映像 ， 
之 后 通过 iretd 指令 退出 中 断 ， 任 务 被 完全 彻底 地 恢复 。 

switch_to 到 这 就 结束 了 ， 它 略微 有 些 难 懂 ， 这 主要 体现 在 。 

(1) switch_to 的 操作 对 象 是 线程 栈 struct thread_stack， 对 栈 中 的 返回 地 址 及 参数 的 设置 可 能 会 感 
有 点 糊涂 。 因 此 建议 别 只 看 局 部 ， 从 全 局 上 看 kernel.S、interrupt.c、timer.c、thread.c， 它 们 之 间 是 密切 
配合 的 。 

(2) 上 下 文 的 保护 工作 分 为 两 部 分 ， 第 一 部 分 用 于 恢复 中 断 前 的 状态 ， 这 相对 好 理解 。 
switch_to 完成 的 是 第 二 部 分 ， 用 于 任务 切换 后 恢复 执行 中 断 处 理 程序 中 的 后 续 代码 。 

小 弟 虽 然 已 经 尽力 做 到 狂 开 了 、 揉 碎 了 的 解释 ， 但 如 果 不 跟 一 下 代码 的 话 还 是 不 容易 理解 ， 下 一 节 咱 
们 得 上 机 测试 一 下 了 。 

4. 启用 线程 调度 

前 面 的 基础 部 分 完成 得 差不多 了 ， 为 了 让 线程 调度 跑 起 来 ， 现 在 还 要 修改 几 个 地 方 。 先 看 代码 9-13， 
在 thread.c 中 加 入 线程 相关 信息 的 初始 化 。 


代码 9-13 (project/c9/c/ thread/thread.c ) 
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… 略 
128 /* 初始 化 线程 环境 */ 
129 void thread init (void) { 


130 put str("thread init start\n"); 
L131 list init(&thread ready list); 
132 list init(&thread all list); 
133 /* 将 当前 main 函数 创建 为 线程 x/ 

134 make main thread(); 

E35 put_str("thread init done\n"); 
136 } 

:3 了 7 


在 代码 9-13 中 就 做 了 三 件 事 ,通过 list_init 函数 将 就 绪 队 列 thread_ready_list 和 全 部 队列 thread_all_list 
初始 化 ， 初 始 化 的 内 容 就 是 将 队列 为 空 ， 也 就 是 使 队列 首尾 相 接 。 

再 通过 函数 make_main_thread 将 当前 已 运行 的 主 函 数 封装 为 线程 ， 本 质 上 就 是 在 其 PCB 中 写 入 了 线 
程 信息 。 

好 啦 ， 记 得 把 thread_init 加 入 到 initc 中 ， 这 个 就 一 句 话 的 事 ， 不 用 再 贴 代 码 了 ， 大 伙 儿 看 代码 实例 吧 。 
咱们 看 看 如 何在 main.c 中 创建 多 个 线程 吧 。 请 看 代码 9-14。 


代码 9-14 (project/c9/c/kernel/main.c ) 
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… 略 

6 void k thread a(voidqx) 7 

7 void k thread b (void*); 

8 int main(void) { 

9 put_str("I am kernel\n"); 
10 init all(); 
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汪汪 

2 thread start ("k thread a", 31, k thread a, "argA ") 7 
.3 thread start ("k thread b", 8, k thread b, "argB ");} 
14 

15 intr enable() ;// 打开 中 断 ， 使 时 钟 中 断 起 作 

16 while(1) { 

3 put_ str ("Main "™); 

18 ja 

19 return 0; 

20 } 

21 





22 /* 在 线程 中 运行 的 函数 */ 
23 void k thread al(lvoid* arg) { 
24 /* 用 voidx 来 通用 表示 参数 ， 





































































































被 调用 的 函数 知道 自己 需要 什么 类 型 的 参数 ， 自 己 转换 再 用 */ 
25 char* para = arg; 
26 while(1) 
27 put_str (para); 
28 
29 } 
30 
31 /* 在 线程 中 运行 的 函数 */ 





32 void k thread _b (void* arg) { 
33 /Q* void* 来 通用 表示 参 





































































































被 调用 的 函数 知道 自己 己 需要 什 类 型 的 参数 ， 自 己 转 换 *y 
34 char* para = arg; 
35 while (1) 
36 put stripara}y 
37 
38 } 


main.c 中 ， 增 加 了 一 个 函数 k_thread_b， 它 同 k_thread_a 是 一 样 的 ， 循 环 打印 参数 arg。 

我 们 在 第 11 一 12 行 通过 thread_start 函数 把 k_thread_a 和 k_thread_b 封装 为 线程 ， 传 入 的 参数 分 别 是 
“argA ”和 “argB ” 注意 ,参数 字符 串 结尾 处 有 个 空格 。 另 外 ， 我 们 给 k_thread_a 的 优先 级 为 31，K_thread_b 
的 优先 级 为 8， 按理 说 ， 屏 幕 上 打印 的 字符 串 “argA ”的 数量 大 约 为 “argB ”的 4 倍 ， 一 会 儿 我们 看 看 
是 不 是 这 样 。 
第 15 行 通过 intr_enable 将 中 断 打 开 ， 目 前 我 们 在 8259A 中 只 打开 了 时 钟 中 断 ， 因 此 ， 时 钟 中 断 对 应 
的 中 断 处 理 程 序 会 引发 调度 。 

另外 ， 我 们 已 经 将 main 函数 在 thread_init 中 通过 make_main_thread 封装 为 线程 ， 其 优先 级 为 31， 
此 main 中 第 17 行 的 循环 打印 "Main "也 会 不 断 被 调度 。 

好 啦 ， 大 家 自行 更 新 makefile， 我 就 直接 上 效果 图 啦 ， 如 
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9-15 所 示 。 
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I am kernel 
init_all 
idt_init start 
idt_desc_init done 
pic_init done 
idt_init done 
em_init start 
mem_pool_init start 
kernel pool bitmap_star 99h0699 kernel_pool_phu_addr_start 
uUSer_pool_bitmap 3 A1EQ user pool phy addr start:116¢ 
mem_ pool_init done 
done 
_init start 
_init done 
timer_init start 
timer_ init done 
Main Main Main Main Main Main Mai i i ain Main 
Main Main Main Main Main Main i i i EY 
Main Main Main i i i i i i 本 ET 
argh argf argf 0 6 6 4 argf 
argh argh argf "gf ar ar 避 r P argf 
ar B ET B Ev3 B EY B EY B ET 四 ET Bar BE 和 ED B ED B 


i | | | | 1 上 
4 图 9-15 不 同 优先 级 线程 调度 


您 看 ， 三 个 线程 分 别 打 印 了 自己 的 参数 ， 字 符 串 “Main ”和 “argA ”的 数量 差不多 ， 因 为 它们 的 优 
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图 9-15 : 
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9-16 所 示 。 
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破碎 、 惨 不 忍 睹 ”的 情景 ， 
上 方 报 出 了 “#GP General Protection Exception”， 即 一 般 保护 性 异 
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尽管 我 们 可 














了 获取 它 的 地 址 ， 这 上 
Eee DIE Di 
此 地 址 在 bochs 中 通过 lb 命令 设置 断 点 ， 如 图 9-18 





以 在 内 核 文 件 的 加 载 地 
些 。 咱 们 不 是 在 main.c 中 调用 
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开始 时 就 执行 了 show extint， 这 会 严重 拖 慢 

















常 发 生 的 时 间 点 。1 
出售 无 论 是 硬 中 断 、 
此 直接 执行 show exti 
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下 来 ， 但 为 了 顺便 多 演示 








thread_start 函数 创建 了 线程 吗 ? 恬 
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命令 ， 如 图 9-17 所 示 。 





到 9-17 nm 命令 查看 符号 地 址 
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字符 串 中 的 所 有 字 


空格 外 ， 


] 尽 量 在 离 发 生 GP 异 


， 最 后 一 











符 便 








儿 贴 个 图 











先 配 合 一 下 ， 先 假装 不 知道 ， 或 者 跳 过 相关 章节 。 
数 general_intr_handler 改 为 了 打印 报错 信 
“幸运 的 。 


释 每 一 步 


3 们 是 利用 


软 中 断 或 
nt 比较 直 
常 近 











的 地 址 处 


[work@localhost c]$ nm build/kernel .bin 1grep thread_start 
c0002ed4 T thread_start 
[work@localhost c]$ 目 


<bochs:1> lb 0xc9002ed4 
<bochs:2> c 
(9) Breakpoint 1, Oxc0002ed4 in ?? () 
Next at t=18111683 
(9) [OQx000000002ed4] 0008:c0002ed4 (unk. ctxt): push ebp 
<bochs:3> info b 
Num Type Disp Enb Address 
1 lbreakpoint keep y 0xc9002ed4 
<bochs:4> d 1 


<bochs:5> info b 

Num Type Disp Enb Address 
<bochs:6> Show extint 

show external interrupts: ON 


show mask is: extint 


: exception (not softint) 0008:c9001f39 (9xc9001f39) 
: exception (not softint) 0001f39 (9xc9001f39) 
: exception (not softint) 0001f39 (0xc9001f39) 
: exception (not softint) 0001f39 (9xc9001f39) 
: exception (not softint) 0001f39 (OQxc0001f39) 
: exception (not softint) 0001f39 (9xc9001f39) 
: exception (not softint) 90008:c96001d2b (QOxc0001d2b) 
^CNext at t=134183107 

(9) [9x960000001818] 96008:c9001818 (unk. ctxt): jmp .-2 (Oxc0001818) 


<bochs:8> | 








4 图 9-18 ”调试 过 程 


在 键入 命令 c 后 ， 程 序 执行 到 断 点 处 。 由 于 thread_start 我 们 在 main.c 中 调用 了 两 次 ， 所 以 程序 
会 再 次 在 相同 地 址 处 停 下 来 ， 因 此 先 将 此 断 点 删除 。 
通过 info b 命令 查看 当前 的 断 点 ， 就 这 一 个 ， 因 此 其 num 为 1。 将 此 num 作为 断 点 删除 命令 d 的 参 
数 ， 在 执行 命令 d 1 1 后 该 断 点 就 被 出 除了 。 再 次 执行 mnfo b 命令 ， 断 点 结果 集 为 空 。 

是 时 候 执行 show extint 了 ,之 后 控制 台 上 会 源源 不 断 打印 中 断 信 息 ， 太 长 了 ， 因 此 我 略 过 了 一 些 。 直 
1 台 上 不 再 输出 中 断 信 息 时 ， 这 说 明 程 序 此 时 已 经 进入 了 general_intr_handler 函数 中 的 while(1) 死 循 


环 ， 这 时 屏幕 上 已 经 开始 打印 “#GP General Protection Exception”， 这 与 咱们 的 判断 相符 。 

a a de a 
这 表示 GP 异常 发 生 的 时 间 ， 此 时 间 点 前 的 指令 必然 是 导致 异常 的 原因 ， 因 此 我 们 将 此 值 减 1， 用 19814326 
作为 时 间 点 断 点 。 继 续 看 图 9-19。 


<bochs:1> sba 19814326 
Time breakpoint inserted. Delta = 19814326 
<bochs:2> c 
(9) Caught time breakpoint 
Next at t=19814326 
(9) [9x0600060001fd6] 90008:c9001fd6 (unk. ctxt): mov byte ptr gs:[bx], cl ; 6567 
880f 
<bochs:3> r 
: 9xcg90gcfcf -1073688625 
: Qx00000020 32 
: 9xc90003d5 -1073740843 
: 9xc96009f9e -1073700962 
: 90xc9101de4 -1072685596 
: 90xc9101e40 -1072685504 
i: OQx00000000 0 
i: Qx000000060 9 
: 9xc96001fd0 
eflags Qx00000283: id vip vif ac vm rf nt IOPL=0 of df IF tf SF zf af pf 
<bochs:4> info gdt 
Global Descriptor Table (base=0Qxc0000900, limit=31): 
GDT[Ox00]=??? descriptor hi=0Qx00000000, lo0=0x00000000 
GDT[Qx01]=Code segment, base=0x00000000, limit=Qxffffffff, Execute-Only, Non-Con 
forming, Accessed, 32-bit 
GDT[0x62]=Data segment, base=0x00000000, limit=Qxffffffff, Read/Write, Accessed 
GDT[Ox03]=Data segment, base=0xcO0b8000, limit=0xQ0007fff, Read/Write, Accessed 
You can List individual entries with 'info gdt [NUM]' or groups with "info gdt [ 
[NUM]' 















































I 




































































































































































































































































00000000.. .90007fff)! 


.etxt)s nop 


Next at t=19814328 
(9) [Ox000000001d2c] 06008:c9901d2c (unk. ctxt): push ds 


4 图 9-19 调试 过 程 ( 续 ) 
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上 了 寄存 器 ebx 的 值 ， 先 不 急 ， 咀 们 先 通过 
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插入 时 间 点 断 点 的 命令 是 sba, 我 们 执行 了 sba 19814326 后 , 键入 命令 c 持续 执行 ， 直 到 断 点 处 停 下 来 。 
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全 分 


比 很 可 
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查看 通 











打印 功能 的 底层 实现 。mov 
能 是 访问 内 存 时 出 ] 
寄存 器 。 您 看 ， 其 ! 


命令 仅仅 涉及 到 寄 
问题 ， 这 里 的 内 存 寻 址 用 
ebx 的 值 为 0xc0009f9e， 






































的 值 为 0x9f9e， 哦 ! 如 果 您 熟悉 显存 段 描述 符 ， 似 乎 找到 问题 了 。 
地 址 范围 为 0xb8000 一 0Oxbffff，6 
设置 的 ， 因 此 段 基 址 为 0xb8000， 段 大 小 为 0xcffff-0xb8000=0x7fff， 寄 




















们 的 显存 段 描述 符 是 按照 此 范围 来 
存 器 bx 用 作 显存 段 内 的 偏 移 量 ， 
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字 节 之 内 的 显存 ， 也 就 是 : 
能 超过 0xbffff， 原 因 是 由 于 
初衷 是 图 简单 省 事 ， 人 否则 显 
] info gdt 命令 输出 了 安装 的 段 描述 符 信 ， 
base 为 0xc00b8000, 段 界限 limit 为 0x00007fff, 因此 实际 的 



































根据 图 





9-19， 



































卡 操作 可 不 会 这 么 简单 。 











的 值 是 0x9f9e， 明 显 已 经 越界 了 。 更 何况 ， 























咱们 的 显存 操作 范围 仅 限 于 4000 























5 存 范围 是 0xb8000 一 0xb8fa0， 因 此 不 会 
们 的 滚屏 操作 中 有 相关 的 判断 ， 当 超过 2000 个 字 时 就 会 滚屏 了 ， 这 样 做 的 





电 ， 其 中 

















到 0xb8fal 一 0Oxbffff 的 范围 ， 更 不 可 






































GDT[0x03] 便 是 显存 段 描述 符 ， 其 段 基 址 


























即 0xc00b8000 一 0xcOObffff 。 


寄存 器 bx 的 值 0x9f9e 明显 已 经 超过 了 段 界 限 limit 的 值 0x7fff， 在 特权 检查 时 


会 报 GP 异常 。 


CPU 的 各 种 检测 。 
应 的 段 的 limit。 


error_code 位 ， 下 面 





咱们 用 



































紧 接 着 我 














护 代 码 。 


计 

















显存 段 范 转 
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的 指 





令 push ds 又 进 








导致 异常 的 表面 
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单 步 执 行 命令 s 执行 了 这 条 引发 异常 的 指令 ， 
步 验证 了 这 一 想法 ， 这 是 kernel.S 中 进入 : 


为 0xc00b8000~ (0xc00b8000+0x7fff)， 


Es 








然 无 法 通过 ， 所 以 才 


























查看 内 存 的 命令 x 试探 一 下 该 地 址 便 知 ， 如 果 该 地 址 可 以 被 正常 访问 的 话 , 说 明 该 地 址 通过 了 
您 看 ， 在 执行 了 x gs:bx 后 ， 控 制 台 上 果然 输出 了 warning， 提 示 超 过 了 选择 子 0x18 对 









































果然 进入 了 ! 








断 ，nop 便 是 充当 异常 的 
断 时 的 上 下 文保 


























因 找 到 了 ,但 根本 原因 目前 还 是 不 知道 ， 上 


看 寄存 器 bx 的 值 0x9f9e 是 哪 来 的 呢 ? 




















其 实 这 个 问题 还 是 有 点 复杂 的 ， 我 们 还 是 得 专门 用 一 个 章节 讲 它 ， 我 们 还 是 在 下 一 章 的 同步 机 制 中 


F 解 。 
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本 章 将 实现 简单 的 输入 输出 ， 它 是 我 
还 没 实现 呢 ，shell 交互 是 很 久 以 后 的 


CLS 


好 
1 





上 一 章 中 我 们 遇 到 的 
互 斥 的 方法 来 保证 操作 的 原子 性 。 





同步 机 制 一 一 锁 
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第 10 登 







































































昆 瑟 和 GP 异常 问题 ,根本 原因 是 由 于 临界 
其 实学 过 操作 系统 课程 的 读者 早 就 提前 知道 了 答案 。 



































































































































区 代码 的 资源 竞争 ， 这 需 
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输入 输出 系统 


们 将 来 能 通过 shell 命令 同系 统 交 互 的 基础 。 话 说 我 们 用 户 进 程 


ls 




















10.1.1 排查 GP 异常 ， 理 解 原 子 操作 

上 一 节 中 ， 咱 们 重点 考察 的 是 引起 GP 异常 的 原因 是 寄存 器 bx 的 值 0x9f9e 超过 了 显存 段 的 范围 ， 从 
而 在 特权 检查 时 引起 了 安全 保护 ， 这 只 是 表面 的 现象 ， 我 们 依然 无 法 解决 问题 。 因 此 咱们 必须 得 清楚 此 值 
是 怎么 来 的 ， 知 道 了 这 个 原因 后 才能 从 根本 上 把 问题 解决 。 

咱们 先 分 析 下 待 解 决 的 几 个 问题 。 

(1) 图 9-15 的 输出 中 ， 有 些 字符 串 看 似 少 了 字符 

(2) 图 9-16 的 输出 中 ， 有 大 片 连续 的 空缺 。 

(3) 图 9-16 的 GP 异常 。 

前 两 个 其 实 是 有 “共性 ”的 ， 都 是 字符 打印 混乱 的 问题 ， 第 3 个 问题 看 似 “ 较 独立 ” 但 解决 起 来 似 
乎 难度 很 大 ， 要 不 咱们 先 从 简单 的 问题 入 手 ， 看 看 为 什么 字符 会 打印 混乱 。 

拿 图 9-15 为 例 ， 输 出 的 字符 串 可 分 为 三 类 ,“Main”“argA”“argB”， 在 每 一 类 连续 输出 的 字符 串 中 ， 


同一 类 的 内 部 是 正常 的 ， 


的 地 方 。 











这 说 明 什 么 ? 和 线程 调度 有 关 ? 


线程 调度 工作 的 核心 内 容 各 

























































































字符 串 整 洁 有 序 , 不 多 不 


是 线程 的 上 下 文保 护 +- 


少 , 少 


字符 的 部 分 只 


是 出 现在 不 同 种 类 的 字符 串 “ 交 界 ” 
































上 下 文 恢复 。 上 下 文 恢复 





=} 






































是 上 下 文保 护 的 逆 操 作 ， 





















































如 果 保 护 部 分 没 问 题 ， 恢 复 也 会 被 排除 掉 “ 嫌 疑 >。 咱 们 先 从 保护 工作 入 手 。 

上 下 文 包 括 两 部 分 ， 第 一 部 分 用 于 中 断 时 的 保护 ， 第 二 部 分 用 于 调度 时 的 保护 。 

是 否 是 上 下 文保 护 的 第 一 部 分 出 了 问题 ? 下 一 个 待 打 印 的 字符 地 址 给 搞 错 了 ? 

答 : 在 每 一 类 字符 串 连续 输出 的 过 程 中 ， 时 钟 中 断 都 在 持续 打 断 任务 的 执行 ， 否 则 线程 是 不 会 被 换 下 
处 理 器 的 。 拿 主线 程 为 例 ， 其 优先 级 为 31， 每 一 次 时 钟 中 断 都 会 将 当前 线程 的 ticks 减 1， 因 此 ， 图 9-15 
中 在 首次 连续 输出 42 个 “Main ”期 间 ， 中 断 发 生 了 31 次 ， 这 说 明 个 别 的 字符 串 “Main ”并 不 是 连续 
打印 的 ， 而 是 中 间 插 入 了 时 钟 中 断 处 理 程序 ， 即 先 打 印 了 前 几 个 字符 ， 被 中 断 断 开 ， 恢 复 后 回来 又 继续 打 
印 后 几 个 字符 。 而 我 们 看 到 , 同类 的 字符 串 内 部 是 连续 完整 输出 的 , 说 明 线 程 在 自己 的 时 间 片 内 工作 正常 ， 




















第 一 部 分 





的 上 下 文保 护 也 是 正确 的 。 





字符 串 丢 失 发 生 在 


万代 
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上 下 文保 护 的 第 二 部 分 出 了 问题 ? 


es 
Es 


这 个 不 会 有 问题 ， 
即 switch_to 前 后 的 寄存 器 环境 ， 这 与 线程 待 
第 一 部 分 保存 的 ， 第 二 部 分 的 作 / 























串 交 界 处 ， 也 就 是 说 当 j 











由 度 了 新 的 线程 后 者 






































现 了 丢 字 符 的 现象 。 难 道 是 线程 





因为 第 二 部 分 的 上 下 文保 护 是 为 了 保护 线程 在 内 核 调度 程序 中 的 上 下 文 ， 
打印 的 字符 串 无 关 ， 和 字符 串 打 印 有 关 的 寄存 器 映像 是 
































仅仅 是 保证 线程 被 switch to 恢复 后 能 够 ) 




















贰 利 执行 到 出 











intr_exit， 




















在 intr_exit 处 的 代码 是 
讨论 过 了 ， 应 该 不 会 出 问 
交界 处 是 正常 的 ， 














题 。 


它 并 没有 





第 一 部 分 保存 的 寄存 器 虹 
图 9-15 中 ， 





况且 在 

















上 下 文保 护 看 来 是 正 
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1， 在 init all 函数 








有 I 


es 
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到 底 哪里 





现 丢 字符 的 现 
以 乎 线程 调度 不 是 问题 所 在 。 字 





第 一 组 连 连 弛 
象 。 


A 像 恢复 线程 上 下 文 ， 从 而 退出 
和 一 组 连续 的 “aregA ”的 





中 断 。 
和 本 的 “Main ”和 第 





上 了 问题 呢 ? 


中 咱们 也 调 



































周 用 ， a 
情况 下 。 难 道 和 中 断 有 关 ? 
情况 下 打印 的 ， 
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虽然 
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有 点 凌乱 ， 但 

















是 正确 的 ， 与 现在 的 
J 是 ， 之 前 已 经 验证 过 ， 图 9-15 : 
自 们 还 是 看 出 了 男 一 些 不 同 ， 








区 别 是 那 时 


了 put str 函数 ， 在 各 模块 
青 况 下 ， 现 在 


AAA 


付 品 
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以 打印 ， 这 似 ; 


的 初始 
吴 是 在 关中 断 的 1 



































程 在 关中 断 下 ， 
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一 个 主线 程 试 试看 ” 
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现在 的 “异常 


型 
DR 





i 
[wy 


12 一 13 行 的 thread_start 注释 后 ， 
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从 基础 入 手 ， 
， 就 听 大 伙 儿 的 ， 





是 多 线程 在 开 中 断 下 ， 难 ; 
也 许 大 部 分 同学 都 在 建议 : 
看 看 单线 程 








咱们 多 
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而 它 我 们 已 经 


乎 说 明 字符 打印 的 功能 





化 中 也 有 put_str 
断 的 
断 的 























问题 




















“不 要 创建 屠 
开 中 断 下 是 否 会 出 问题 














图 10-1 所 示 。 
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单线 程 字符 











即 主 线程 自己 被 调度 来 调度 


























最 基础 的 打印 流程 入 手 。 





， 似 乎 是 多 线程 开 中 断 下 才 会 
是 多 个 线程 在 打印 字符 时 ， 出 现 互 相 履 盖 的 现象 呢 ? 看 来 现在 必须 得 把 





回忆 一 





下 ， 字 符 打印 的 核心 函 








打印 函数 put _char 的 工作 原 玫 








获取 光标 值 
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出 问题 。 


数 是 put char， 它 的 功能 是 在 光标 处 打印 1 个 




















在 咱们 的 逻辑 ， 











， 光 标 1 
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FE 的 光标 寄存 器 获取 光标 值 。 
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2. 将 光标 值 转 
光标 值 是 字符 的 次 序 ， 
存 中 的 偏 移 量 ， 此 偏 
在 

















出 移 旧 


























由 于 在 步 又 2 中 又 要 
3 更 新 光标 的 值 








换 为 字 节 





该 地 址 处 写 入 字符 ASCII 码 及 属性 。 


是 下 一 个 打印 字符 的 地 址 。 为 了 知道 在 哪个 位 置 打 印 


串 打 印 效果 
的 时 候 , 字符 串 打印 显得 无 比 和 谐 ， 


两 个 线程 了 ， 
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字符 。 
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子 付 ， 
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六 地 址 ， 在 该 地 址 处 写 入 字符 

一 个 字符 占 显 存 中 的 2 字 节 ， 基 
量 + 显 存 的 起 始 地 址 0xb8000 所 得 的 

1 断 字符 类 型 , 又 要 写 入 字符 ， 








字符 写 入 完成 后 , 将 显存 ! 
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地 址 和 ， 便 是 下 一 个 字符 如 


又 要 判断 是 


心 踏实 下 来 , 此 


让 我 们 分 析 ] 
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此 要 将 光标 值 乘 以 2， 将 光标 转换 为 字符 在 3 
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异 ,， 所 以 步 又 2 
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的 地 址 ， 随 后 




















下 一 个 可 以 打印 字符 的 地 址 转换 为 光标 值 后 写 入 显卡 的 光标 寄存 








器 , 供 下 
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一 次 字符 





AR 


打印 时 读 取 。 
以 上 就 是 打印 一 个 字符 





中 不 能 被 切换 成 其 他 人 有 
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您 肯定 想到 了 ， 每 个 任务 者 
印 时 发 生 





线程 执行 
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字符 打 
周 度 器 的 影响 ， 因 上 














比 ,出 





的 三 个 步骤。 按理 
符 这 件 事 不 可 拆 分 ， 更 确切 地 说 ， 不 能 被 调度 机 i 
的 三 个 步 又 像 原本 
央 ， 迟 早 会 执行 任务 
符 打 印 中 的 三 个 步骤 被 
0“ 算 是 ”具有 原子 性 ， 在 伯 


上 过程 中 字符 打 E 

















打印 过 程 中 
BP 有 时 间 片 
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| 拆 分 ， 说 





来 说 ， 这 三 个 步骤 必须 一 气 呵 成 ， 要 么 全 都 完成 ， 要 么 一 个 步骤 都 
和 白 了 ， 就 是 要 求 字 符 打印 执行 过 程 
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此 字符 打 
周 度 ， 所 以 ， 任 务 调度 保 不 ? 
Ff 开 了 。 线 程 在 时 间 片 内 执行 时 并 不 会 
E 务 调度 前 的 执行 期 间 ， 打 印 的 是 连 


印 必须 具有 原子 性 。 


就 是 在 从 








人 
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续 完 整 的 字符 串 。 在 任务 调度 前 的 一 刻 , 如 果 此 线程 执行 了 put_char 中 的 步骤 1, 并 且 步 骤 3 尚未 执行 (不 





管 第 2 步 是 否 

那 现在 可 以 解释 “ 少 
而 在 put_str 内 部 是 对 字符 串 中 的 各 个 字符 分 别 调用 
下 面 我 们 把 现场 还 原 ， 注 意 ， 这 里 要 访问 的 公 # 











行 完 )， 那 么 就 一 定 会 


于 


Ep 








问题 。 
的 现象 了 。 大 家 都 知道 ， 各 个 线程 都 是 
put_char 来 逐个 打印 






































周 用 put str 
的 。 





tk 资源 是 显存 。 


函数 来 打印 字符 串 的 ， 


假设 线程 k_thread_a 正在 通过 put_char 打印 某 个 字符 ， 它 在 put_char 中 刚刚 完成 了 字符 打印 的 步骤 1， 


即 读 取 了 字符 打印 的 光标 位 置 ,假设 获取 到 的 光标 值 为 C1。 于 是 它 就 
算 ” 将 光标 值 转换 成 地 址 后 ， 再 往 该 地 址 处 写 入 
以 步 又 2 的 完成 


下 三 











TH 女 


步 





光标 寄存 器 中 写 入 新 的 光标 值 时 ， 此 
序 schedule 换 下 了 处 理 器 ， 将 线程 k_ thread b 换 上 处 至 



























































Ar 


字 答 











WE 











的 ASCII 码 及 





六 [可 烈 地 进 

















对 时 钟 中 断 发 生 了 ， 并 且 

















器 。 














k thread b 运行 后 ， 也 是 间接 通 








步 来 ， 不 管 步骤 2 是 否 执行 彻底 ， 总 之 尚未 进行 步骤 3， 


行 步骤 2， 也 就 是 “ 打 


属性 。 由 于 步骤 2 中 的 微 步骤 很 多 ， 所 


也 就 是 还 没 来 得 及 往 














| 线程 k thread a 的 时 间 片 到 期 ， 它 被 调度 程 














过 put_char 打印 


















































































































































字符 ， 它 开始 执行 步骤 1 获取 光标 值 ， 线 程 k_thread a 之 前 未 更 新 光标 值 ，k_thread_b 此 时 获取 的 光标 值 
也 是 C1。 所 以 会 在 相同 的 地 方 打 印字 符 ， 也 就 是 字符 覆盖 了 ， 这 就 是 “ 少 字符 ”的 原因 。 在 任务 调度 时 
才 会 出 现 这 种 情况 ， 因 此 字符 履 盖 一 定 出 现在 不 同 组 字符 串 的 交界 处 。 

也 许 有 读者 想到 了 ， 既 然 是 任务 调度 破坏 了 字符 打印 的 原子 性 ， 而 任务 调度 又 是 由 时 钟 中 断 调用 的 ， 是 否 
可 以 在 字符 串 打印 前 后 通过 关中 断 的 方式 来 保证 原子 性 ? 我 想 可 以 ， 要 不 咱们 试 试 ， 不 过 为 了 省 事 ， 虽 们 就 不 
把 关中 断 在 put_char 的 前 后 开关 中 断 了 ， 放 在 put_str 前 后 吧 ， 请 看 代码 10-1。 

































































( project/c10/a/kernel/main.c ) 
























































































































































代码 10-1 

… 略 
16 while(1) { 
TV intr disable () // 关中 断 
18 put_ str("Main "); 
19 intr enable (); // 开 中 断 
20 }; 
21 return 0; 
22 } 
23 
24 /* 在 线程 中 运行 的 函数 */ 
25 void k thread al(lvoid* arg) { 
26 /* void* 来 通用 表示 参数 ， 

被 调用 的 函数 知道 自己 需要 什么 类 型 的 参数 ， 自 己 转换 六 
27 char* para = arg; 
28 while(1) { 
29 intr disable(); // 关中 断 
30 put_str (para); 
31 intr enable (); // 开 中 断 
32 } 
3 中 
34 
35 /* 在 线程 中 运行 的 函数 */ 
36 void k thread bl(void* arg) { 
37 /* 用 void* 来 通用 表示 人 参数， 

被 调用 的 函数 知道 自己 需要 什么 类 型 的 参数 ， 自 己 转换 再 用 */ 
38 char* para = arg; 
39 while(1) { 
40 intr disable(); // 关中 断 
41 put_str (para); 
42 intr_ enable (); // 开 中 断 








441 

















在 打印 前 先 把 中 断 关 闭 ， 在 打印 完成 后 ， 还 是 要 把 中 断 打 开 的 ， 否 则 无 法 调度 新 线程 ， 因 此 在 put_str 
前 后 都 加 了 intr_disable 和 intr_enable。 
编译 运行 ， 效 果 如 图 10-2 所 示 。 
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Main a Main Main 
argfl art rgf arg 0 argf 
argf rgf argf rgf argf 
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4 图 10-2 打印 前 后 关中 断 


10-2 所 示 是 运行 结果 的 快照 ， 在 持续 运行 了 10 分 钟 后 ， 看 上 去 一 切 良 好 。 顺 便 说 一 句 ， 每 个 字符 
串 之 所 以 都 能 “完整 地 ”打印 ， 即 原 字符 串 中 的 每 个 字符 顺序 挨 着 ， 是 因为 关 、 开 中 断 操作 放 在 了 put_str 
的 前 后 ， 如 果 放 在 了 put_char 的 前 后 ， 各 字符 串 组 的 两 端 也 可 能 是 混乱 的 。 
现在 该 讨论 下 最 严重 的 错误 了 ， 那 个 导致 GP 异常 的 0x9f9e 是 从 哪 来 的 呢 ? 
考虑 一 下 现在 的 情况 。 
(1) 大 家 想 想 看 ， 我 们 在 函数 put_char 中 明明 有 对 光标 值 的 判断 ， 即 当下 一 个 写 入 字符 的 光标 位 置 大 
于 等 于 2000 时 就 会 滚屏 ， 滚 屏 后 会 把 光标 置 为 屏幕 最 后 一 行 的 行 首 光 标 值 ， 即 1920， 也 就 是 说 我 们 所 写 
入 光标 寄存 器 的 光标 值 ， 应 该 始终 小 于 2000， 即 0 一 1999 的 范围 
(2) 图 9-19 中 ， 第 一 个 下 画 线 的 代码 “mov byte ptr gs:[bx],cl” 是 导致 异常 的 指令 ， 其 中 bx 的 值 是 刚 
刚 从 光标 寄存 器 读 进来 的 ,因此 可 以 判断 ,一定 是 某 个 线程 在 上 一 次 往 光 标 寄 存 器 中 更 新 了 错误 的 光标 值 。 
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情况 (1) 是 说 所 设置 的 光标 一 定 小 于 2000， 情 况 (2) 是 说 所 设置 的 光标 一 定 大 于 等 于 2000， 看 似 
矛盾 啊 ， 好 凌乱 地 说 ……… 

其 实 ,情况 (1 ) 是 种 “愿景 ” 或 者 说 是 原子 操作 下 的 理想 态 : 从 光标 读 取 ， 到 写 入 字符 ， 最 后 到 更 新 光 
标 都 应 该 属于 同一 个 线程 的 工作 ， 也 就 是 说 这 三 个 操作 不 应 该 由 多 个 线程 重复 “ 挫 和 ”…… 似乎 有 点 眉目 了 。 





























先 看 一 下 为 什么 寄存 器 bx 的 值 会 变 成 0x9f9e 呢 ? 
先 ， 看 过 代码 的 同学 肯定 知道 ， 导 致 异常 的 语句 “mov [gs:bx], cl” 位 于 函数 put_char 中 的 标号 .put_other 
后 面 ， 其 中 寄存 器 bx 用 作 显 存 操作 中 的 偏 移 量 。 此 偏 移 量 是 由 shl bx, 1 语句 将 光标 值 乘 以 2 得 来 的 ， 因 此 ， 有 
必要 先 将 bx 中 的 地 址 0x9f9e 还 原 为 光标 值 ， 看 看 原本 读 进 来 的 光标 值 到 底 是 多 少 。 

咱们 从 后 往 前 推 ， 将 bx 中 的 地 址 恢复 为 光标 。 不 知道 大 伙 儿 注意 到 没有 ， 其 中 eflags 寄存 器 的 CF 
位 为 1〈 用 方 框框 起 来 的 CF)， 这 表示 有 进位 ， 源 代码 中 “shl bx, 1” 和 “mov gs:[bx],cl” 是 挨 着 的 ， 因 此 
CF 位 表示 经 过 “shl bx，1” 左 移 1 位 〈 乘 以 2) 后 有 进位 ， 这 说 明 bx 的 值 昌 是 0x9f9e， 但 它 只 是 部 分 结 
果 ，bx 是 16 位 操作 数 ， 由 shl bx,1 把 结果 的 进位 抹 掉 了 ， 即 结果 应 该 为 0x19f9e。 将 此 值 除 以 2 后 的 结果 
为 0xcfcf， 也 就 是 读 进 来 的 光标 值 为 0xcfcf。 

其 实在 put char 开头 部 分 , 光标 最 初 是 存 入 到 寄存 器 ax 中 的 , bx 中 的 值 是 由 指令 movbx, ax 从 ax 复制 
过 去 的 ， 图 9-19 中 ， 用 +r 命令 显示 的 寄存 器 中 ，eax 的 值 为 0xc0009f9e， 因 此 光标 初 值 再 次 被 证 实 为 0x9f9e。 
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顺便 提 一 下 ， 此 时 ebx 的 值 虽 为 0xc0009f9e， 但 高 2 字 节 的 0xc000 并 不 是 put_char 中 用 到 的 ， 它 是 
1 主 调 函 数 put str 记录 字符 串 地 址 用 的 ,因此 高 2 字 节 以 0xc000 开头 。 我 们 的 显存 段 基 址 是 0xc00b8000， 
因此 我 们 此 处 只 用 bx 来 做 显存 的 偏 移 地 址 。 
另外 ， 既 然 咱 们 的 光标 值 范围 是 0 一 1999， 将 其 转换 为 十 六 进 制 的 话 ， 即 0 一 0x7cf， 这 说 明光 标 值 最 
多 为 3 位 十 六 进 制 数 ， 并 且 高 字 节 始 终 小 于 等 于 7。 
而 我 们 读 进来 的 光标 值 为 0xcfcf， 即 高 字 节 为 2 个 十 六 进 制 位 ， 因 此 一 种 可 能 设置 错误 光标 值 的 情况 
是 : 光标 值 的 低 字 节 被 当成 高 字 节 写 入 到 光标 寄存 器 中 了 ， 也 就 是 问题 出 在 put_char 结尾 处 的 光标 设置 阶 
段 ， 而 且 这 必然 是 由 两 个 线程 共同 “ 掺 和 ”办 的 坏事 ， 下 面 讨论 下 这 种 情况 。 
在 咱们 的 代码 中 ， 光 标 设置 分 为 4 个 微 操作 。 
(1) 通知 光标 寄存 器 要 设置 高 8 位 ， 如 图 10-3 所 示 
(2) 输入 光标 值 的 高 8 位 ， 如 图 10-4 所 示 。 
(3) 通知 光标 寄存 器 要 设置 低 8 位 ， 如 图 10-5 所 示 。 
(4) 输入 光标 值 的 低 8 位， 如 图 10-6 所 示 。 


到 10-4 到 10-6 


前 两 个 步骤 (1) 和 ) (2) 是 为 了 设置 光标 的 高 8 位 ， 后 两 个 步骤 (3) 和 (4) 是 为 了 设置 光标 的 低 
8 位 。 经 过 完整 的 4 个 步骤 ， 新 的 16 位 光标 值 才 被 写 入 光标 寄存 器 。 

虽然 我 们 本 次 实例 中 有 3 个 线程 ， 但 以 上 GP 异常 的 情况 在 2 个 线程 的 环境 中 也 会 出 现 〈 测 试 过 )， 
因此 ， 为 叙述 方便 ， 下 面 咱们 以 两 个 线程 为 例 ， 根 据 以 上 4 个 步骤 来 复 现 GP 异常 的 现场 ， 注 意 ， 这 里 要 
访问 的 公共 资源 是 光标 寄存 器 〈 都 是 公共 资源 巷 的 祸 )。 

假设 线程 k_thread a 正在 处 理 器 上 运行 ,不 管 它 运 行 了 多 久 , 在 此 次 时 间 片 内 的 最 后 一 刻 ， 恰 好 它 去 设 
置 光标 ， 此 时 k_thread a 要 设置 的 光标 什 为 0x7cf， 即 1999， 也 就 是 下 “个 字符 的 位 置 是 屏幕 厂 下 角 。 在 完 
成 上 面 第 (3) 步 的 微 操 作 后 ， 第 (4) 步 尚 未 开始 ， 此 时 发 生 了 中 断 ， 由 于 此 线程 的 时 间 片 耗 尽 ， 调 度 器 把 
rt ge mt es 大 伙 儿 注意 ， 目 前 光标 寄存 器 中 仅 更 新 了 高 8 位 (虽然 其 值 为 
0x7， 但 它 不 重要 )， 低 8 位 的 设置 未 彻底 。 光 标 寄 存 器 的 值 仍 为 0x7ce， 线 程 k_thread_a 只 是 把 光标 寄存 器 的 
高 8 位 更 新 为 0x7， 当 它 下 次 再 运行 时 ， 首 先 做 的 就 是 把 第 4 步 完 成 ， 即 把 0xcf 写 入 光标 寄存 器 的 低 8 位 。 

k_thread_b 运行 后 ， 它 先 获取 了 光标 值 0x7ce， 然 后 将 光标 转换 成 显存 的 偏 移 地 址 ， 随 后 在 该 地 址 处 
输出 字符 。 当 输出 一 个 字符 后 ， 光 标 值 被 更 新 为 0x7cf， 这 样 在 输出 下 一 个 字符 时 ， 获 取 到 的 光标 值 便 为 
0x7cf， 接 着 在 此 光标 值 对 应 的 显存 地 址 处 写 入 字符 。 随 后 将 寄存 器 bx 自 加 1， 它 作为 下 一 个 光标 值 ， 此 
时 bx 的 值 为 2000， 这 时 候 需 要 滚屏 了 。 

滚屏 操作 相对 来 说 比较 繁琐 , 而 且 线 程 k_thread_b 的 时 间 片 很 少 , 故 大 部 分 时 间 都 被 消耗 在 滚屏 上 了 。 
在 它 终于 完成 滚屏 后 ， 下 一 步 就 是 去 更 新 光标 值 。 当 它 刚刚 完成 第 1 步 ， 第 2 步 尚 未 开始 的 时 候 ， 恰 好 又 
被 中 断 。 注 意 ， 对 于 设置 光标 寄存 器 的 高 8 位 来 说 只 完成 了 一 半 步 又 ， 还 差 光标 具体 值 没 有 写 入 ， 因 此 光标 
寄存 器 高 8 位 的 值 还 没 来 得 及 更 新 ， 依 然 为 0x7， 整 个 16 位 光标 值 依然 为 0x7cf。 之 前 滚屏 操作 耗 尽 了 时 间 
片 ， 因 此 调度 器 把 线程 k thread _b 换 下 处 理 器 ,再 次 换 上 线程 k_thread a 运行 。 注 意 ， 线 程 k_thread_b 刚刚 
执行 完 第 1 步 , 即 告诉 了 显卡 马上 要 写 入 光标 值 到 光标 寄存 器 的 高 8 位 ,因此 再 被 号 入 的 任何 8 位 光标 值 将 
被 认为 是 存 入 光标 寄存 器 的 高 8 位 中 。 

k thread_a 运行 后 ， 继 续 执行 自己 上 一 步 未 完成 的 操作 ， 也 就 是 完成 第 4 步 ， 往 光标 寄存 器 中 写 入 低 
8 位 的 值 ， 也 就 是 写 入 0xcf。 但 k thread b 已 经 告诉 光标 寄存 器 要 设置 高 8 位 ， 目 前 只 差 输入 高 8 位 的 具体 
值 了 ， 光 标 寄存 器 把 此 次 k thread a 输入 的 低 8 位 值 0xcf 当成 了 光标 的 高 8 位 ， 存 入 了 光标 寄存 器 的 高 8 
人 位， 因此， 光标 被 更 新 为 0xcfcf。 当 下 一 次 输出 字符 时 ， 获 取 到 的 光标 便 为 0xcfcf， 从 而 导致 GP 异常 。 

过 程 就 是 这 样 ， 有 兴趣 的 话 大 伙 儿 可 以 自行 调试 跟踪 。 不 过 这 种 有 竞争 条 件 的 调试 是 相当 麻烦 的 ， 异 
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常 只 是 在 某 些 情况 下 才 会 出 现 ， 而 
中 断 又 取决 于 虚拟 机 的 中 断 模拟 策 
下 ， 有 关 以 上 的 


总 疆 一 


一 口 
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机 个 问题 


























L 备 原 二 


性 ， 它 被 任务 1 
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E 咀 们 都 搞 清楚 
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周 度 器 断 开 了 ， 从 而 让 j 





现在 说 说 正事 吧 。 





虽然 我 们 通过 关中 断 的 方式 暂时 解决 了 问题 


写 一 个 新 
也 愉 
道 多 个 线程 
如 本 节 标 


10.1.2 ” 找 出 代码 中 的 临界 区 


咱们 当初 学 习 操作 系统 的 
等 概念 ，] 
反复 熟悉 了 它 ， 
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是 围绕 
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青 况 也 需要 原子 操作 
访问 公共 
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实现 锁 ， 
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上 一 节 中 给 大 伙 儿 还 原 了 两 个 现场 ,一 个 “可 能 是 问题 ”的 “ 少 字符 ”现象 , 它 是 由 于 对 公共 资源 “ 显 
存 ” 未 实现 互 斥 访问 造成 的 。 另 一 个 就 是 GP 异常 ， 它 是 对 公共 资源 “光标 寄存 器 ”未 实现 互 斥 访问 造成 
的 。 这 两 个 现场 过 程 就 是 竞争 条 件 。 处 理 器 执行 指令 过 程 中 ， 即 使 发 生 了 中 断 ， 也 会 先 把 当前 的 指令 执行 
完 再 处 理 中 断 ， 不 会 出 现 指 令 只 执行 部 分 的 情况 。 因 此 ， 单 条 指令 的 执行 具有 原子 性 。 

综 上 所 述 ， 造 成 这 两 种 问题 的 本 质 原因 是 临界 区 put_char 中 的 指令 不 是 一 条 ， 而 是 很 多 ， 因 此 对 公共 
资源 的 访问 无 法 一 下 子 执行 彻底 。 当 多 个 线程 都 在 临界 区 时 ， 受 访 的 资源 是 同一 个 ， 加 之 多 个 线程 又 是 伪 
并 行 ， 后 面 进入 临界 区 的 线程 必然 会 覆盖 前 面 所 有 线程 的 成 果 ， 再 者 ， 即 使 多 个 线程 是 真 并 行 执行 ， 对 于 访 
问 共享 资源 也 会 有 个 前 后 顺序 ， 因 此 显存 和 光标 寄存 器 这 两 个 公共 资源 的 状态 取决 于 所 有 线程 的 访问 时 序 。 
现在 看 看 咱们 代码 中 的 “ 互 斥 ”。 

其 实 咱们 已 经 用 了 个 “可 依赖 ”的 互 斥 手段 ， 就 是 进入 临界 区 前 通过 函数 intr_disable 关中 断 。 大 伙 
儿 不 要 因为 它 的 “简单 粗暴 ”就 对 其 不 层 一 顾 ， 这 可 是 操作 系统 课程 上 介绍 过 的 方法 呢 ， 关 中 断 是 实现 互 
斥 最 简单 的 方法 ， 没 有 之 一 。 我 们 今后 实现 的 各 种 互 斥 手段 也 将 以 它 为 基础 。 

不 过 话 又 说 回来 了 ， 虽 然 关中 断 可 以 实现 互 斥 ， 但 关中 断 的 操作 应 尽量 靠近 临界 区 ， 这 样 才 更 高 效 ， 
毕竟 临界 区 中 的 代码 才 用 于 访问 公共 资源 ， 而 访问 公共 资源 的 时 候 才 需要 互 斥 、 排 他 ， 各 任务 临界 区 之 外 
的 代码 并 不 会 和 其 他 任务 有 冲突 。 关 中 断 操作 离 临 界 区 越 远 ， 多 任务 调度 越 低 效 ， 不 夸张 地 说 ， 若 将 关 ! 
断 操 作 加 在 了 任务 执行 之 初 ， 多 任务 并 行 ( 伪 并 行 ) 系 统 将 退化 成 单 任务 串 行 执行 。 而 我 们 做 得 也 不 好 ， 
关中 断 函数 intr disable 并 没有 离 临 界 区 函数 put_char 足够 近 ， 比 如 可 以 放 在 put_char 前 ， 或 者 最 好 能 将 
关中 断 指令 cli 作为 put_char 函数 中 第 一 条 指令 。 我 们 把 它 放 在 了 调用 put_char 的 put_str 函数 之 前 ， 因 此 
各 组 字符 串 结尾 处 的 输出 是 完整 的 。 但 是 在 put_str 中 距 调用 put_char 还 有 一 些 各 线程 私有 的 操作 ， 因 此 在 
这 些 私有 操作 的 时 间 内 无 法 响应 中 断 ， 从 而 其 他 任务 无 法 及 时 被 调度 ， 降 低 了 系统 的 多 任务 执行 效率 。 

我 怕 说 得 不 清楚 ， 举 个 通俗 的 例子 吧 ， 就 拿 咱们 在 家 吃 面条 来 说 ,每 个 人 吃 面条 的 过 程 是 每 个 人 的 私 
有 操作 ， 锅 里 的 面条 是 公共 资源 ， 到 锅 里 盛 面条 的 动作 属于 临界 区 。 通 常 我 们 都 是 吃 完 一 碗 后 ， 再 去 锅 里 
盛 下 一 硫 《〈 北 方 人 都 比较 能 吃 面 )， 当 小 明 在 盛 面条 的 时 候 ， 如 果 大 明 也 恰好 想 去 盛 面条 ， 大 明 只 能 在 旁 
边 等 着 小 明 盛 完 后 ， 再 去 盛 自己 的 面 ， 其 实 这 个 等 待 就 相当 于 互 斥 ， 只 不 过 这 个 互 斥 是 由 “文明 排队 的 素 
质 ” 来 保证 的 。 若 小 明 素 质 很 差 ， 他 在 刚 端 着 碗 、 拿 着 筷子 吃 面 的 时 候 就 站 在 锅 边 上 ， 并 且 不 让 别人 上 前 盛 
面 ， 必 须 得 等 自己 连 吃 几 碗 吃 饱 后 再 让 别人 盛 ， 这 就 耽误 了 别人 吃饭 ， 相 当 于 大 家 一 个 个 轮流 吃饭 一 样 了 。 

好 啦 ， 又 到 了 总 结 的 时 候 。 

多 线程 访问 公共 资源 时 出 问题 的 原因 是 产生 了 竞争 条 件 , 也 就 是 多 个 任务 同时 出 现在 自己 的 临界 区 。 为 避免 
产生 竞争 条 件 ， 必 须 保证 任意 时 刻 只 能 有 一 个 任务 处 于 临界 区 。 因 此 ， 只 要 保证 各 线程 自己 临界 区 中 的 所 有 代码 
都 是 原子 操作 ， 即 临界 区 中 的 指令 要 么 一 条 不 做 ， 要 么 一 气 呵 成 全 部 执行 完 ， 执 行 期 间 绝 对 不 能 被 换 下 处 理 器 。 
其 实 , 之 所 以 出 现 竞争 条 件 , 归根 结 底 是 因为 临界 区 中 的 指令 太 多 了 , 如 果 临 界 区 仅 有 一 条 指令 的 话 ， 
这 本 身 已 属于 原子 操作 ， 完 全 不 需要 互 斥 。 因 此 ， 在 临界 区 中 指令 多 于 一 条 时 才 需 要 互 斥 。 当 然 ， 临 界 区 
中 很 少 存在 只 有 一 条 指令 的 情况 ， 因 此 我 们 必须 提供 一 种 互 斥 的 机 制 ， 互 斥 能 使 临界 区 具有 原子 性 ， 避 免 
产生 竞争 条 件 ， 从 而 避免 了 多 任务 访问 公共 资源 时 出 问题 。 

该 说 的 差不多 都 说 了 ， 下 一 节 咱 们 开始 讨论 锁 的 实现 。 


10.1.3 信号 量 


我 们 的 锁 是 用 信号 量 来 实现 的 ， 因 此 必须 得 和 大 伙 儿 交待 清楚 信号 量 是 咋 回 事 。 

信和 号 量 在 计算 机 世界 中 也 算是 历史 悠久 了 ， 此 概念 是 由 荷兰 人 E.W.Dijkstra 在 1965 年 首次 提出 的 ， 
它 是 一 种 程序 设计 构造 方法 。 其 原型 来 自 于 铁路 上 的 信号 灯 ， 大 伙 儿 都 知道 ,任何 时 候 铁轨 上 只 能 有 一 辆 
火车 ， 否 则 您 懂 的 。 铁 路 上 是 如 何 保证 这 一 点 的 呢 ?” 原 来 它们 也 有 个 信号 量 系 统 ， 火 车 要 想 进 入 新 的 轨道 ， 
它 必须 等 到 相应 的 信号 才 行 。 
在 计算 机 中 ， 信 号 量 就 是 个 0 以 上 的 整数 值 ， 当 为 0 时 表示 已 无 可 用 信号 ,或 者 说 条 件 不 再 允许 ， 因 
此 它 表 示 某 种 信号 的 累积 “ 量 ” 故 称 为 信号 量 。 
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企 访 问 人 六 中 























线程 同步 的 








备 好 了 随时 接应 , 这 个 配合 时 
电 时 ,啦啦队 员 才 会 - 











\ 备 的 时 间 顺 序 就 是 时 序 。 
球员 传 球 时 肯 
序 就 是 指 队 友 在 某 个 地 方 准 备 好 接应 ， 
来 表演 , 这 个 配 
间 的 合作 必须 遵守 某 种 约定 , 以 该 约定 作为 合 


合 时 序 就 是 























定 得 先 看 哪里 











休息 时 间 。 
作 的 步调 ， 








异常 ， 就 是 因为 多 个 线程 没有 同步 合作 导致 的 ， 要 

















由 线程 就 不 要 进来 捣乱 ， 


人 、 昌 和 






































的 是 不 管线 程 如 何 混杂 、 








断 “ 配 合 时 序 ” 的 
资源 时 (当然 这 也 
也 就 是 使 线程 们 同 











意识 ， 它 的 执行 会 很 随意 ， 这 就 
属于 线程 合作 )， 为 了 保证 结 
步 工作 。 





























月 了 回来 说 信 言 号 
信 0 Se 








里 。 宫 写 看 就 是 








穿插 地 执行 ， 都 不 
使 合作 出 错 成 为 必然 。 
正确 ， 必 然 要 


它 的 计数 值 是 





公 尿 0 








i 





然 数 ， 





























决 于 信号 量 的 实际 应 用 环 








Uo 








额 等 ， 








ee 号 量 量 是 计数 信 ， 
这 两 个 都 


有 丘 . 
里 


的 减 、 增 ， 





0 
必然 要 有 对 计数 增 减 的 方法 。 
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吾 号 星 











是 荷兰 语 











信号 量 





(1) 将 信号 量 


(2) 唤醒 在 此 





加 。 但 计算 机 一 直 是 美国 最 发 达 ， 而 且 P、 
这 是 使 信号 量 减 少 的 操作 ， 为 了 强 种 
的 操作 )， 因 此 对 信号 量 
增加 操作 up 包括 两 个 微 操作 。 











I 记忆 ， 人 P 的 发 音 
的 





的 值 加 1。 
上 等 待 





请 四 


信和 号 量 


的 线程 。 


减少 操作 down 包括 三 个 子 操作 。 


(1) 判断 信号 量 
(2) 若 信 号 量 
(3) 若 信 号 量 
信号 量 是 个 全 

因此 它们 必 


信号 量 





操作 ， 








是 否 大 于 0。 
大 于 0， 则 将 信号 量 减 1。 


里 








音 记 成 往 


可 以 认为 是 商品 的 剩余 量 E 治 











加 法 操作 是 用 up 表示 ， 减 法 操作 是 用 down 表示 。 











等 于 0， 当 前 线程 将 自己 阻塞 ， 以 如 





下 此 信和 号 与 里 




















局 共享 变量 , up 和 down 又 都 是 
须 都 是 原子 操作 。 
尺 表 是 信号 资源 的 累积 量 











， 也 就 是 剩 恒 





























这 便 你 为 二 元 


旦 ， 我 们 可 以 利用 二 元 信号 量 来 实现 锁 。 














在 二 元 








，down 操作 就 是 获得 




















可 以 借 此 保证 


读 写 这 个 全 局 变量 


- 青 . 
里 ， 








用 一 套 额 


- 稚 
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三 





因此 ， 
































、 假 其 








会 出 人 
向 结果 的 正确 性 。 
当 多 个 线程 访问 同一 公 
外 的 机 制 来 控制 它们 的 工作 步 i 


用 来 记录 所 积累 信号 的 数量 。 
剩余 的 天 数 、 骨 
仅仅 是 一 种 程序 设计 构造 方法 。 




















1 于 Dijkstra 是 荷兰 人 ， 他 用 
ee 写 。P 是 指 Proberen， 表 示 减 少 ，V 是 指 单词 Verhogen， 表 示 增 
显得 意义 不 明朗 (由 于 字母 V 很 像 是 朝 下 指 


下 “和 劈 ” 的 动作 ， 





E 何 问题 。 
线程 不 像 人 那样 有 关 

































































P、V 操作 来 表示 信号 


重 的 箭头 ， 我 经 党 觉得 
这 才 记 住 P 才 是 减少 




















待 。 
的 





操作 ， 而 











下 面 介 绍 下 这 


有 它们 都 包含 一 








丙种 操作 。 








系列 的 子 








锁 ，up 操作 就 是 释放 锁 。 





若 初 值 为 1 的 话 , 它 的 取 值 就 


我 们 可 以 让 线程 通过 锁 进 入 临界 
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时 的 值 便 为 0。 


里 


线程 A 进入 


后 续 线程 B 再 进入 临界 





个 界 区 前 先 通过 down 操作 获得 








上 通 


个 线程 可 以 进入 临界 区 ， 从 而 做 到 互 斥 。 大 致 流程 为 : 
锁 (我 们 有 强 各 














过 锁 进 入 


临界 区 的 手段 )， 此 时 


| 
只 能 





为 0 和 1， 




















{二 下 于 网 三 | 




















等 待 ， 也 就 是 相当 


唤醒 。 





好 啦 ， 信 和 号 
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线程 B 醒 来 后 获得 了 锁 ， 进 入 临界 
说 也 不 容易 理解 ， 咀 们 尽快 看 看 具体 的 实现 吧 。 


于 线程 B 进入 了 睡眠 态 。 








区 时 也 通过 down 操作 获得 








锁 ， 由 于 





为 0， 


百 号 里 


线程 B 便 在 此 信号 量 















































区 。 






































量 这 种 抽象 的 东西 这 人 么 

















当 线程 A 从 临界 区 出 来 后 执行 up 操作 释放 锁 , 此 时 信号 量 的 值 重 新 变 成 1， 




















之 后 线程 A 将 线程 B 


10.1.4 ”线程 的 阻塞 与 唤醒 


其 实 ， 咀 们 离 实现 锁 只 有 一 步 之 膛 了 。 

大 伙 儿 已 经 知道 了 ， 咱 们 是 用 二 元 信号 量 来 实现 锁 的 ， 信 和 号 量 down 操作 中 的 第 3 个 微 操作 提 到 了 阻 
塞 当前 线程 的 功能 ， 信 和 号 量 up 操作 中 的 第 2 个 微 操 作 提 到 了 唤醒 线程 的 功能 ， 因 此 在 实现 锁 之 前 ， 我 们 
必须 提前 实现 这 两 个 功能 

我 们 用 函数 thread_block 实现 了 线程 阻塞 ， 用 函数 thread_unblock 实现 了 线程 唤醒 。 

先 说 一 下 阻塞 的 原理 。 

不 知道 大 伙 儿 对 阻塞 是 否 好 奇 , 阻塞 是 什么 ?是 一 种 阻碍 线程 运行 的 神奇 力量 吗 ? 怎么 就 把 线程 阻塞 
了 呢 ?” 反 正 我 当初 觉得 好 神奇 。 

大 伙 儿 知道 ,“ 阻 塞 ” 就 是 指 不 能 运行 ， 或 者 说 不 让 运行 ， 这 只 是 个 概念 ， 不同 的 系统 有 不 同 的 实现 ， 
但 实现 原理 都 是 一 样 的 。 在 我 们 的 系统 中 ， 大 伙 儿 想 想 看 ， 为 什么 线程 可 以 运行 呢 ? 还 不 是 调度 器 将 线程 
从 就 绪 队 列 中 摘出 来 放 到 处 理 器 上 吗 。 哈 哈 ， 似乎 一 下 子 就 明白 实现 阻塞 功能 的 方法 了 ， 就 是 不 让 线程 在 
就 绪 队 列 中 出 现 就 行 了 ， 这 样 线程 便 没 有 机 会 运行 ， 也 就 是 实现 了 线程 的 阻塞 ， 是 不 是 觉得 好 简单 ? 

阻塞 是 线程 自己 发 出 的 动作 ， 也 就 是 线程 自己 阻塞 自己 ， 并 不 是 被 别人 阻塞 的 ， 阻 塞 是 线程 主动 的 行 
为 。 已 阻塞 的 线程 是 由 别人 来 唤醒 的 ， 唤 醒 是 被 动 的 。 如 果 您 对 此 感到 奇怪 ， 我 再 多 解释 几 句 。 





























































































































































































































































































































































































































































































































调度 器 只 负责 挑选 “有 运行 意愿 、 准 备 好 运行 ”的 线程 上 处 理 器 运行 ， 如 果 线 程 没有 运行 的 意愿 ， 调 度 器 
也 不 能 强迫 它 ， 这 倒 不 是 因为 “民主 ”， 其 实 线程 巴不得 总 在 处 理 器 上 运行 ， 永 远 不 下 来 ， 所 以 它 不 是 不 想 运 
行 ， 而 是 不 能 运行 。 原 因 是 运行 的 条 件 不 具备 ， 停 止 运行 实 属 无 条 ， 因 此 ， 即 使 是 强制 运行 也 没有 好 下 场 。 
调度 器 的 功能 只 是 去 挑选 哪个 线程 运行 , 即使 再 差 的 调度 算法 也 会 保证 每 个 线程 都 有 运行 的 机 会 ， 哪 
怕 只 是 运行 儿 个 时 钟 周 期 。 因 此 ,调度 器 并 不 决定 线程 是 否 可 以 运行 ,只 是 决定 了 运行 的 时 机 ， 线 程 可 否 
运行 是 由 线程 自己 把 控 的 。 当 线程 被 换 上 处 理 器 运行 后 ， 在 其 时 间 片 内 ,线程 将 主宰 自己 的 命运 。 阻 塞 是 
一 种 意愿 ， 表 达 的 是 线程 运行 中 发 生 了 一 些 事情 ， 这 些 事情 通常 是 由 于 缺乏 了 某 些 运行 条 件 造成 的 ， 以 至 
于 线程 不 得 不 暂时 停 下 来 ， 必 须 等 到 运行 的 条 件 再 次 具备 时 才能 上 处 理 器 继续 运行 。 因 此 ， 阻 塞 发 生 的 时 
间 是 在 线程 自己 的 运行 过 程 中 ， 是 线程 自己 阻塞 自己 ， 并 不 是 被 谁 阻塞 。 

说 一 下 唤醒 。 
已 被 阻塞 的 线程 是 无 法 运行 的 ， 属 于 睡梦 中 ， 因 此 它 只 能 祈祷 有 个 “大 恩人 ”来 唤醒 它 ， 否 则 它 永 远 
没有 运行 的 机 会 。 这 个 “大 恩人 ” 便 多 和 用 它 释 放 了 锁 之 后 便 去 唤醒 在 它 后 面 因 获 取 该 锁 而 阻 
的 线程 。 因 此 唤醒 已 阻塞 的 线程 是 由 别 的 线程 ， 通常 是 锁 的 持 有 者 来 做 的 。 
值得 注意 的 是 线程 阻塞 是 线程 执行 时 的 0 ” 因此 线程 的 时 间 片 还 没 用 完 ， 在 唤醒 之 后 ， 线 程 会 
继续 在 剩余 的 时 间 片 内 运行 ， 调 度 器 并 不 会 将 该 线程 的 时 间 片 “充满 ” 也 就 是 不 会 再 用 线程 的 优先 级 
priority 为 时 间 片 ticks 赋值 。 因 为 阻塞 是 线程 主动 的 意愿 ， 它 也 是 “和 迫 于 无 奈 ” 才 “慷慨 ”地 让 出 处 理 器 
资源 给 其 他 线程 ， 所 以 调度 器 没 必要 为 其 “大 方 ” 而 “赏赐 ” 它 完 整 的 时 间 片 。 

初次 接触 信号 量 会 觉得 很 抽象 ， 因 此 咀 们 看 看 这 两 个 函数 的 实现 吧 。 请 见 代码 10-2。 
代码 10-2 (project/c10/b/thread/thread.c ) 
128 /* 当前 线程 将 自己 阻塞 ， 标 志 其 状态 为 stat . */ 
129 void thread block (enum task status stat) { 


于 了 DO 人 stat 取 值 为 TASK _. BLOCKED、 TASK WAITING、 TASK HANGING, 
也 就 是 只 有 这 三 种 状态 才 不 会 被 调度 * / 




















































































































































































































































































































































































































































































































































































































































































































































































































下 3 ASSERT ( ( (stat TASK BLOCKED) || \ 

(stat == TASK WAITING) | \ 

(stat == TASK HANGING))); 

132 enum intr status old status = intr disable(); 

1 struct task struct* cur thread = running thread(); 
134 cur thread->status = stat; // 其 状态 为 stat 

135 schedule (); // 将 当前 线程 换 下 人 处理 器 














136 /* 待 当前 线程 被 解除 阻塞 后 才 继 续 运行 下 面 的 intr set status */ 
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(pthread->status == TASK WAITING) 


137 intr set status(old status); 
138, 3} 
139 
140 /* 将 线程 pthread 解除 阻塞 */ 
141 void thread unblock (struct task struct* pthread) { 
142 enum intr status old status = intr disable(); 
143 ASSERT( ((pthread->status == TASK BLOCKED) || 
(pthread->status == TASK HANGING))); 
144 if (pthread->status != TASK READY) { 
145 ASSERT (!elem find(&thread ready list, &pthread->general tag)); 
146 if (elem find(&thread ready list, &pthread->general tag)) { 
147 PANIC ("thread unblock: blocked thread in ready list\n"); 
148 } 
149 list push(&thread ready list, &pthread->general tag); 
// 放 到 队列 的 最 前 面 ， 使 其 尽快 得 到 调度 
150 pthread->status = TASK READY; 
和 } 
152 intr set status(old status);} 
153: 3} 











我 们 先 看 thread_block， 它 接受 一 个 参数 stat，stat 是 线程 的 状态 ， 它 的 取 值 为 “不 可 运行 态 ” 函数 















































































































































j thread_block 阻塞 自己 ， 




































































“主动 2 和 庆 自愿 ”% 

















过 ASSERT 做 了 限制 。 在 咱们 系统 中 只 有 status 为 























功能 是 将 当前 线程 的 状态 置 为 stat， 从 而 实现 了 线程 的 阻塞 。 
强调 一 下 ， 函 数 中 不 包括 指向 其 他 线程 的 指针 ， 因 此 是 当前 线程 自己 调 
线程 并 不 能 被 别人 强制 阻塞 ， 在 时 间 片 内 ， 任 何 线程 被 换 下 处 理 器 都 是 出 了 
stat 取 值 范围 是 TASK BLOCKED、TASK WAITING 和 TASK HANGING， 这 三 个 就 是 上 面 所 说 的 “不 
可 运行 态 ”， 后 两 个 将 来 会 用 到 。 因 此 在 第 131 行 通 
TASK RUNNING 的 线程 才 可 




















当前 运行 线程 的 status 
列 中 。 由 于 咱们 要 实现 的 功 

















让 调度 器 schedule 无 法 再 调度 它 ， 

回顾 一 下 ， 在 调度 器 schedule 函数 中 ， 
TASK RUNNING， 这 说 明 当 前 线程 只 是 时 | 
新 加 入 到 就 绪 队 列 中 并 置 其 















































为 了 不 让 其 再 被 调 
于 是 在 第 133 一 134 行 获取 




















在 调 








et 








] schedule 之 后 ， 下 面 
在 当前 线程 被 唤醒 后 才 会 被 执行 到 。 





及 





se 





























习 且 


线程 ， 并 置 其 












































的 中 断 ; 


下 面 看 看 唤醒 的 函数 thread_block。 


函数 thread_unblock 与 thread_block 的 功能 相反 ， 它 将 某 线 程 




















的 线程 
































的 66 救世 主 2 














已 无 法 运行 ， 无 法 自己 唤醒 自己 ， 必 须 被 其 
蜂 ， 又 希望 被 唤醒 的 线程 。 函 数 thread_unblock 是 
阻塞 线程 pthread 


能 是 线程 阻塞 , 也 就 是 当 
也 就 是 当前 线程 不 能 有 
































状态 为 TASK READY。 
， 必须 将 其 status 置 为 非 TASK_RUNNING, 也 就 是 函数 thread_block 的 参数 stat。 














于 阻塞 而 引发 的 ， 


以 被 添加 到 就 绪 队 列 thread_ready_list， 才 有 机 会 上 处 理 器 运行 。 

必然 是 TASK_RUNNING， 此 状态 的 线程 在 调度 器 中 会 被 重新 加 到 就 绪 队 
前 线程 暂时 不 能 运行 。 我 们 达到 这 一 目的 的 原理 是 : 
了 被 加 到 就 绪 队 列 thread_ready_list 中 。 

它 会 对 当前 线程 的 status 判断 。 若 当前 线程 的 status 为 
司 片 到 了 ， 此 次 调度 并 不 是 


出 












































Im 
tm 


因此 会 将 




















k status 为 stat。 之 后 便 调 用 











Schedule 重新 调度 下 一 任务 。 


天 态 恢 复 代 码 intr_set_status(old_status) 本 次 便 没 机 会 执行 了 ， 只 有 




























































































当前 运行 的 线程 调 








被 阻塞 的 线程 ， 其 状态 肯定 不 是 TASK READY， 为 保险 起 见 ， 我 
的 站 (pthread->status != TASK READY) 仅 仅 是 让 我 们 更 放心 。 























按 常 


毕竟 ASSERT 只 是 i 
1 让 结合 PANIC 宏 再 
接着 通过 list_push 将 阻塞 的 线程 习 
保证 这 个 上 























队 首 ， 因 上 出 









































次 判断 这 下 














重 了 很 久 的 

















最 后 再 
也 就 是 实 


448 








站 





UL 了 唤醒 。 














解除 阻塞 ， 也 就 是 唤醒 茶 线 程 。 被 阻 中 
也 线程 唤醒 ， 因 此 参数 pthread 指向 的 是 目前 已 经 被 阻 
































的 ， 





它 实施 唤醒 动作 ， 它 是 被 








门 还 是 判 了 一 下 ， 也 就 是 第 144 
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中 重复 添加 

















线程 能 被 亿 


新 添 力 
































先 调 

















度 。 











将 线程 的 status 置 为 TASK READY, 至 此 , 线程 重新 回 到 了 就 绪 队 列 ， 它 有 





里 说 就 绪 队 列 中 不 会 出 现 已 阻塞 的 线程 ， 但 还 是 担心 有 些 意外 情况 会 导致 阻塞 的 线程 已 经 在 就 绪 
队列 中 ， 为 防止 已 经 在 就 绪 队 列 中 的 线程 再 次 被 添加 ， 在 第 145 行 通过 
周 试 期 间 用 的 ， 最 后 会 把 它 去 掉 。 但 是 这 个 判 册 
的 情况 。 
到 就 绪 队 列 ， 这 里 用 list push 是 将 线程 





ASSERT 判断 。 
我 们 还 


旦 老 


是 需要 的 ， 因 此 第 146 行 





添加 到 就 绪 队 列 的 

















4 被 调度 的 机 会 了 ， 











已 经 说 完了 ， 本 节 至 此 结束 ， 下 节 了 咱们 7 











好 ， 锁 的 基础 部 伯 





10.1.5 ” 锁 的 实现 


























































































































于 始 实现 锁 。 




















































































































































































































































































































































































































































































































不 骗 大 伙 儿 ， 这 回 咱们 真 地 要 实现 锁 了 ， 本 节 在 thread 目录 下 创建 了 sync.h 和 sync.c 两 个 文件 , 我 们 
的 同步 机 制 信号 量 和 锁 在 这 里 面 定义 。 现 在 说 干货 ， 请 见 代 码 10-3。 

代码 10-3 (project/c10/b/thread/sync.h ) 

1 #ifndef _ THREAD SYNC H 

2 #define THREAD SYNC H 

3 #include "list.h" 

4 #include "stdint .hn 

5 #include "thread.n" 

6 

7 /* 信号 量 结 构 */ 

8 struct semaphore { 

9 uint8 t value; 

10 struct list waiters; 

11 }; 

二 之 

13 /* 锁 结 构 */ 

14 struct lock { 

TS struct task struct* holder; // 锁 的 持 有 者 

16 struct semaphore semaphore; // 用 二 元 信号 量 实现 锁 

工 7 uint32 t holder repeat nr; // 锁 的 持 有 者 重复 申请 锁 的 次 数 
工 8 了 

略 .… 

代码 10-3 中 定义 了 两 个 结构 ， 其 中 struct semaphore 为 信号 量 结构 ,根据 我 们 之 前 的 描述 , 信号 量 要 有 初 值 ， 
因此 该 结构 中 包含 了 成 员 value， 对 信号 量 进行 down 操作 时 ， 若 信号 是 信 为 0 就 会 阻塞 线程 ， 因 此 该 结构 中 还 
包括 了 成 员 waiters， 用 它 来 记录 在 此 信号 量 上 等 待 (阻塞 ) 的 所 有 线程 。 再 次 重申 一 次 ， 信 号 量 仅 是 个 编程 理 
念 ， 是 个 程序 设计 结构 ， 只 要 具备 信号 量 初 值 和 等 待 线 程 这 两 个 必要 元 素 就 可 以 ， 其 实现 形式 无 具体 要 求 。 

第 二 个 结构 是 struct lock， 这 是 锁 结 构 。 谁 成 功 申请 了 锁 ， 就 应 该 记录 锁 被 谁 持 有 ， 这 是 用 成 员 holder 
记录 的 ， 表 示 锁 的 持 有 者 。 前 面 已 介绍 过 ， 我 们 的 锁 是 基于 信和 号 量 来 实现 的 ， 因 此 锁 结 构 中 必须 包含 一 个 
信号 量 成 员 ， 这 里 就 是 semaphore， 它 就 是 信号 量 结构 体 struct semaphore 实例 。 将 来 此 信号 量 的 初 值 会 被 
赋值 为 1， 也 就 是 用 二 元 信号 量 实现 锁 。 成员 holder_repeat_nr 用 来 累积 锁 的 持 有 者 重复 申请 锁 的 次 数 ， 释 
放 锁 的 时 候 会 参考 此 变量 的 值 。 原 因 是 一 般 情况 下 我 们 应 该 在 进入 临界 区 之 前 加 锁 ， 但 有 时 候 可 能 持 有 了 
某 临 界 区 的 锁 后 ， 在 未 释放 锁 之 前 ， 有 可 能 会 再 次 调用 重复 申请 此 锁 的 函数 ， 这 样 一 来 ， 内 外 层 函 数 在 释 
放 锁 时 会 对 同一 个 锁 释放 两 次 ,为 了 避免 这 种 情况 的 发 生 ， 用 此 变量 来 累积 重复 申请 的 次 数 ， 释 放 锁 时 会 








三 
号 


居 变 量 holder _ repeat_mnr 的 
头 文件 就 介绍 到 此 ， 下 


值 来 执行 具 
看 看 实现 文件 
代码 10-4-1 


根 所 体 





























/* 初始 化 信号 量 */ 

void sema init (struct semaphore* 
psema->value = value; 
list init (&psema->waiters); 


} 
/* 初始 化 锁 plock */ 


plock->holder = NULL; 
plock->holder repeat nr = 0; 
sema init (&plock->semaphore, 


} 


/* 信号 量 down 操作 */ 
Void sema down (struct semaphore* 
/* 关中 断 来 保证 原子 操作 */ 


enum intr status old status 


















































动作 。 
sync.c。 请 见 代码 10-4-1。 

















( project/c10/b/thread/sync.c ) 


psema, uint8 t value) { 
// 为 信号 量 赋 初 值 
// 初始 化 信号 量 的 等 待 队列 





void lock init (struct lock* plock) { 


1); // 信号 量 初 值 为 1 
psema) { 


intr disable(); 
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while(psema->value == 0) { 
ASSERT (!elem _ findq(&psema->waiters AN 


&running thread()->general tag) ) 























// 若 value 为 0， 表示 已 经 被 别人 持 有 























































































































26 /* 当前 线程 不 应 该 已 在 信号 量 的 waiters 队列 中 */ 
2 if (elem find(&psema->waiters, &running thread()->general tag)) { 
28 PANIC ("sema down: thread blocked has been in waiters list\n"); 
29 

30 /* 若 信 号 量 的 值 等 于 0， 则 当前 线程 把 自己 加 入 该 锁 的 等 待 队 列 ， 

然后 阻塞 自己 */ 

3 于 list append(&psema->waiters, &running thread()->general tag); 

32 thread block (TASK BLOCKED); // 阻塞 线程 ， 直 到 被 唤醒 

33 } 

34 /* 车 value 为 1 或 被 唤醒 后 ， 会 执行 下 面 的 代码 ， 也 就 是 获得 了 锁 */ 

3 psema->value-——; 

36 ASSERT (Psema->Value == 0); 

37 /* 恢复 之 前 的 中 断 状态 */ 

38 intr set status(old status);} 

3 让 

咱们 从 上 往 下 说 ，sema_init 函数 接受 两 个 参数 ，psema 是 待 初始 化 的 




















数 功 能 是 将 信号 量 psema 初 值 初始 化 为 value。 锁 是 
函数 lock_init 接受 一 个 参数 ，plock 是 待 初始 化 的 
者 重复 申请 次 数 累积 变量 holder repeat_nr 置 为 0， 并 调 
量 初 值 赋值 为 1， 这样 锁 中 的 信号 量 就 成 为 了 二 元 信和 号 量 。 
。 它 接受 一 个 参数 ， 



















































































at 











Na 
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函数 sema_down 是 核心 函数 ， 乃 重 中 


函数 功能 就 是 在 信号 量 psema | 








上 执行 个 down 操作 。 


























信号 量 来 实现 的 ， 








大 




















日 


为 保证 down 操作 的 原子 性 ， 在 函数 开头 便 通 过 intr disable 关 了 中 断 。 








当 信 号 量 的 值 为 1 时 , down 操作 才 会 成 功 返 回 , 否则 就 在 该 信号 上 阻塞 。 这 上 
































判断 信号 量 是 否 为 0， 如 果 为 0， 就 进入 while 的 循环 体 做 两 件 事 。 
1. 将 自己 添加 到 该 信号 量 的 等 待 队 列 
















































































中 。 对 应 的 代码 为 : 


| list append(&psema->waiters, &running thread()->general tag); 


























2. 将 








| thread block (TASK BLOCKED); 


按理 说 ， 既 然 当前 线程 已 处 于 活动 中 ， 也 就 是 状态 为 TASK_ RUNNING， 
的 等 待 队列 中 ， 和 否则 重复 添加 的 话 会 破坏 队列 。 
j ASSERT 和 让 排除 当前 线程 已 在 等 待 队列 中 的 情况 。 
言 号 量 不 为 0， 也 就 是 为 1 (在 咱们 的 应 用 中 value 要 么 为 0， 要 么 为 1)， 或 者 之 前 为 0， 现 在线 





























如 果 








程 被 唤醒 后 已 经 为 1 了 ， 则 将 信号 量 减 1， 











(psema->value == 0) 做 判断 。 这 是 为 防 

















大 













































































此 ， 为 避免 异常 情况 发 4 


匀 已 阻塞 ， 状 态 为 TASK BLOCKED。 对 应 的 代码 为 : 


站 吕 








言 号 量 ，value 是 信号 量 的 初 值 ， 函 











此 锁 的 初始 化 中 会 调 
锁 。 函 数 功能 是 将 锁 的 持 有 者 holder 置 为 空 ， 将 持 有 





j sema init(&plock->semaphore，1) 将 锁 使 ) 


psema 是 待 执行 down 操作 的 信号 量 。 


前 线程 就 不 会 出 下 
E， 在 做 以 上 两 件 事 之 前 ， 














4 sema init。 














j 的 信号 








通过 while(psema->value == 0) 





见 在 此 信 

















即 psema->value--。 此 时 value 的 值 应 该 为 0， 
止 程序 出 错时 ， 出 现 value 大 于 1 的 情况 。 




































































六 











此 














j ASSERT 















































不 知道 大 伙 儿 是 否 奇怪 ,为 什么 上 面 在 判断 信和 号 量 是 否 为 0 时, 用 的 是 while, 而 不 是 让 while(psema-> 
value == 0) 和 if(psema->value == 0) 有 什么 不 同 吗 ? 

锁 本 身 也 是 公共 的 资源 ， 大 家 也 要 通过 竟 争 的 方式 去 获得 它 ， 因 此 想 要 获得 锁 的 线程 不 只 一 个 ， 当 阻 赛 
的 线程 被 唤醒 后 ， 也 不 一 定 就 能 获得 资源 ， 只 是 再 次 获得 了 去 竞争 锁 的 机 会 而 已 ， 所 以 判断 信号 量 的 值 最 好 
用 while, 而 不 是 用 让。 直观 上 理解 ,就 是 判断 的 次 数 不 同 ,线程 用 while， 可 以 在 被 唤醒 后 再 次 做 条 件 判断 ， 



































而 站 则 只 能 判断 一 次 ， 


比如 现在 有 3 个 线程 ， 




















tb 也 来 申请 锁 ， 但 
锁 的 操作 包括 两 件 事 。 











(1) 使 信号 量 的 值 恢 复 为 1。 

















的 线程 。 








(2) 唤醒 阻 























这 里 将 会 唤醒 线程 tb。 此 后 ，t_b 将 会 在 将 来 某 一 时 间 恢 复 运行 ， 继 续 抢 锁 。1 
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分 别 是 t a，t_b，t_c。 假 如 


1 于 信号 量 的 值 为 0， 故 tb 阻塞 。 当 线程 ta 执行 完 临 界 
































这 就 是 最 大 的 区 别 。 似 乎 是 说 了 等 于 没 说 ， 哈 哈 ， 我 知道 ， 待 兄弟 














前 锁 


















































1 线程 ta 持 有 ， 因 此 锁 中 1 

















给 您 


一 口 /CA 








举 个 例子 。 





== 


言 号 量 的 值 为 0。 
区 代码 后 它 会 释放 锁 ， 释 放 








E 巧 的 是 线程 tc 也 来 








申请 锁 了 ， 它 比 tb 先 得 到 调度 ， 因 此 ， 它 抢先 获得 了 锁 。 此 时 信号 量 又 变 成 了 0。 时 光 飞 逝 
tb 又 被 调度 上 处 理 器 了 ， 注 意 ， 下 面 要 见 分 晓 了 。 
。 如 果 之 前 是 用 这 psema->value == 0) 来 判断 信号 量 的 value 是 否 为 0， 线程 tb 醒 来 的 第 
















































































妨 ， 仅 终于 线程 





一 件 事 就 是 : 


执行 psema->value--， 使 value 减 1。 但 它 不 知 value 之 前 已 经 被 tc 置 为 0 了 ， 并 不 是 1， 您 看 ， 这 就 


错 了 吧 。 虽 然 value 是 uint8 t 类 型 ， 值 不 会 为 负 ， 但 值 会 变 成 8 位 宽度 的 最 大 值 255， 这 更 不 对 了 。 


























。 ”如果 之 前 是 用 while(psema->value == 0) 判 断 信号 量 的 value 是 否 为 0， 那 线程 tb 醒 来 的 第 




















et 


























阻塞 相关 的 工作 。 如 果 不 为 0， 则 执行 psema->value--， 使 value 减 1 为 0， 表示 获得 了 锁 。 











您 看 ， 锁 的 竞争 者 太 多 了 ， 并 不 是 说 线程 在 唤醒 后 ， 锁 就 在 那 闲 着 等 着 它 来 拿 。 必 须 确 保 锁 是 闲 着 日 














才 行 ， 因 此 线程 醒 来 后 依然 对 信号 量 做 判断 ， 我 们 必须 用 while。 























一 件 事 就 是 : 


再 次 执行 while 循环 的 判断 psema->value == 0， 确 认 下 value 是 否 变 成 1 了 ， 如 果 依 然 为 0， 继续 执行 


eT 






































不 过 话说 回来 了 ， 咀 们 这 里 是 可 以 用 让 代 奉 的 ， 只 不 过 用 while 更 通用 。 可 以 用 让 代替 的 原 
面 您 就 会 看 到 , 信号 量 的 up 操作 是 通过 thread_unblock 唤醒 线程 的 ， 而 thread_unblock 会 把 阻塞 





















































因 是 咱们 在 后 




















的 线程 放 在 就 


绪 队 列 的 队 首 ， 因 此 会 紧 随 当前 锁 的 持 有 者 之 后 调度 ， 也 就 是 当前 锁 持 有 者 释放 锁 后 ， 它 会 第 一 个 获得 锁 。 




















下 面 继续 看 代码 10-4-2。 


代码 10-4-2 (project/c10/b/thread/sync.c ) 

















41 /* 信号 量 的 up 操作 */ 

42 void sema up (struct semaphore* psema) { 

43 /* 关中 断 ， 保 证 原子 操作 */ 

44 enum intr status old status = intr disable(); 

45 ASSERT (Psema->Value == 0); 

46 if (!list empty(&psema->waiters)) { 

47 struct task struct* thread blocked = elem2entry(struct task struct, \ 
general tag, list pop(&psema->waiters)); 

48 thread unblock (thread blocked) ; 

49 } 

50 psema->valuet++; 

1 ASSERT (psema->value == 1)，} 

52 /* 恢复 之 前 的 中 断 状态 */ 

53 intr set status(old status);} 

54 } 

55 


56 /* 获取 锁 plock */ 
57 void lock acquire (struct lock* plock) { 


58 /* 排除 曾经 自己 已 经 持 有 锁 但 还 未 将 其 释放 的 情况 */ 






































59 if (plock->holder != running thread()) 

60 sema down (&plock->semaphore); // 对 信号 量 p 操作 ， 原子 操作 
61 plock->holder = running thread(); 

62 ASSERT (plock->holder repeat nr == 0); 

63 plock->holder repeat nr = 1; 

64 } else { 

65 plock->holder repeat nrt++; 

66 } 

67 } 

68 


69 /* 释放 锁 Plock */ 
70 void lock _ release (Struct lock* plock) { 

















ASSERT (plock->holder == running thread() ) 

时 交 if (plock->holder repeat nr > 1) { 

了 3 plock->holder repeat _ nr--; 

74 return; 

75 } 

76 ASSERT (plock->holder repeat nr == 1); 

EY 

78 plock->holder = NULL; // 把 锁 的 持 有 者 置 空 放 在 V 操作 之 前 
79 plock->holder repeat nr = 0; 

80 sema up (&plock->semaphore); // 信号 量 的 V 操作 ， 也 是 原子 操作 
2 寺 





函数 sema_up 接受 一 个 参数 ，psema 是 待 执行 up 操作 的 信号 量 。 函 数 功能 是 将 信号 量 的 值 加 1。 











函数 内 部 的 操作 也 要 保证 原子 性 ， 因 此 在 函数 的 开头 也 执行 了 intr_disable 函数 关中 断 。 
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sema_up 是 使 信号 量 加 1， 这 表示 有 信和 号 资源 可 用 了 ， 也 就 是 其 他 线程 可 以 申请 锁 了 ， 因 此 在 信号 量 
的 等 待 队列 psema->waiters 中 通过 list pop 弹出 队 首 的 第 一 个 线程 ， 并 通过 宏 elem2entry 将 其 转换 成 PCB， 
存储 到 thread blocked 中 。 然 后 通过 thread_unblock(thread blocked) 将 此 线程 唤醒 。 
在 将 线程 唤醒 后 ， 接 下 来 将 信号 量 值 加 1， 即 代码 psema->value++。 

提醒 一 下 ， 所 谓 的 唤醒 并 不 是 指 马 上 就 运行 ， 而 是 重新 加 入 到 就 绪 队 列 ， 将 来 可 以 参与 调度 ， 运 行 是 
将 来 的 事 。 而 且 当 前 是 在 关中 断 的 情况 下 ， 所 以 调度 器 并 不 会 被 触发 。 因 此 不 用 担心 线程 已 经 加 到 就 绪 队 
列 中 ， 但 value 的 值 还 没 变 成 1 会 导致 出 错 。 

最 后 通过 intr_set_status(old_status) 恢 复 之 前 的 中 断 状态 。 

函数 lock_acquire 接受 一 个 参数 ，plock 是 所 要 获得 的 锁 ， 函 数 功 能 是 获取 锁 plock。 有 了 时候， 线程 可 能 
会 诬 套 申请 同一 把 锁 ， 这 种 情况 下 再 申请 锁 ， 就 会 形成 死 锁 ， 即 自己 在 等 待 自 己 释 放 锁 。 因 此 ， 在 函数 开头 
先 判断 自己 是 否 已 经 是 该 锁 的 持 有 者 ， 即 代码 让 (plock->holder != running thread0)。 如 果 持 有 者 已 经 是 自己 ， 
就 将 变量 holder_ repeat_nr++， 除 此 之 外 什么 都 不 做 ， 然 后 函数 返回 。 如 果 自 己 尚未 持 有 此 锁 的 话 ， 通 过 
sema_down(&plock->semaphore) 将 锁 的 信号 量 减 1， 当 然 在 sema_down 中 有 可 能 会 阻塞 ， 不 过 早晚 会 成 功 返 
的 。 成功 后 将 当前 线程 记 为 锁 的 持 有 者 ， 即 plock->holder = running thread(), 然后 将 holder repeat_ nr 置 为 1， 
表示 第 1 次 申请 了 该 锁 。 

函数 lock_ release 只 接受 一 个 参数 ，plock 指向 待 释放 的 锁 ， 函 数 功 能 是 释放 锁 plock。 当 前 线程 应 该 
是 锁 的 持 有 者 ， 所 以 用 ASSERT 判断 了 一 下 。 如 果 持 有 者 的 变量 holder repeat_nr 大 于 1， 这 说 明 自 己 多 
次 申请 该 锁 ， 此 时 还 不 能 真正 将 锁 释 放 ， 因 此 只 是 将 holder repeat nr--， 随 后 返回 。 如 果 锁 持 有 者 的 变量 
holder repeat_nr 为 1， 说 明 现 在 可 以 释放 锁 了 ， 通 过 代码 plock->holder = NULL 将 持 有 者 置 空 ， 随 后 将 
holder repeat nr 置 为 0， 最 后 通过 “sema_up(&plock->semaphore)” 将 信号 量 加 1， 自 此 ， 锁 被 真正 释放 。 
注意 ， 要 把 持 有 者 置 空 语句 “plock->holder = NULL” 放 在 sema_up 操作 之 前 。 原 因 是 释放 锁 的 操作 
并 不 在 关中 断 下 进行 ， 有 可 能 会 被 调度 器 换 下 处 理 器 。 若 sema_up 操作 在 前 的 话 ，sema_up 会 先 把 value 
置 1， 若 老 线程 刚 执行 完 sema_up， 还 未 执行 “plock->holder = NULL” 便 被 换 下 处 理 器 ， 新 调度 上 来 的 进程 
有 可 能 也 申请 了 这 个 锁 ，value 为 1， 因 此 申请 成 功 ， 锁 的 持 有 者 plock->holder 将 变 成 这 个 新 进程 的 PCB。 
假如 这 个 新 线程 还 未 释放 锁 又 被 换 下 了 处 理 器 ， 老 线程 又 被 调度 上 来 执行 ， 它 会 继续 执行 “plock->holder = 
NULL”， 将 持 有 者 置 空 ， 这 就 乱 了 。 

好 啦 ， 有 关 锁 的 内 容 就 介绍 完了 ， 咱 们 下 一 节 得 想 办 法 找 个 应 用 的 环境 ， 还 是 拿 打印 字符 串 测试 吧 ， 
看 看 咱们 的 锁 能 否 成 功 解决 竞争 条 件 。 


节 我 们 实现 输出 。 
大 家 若是 用 过 Linux， 肯 定 都 熟悉 Linux 终端 ， 它 是 咱们 与 Linux 系统 交互 的 界面 。 
终端 也 称 为 控制 台 ， 这 是 在 计算 机 历史 中 遗留 下 来 的 概念 。 在 过 去 计算 机 还 是 奢侈 品 ， 为 了 充分 利用 
计算 机 资源 ， 允 许多 个 用 户 同时 连接 到 机 器 上 ， 这 类 似 Windows 多 用 户 的 概念 ， 为 的 是 让 更 多 的 用 户 能 
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够 控制 计算 机 ， 因 此 终端 便 称 为 控制 台 。 























为 了 不 让 大 伙 儿 失望 ， 提 前 说 一 下 ， 这 里 不 打算 实现 这 种 类 似 Linux 中 的 终端 ， 但 还 是 要 简要 介绍 下 
终端 的 实现 原理 。 
终端 的 构造 原理 很 简单 , 就 是 把 用 户 键入 的 命令 传送 到 主机 , 待 主机 运算 完成 后 再 将 结果 送 回 给 用 户 ， 
终端 不 提供 任何 额外 功能 ， 仅 是 个 显示 窗口 。 
按理 说 一 个 用 户 就 该 配 有 一 个 显示 器 ， 这 样 才 是 多 用 户 该 有 的 “体验 ” 但 那个 时 代 太 穷 了 ， 计 算 机 
对 那 时 的 人 们 来 说 就 如 同 现代 人 们 想 拥 有 私人 飞机 一 样 奢侈 ， 因 此 那 时 候 的 人 们 不 可 能 会 那么 “任性 ” 
为 了 让 更 多 的 人 同时 使 用 计算 机 ， 必 须 在 同一 个 显示 器 下 实现 多 用 户 ,， 也 就 是 分 别 为 每 个 用 户 虚拟 出 一 个 
“显示 器 ” 这 就 是 虚拟 终端 的 由 来 ， 因 此 每 个 控制 台 其 实 就 是 个 虚拟 终端 ， 用 户 看 到 的 屏幕 是 由 软件 虚拟 
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出 来 的 。 
虚拟 终端 就 是 我 们 熟知 的 ty， 据 说 tty 原 指 电 传 打字 机 ， 即 TeleTYpes， 它 是 一 种 用 打字 机 键盘 通过 
串 行 线 发 送 和 接收 信息 的 设备 ， 后 来 被 键盘 和 显示 器 取代 了 ， 因 此 称 为 tty 翻译 为 终端 更 合适 。 我 们 登录 














































































































系统 后 ， 就 会 在 后 台 运 行 一 个 tty 进程 ， 如 图 10-7 所 示 。 [root@localhost “~]# ps 
这 种 虚拟 终端 是 如 何 实现 的 呢 ? 还 是 要 依赖 于 硬件 本 身 的 功能 。 dal tu /OOo 0 bn 
我 们 知道 屏幕 在 不 同 模式 下 显示 的 字符 数 是 有 限 的 ， 比 如 咱们 所 用 的 、 革 人 于 站 人 下痢 轩 和 
80*25 模式 只 会 显示 2000 个 字 ， 因 此 屏幕 不 能 一 次 性 把 显存 中 的 全 部 数据 4 图 10-7 tty 












































显示 出 来 ， 为 此 ， 显 卡 提 供 了 这 两 个 寄存 器 “Start Address High Register” 和 “Start Address Low Register” 
来 设置 数据 在 显存 中 的 起 始 地 址 。 起 始 地 址 是 用 16 位 来 表示 的 ， 它 们 分 别 设置 显存 地 址 的 15~8 位 和 7 一 
0 位 。 因 此 ， 我 们 可 以 把 不 同 的 16 位 地 址 分 别 写 入 这 两 个 寄存 器 ， 从 而 实现 将 显存 分 块 显示 的 目的 ， 也 
就 是 实现 了 虚拟 终端 。 由 此 可 见 ， 虽然 多 个 虚拟 终端 共用 同一 个 显示 器 ， 也 就 是 共享 同一 片 显存 ,但 用 户 
之 间 能 够 互 不 干扰 ， 就 是 因为 每 个 虚拟 终端 显示 的 是 显存 中 的 不 同 区 域 ， 如 图 10-8 所 示 。 
显存 原理 就 是 这 样 ， 它 们 如 何 使 用 呢 ? 
Linux 启动 后 一 般 会 有 7 个 界面 可 选 ，1 个 
是 图 形 界面 ， 也 称 为 Xwindows， 我 们 可 以 像 操 
作 Windows 那样 用 鼠标 点 击 图 形 控件 与 系统 交 
互 。 还 有 6 个 纯 文本 的 控制 台 界面 ,我们 的 shell 
蝗 

























































































































































































































































































| 便 运行 在 控制 台 界面 中 ， 因 此 我 们 才 可 以 输入 命 
令 与 Linux 内 核 交 互 。 一 般 按 下 Alt+tF1、Alt+F2 
等 组 合 键 则 会 切换 到 不 同 的 控制 台 (各 Linux 发 
行 版 本 会 有 差异 )， 个 人 感觉 上 就 像 切换 用 户 一 
p pa vw be nen” 样 ， 每 次 切换 ， 后 台 对 应 的 操作 就 是 变换 那 两 个 
vor 寄存 器 中 的 起 始 地 址 。 

现在 咱们 操作 Linux， 都 是 通过 ssh 远程 连 
上 去 ， 除 了 去 机 房 外 ， 很 少 有 直接 在 机 器 上 登录 



































































































































































































































和 系统 的 。 包 括 我 自己 装 虚 拟 机 的 时 候 ， 都 是 男装 
个 ssh 工具 连接 到 虚拟 机 ， 习 惯 了 ssh 客户 端的 便利 。 顺 便 说 一 下 ， 这 种 从 远程 连接 到 Linux 主机 的 终端 称 
为 pts， 如 图 10-9 所 示 。 [root@localhost ~]# who 
who 命令 可 以 显示 当前 登录 到 系统 中 的 用 户 ， 默 认 情 ”出 让 且 生生 
况 下 显示 用 户 名 、 登 录 方 式 (本 地 tty1， 还 是 远程 pls) 及 [saa 























登录 时 间 等 。 4 图 10-9 pts 和 tty 
结果 中 第 1 行 的 “root tty/1” 是 在 本 地 用 root 登录 的 ， 就 是 上 面 所 说 的 图 10-7。 第 2 行 的 “work pts/0” 
work 账号 在 远程 登录 的 ， 后 面 有 显示 远程 IP: 192.168.56.1。 
我 们 不 需要 多 个 终端 ， 因 此 并 不 打算 实现 这 种 “真正 ”的 “虚拟 ”终端 〈 这 么 说 似乎 有 点 矛盾 )， 目 
前 只 要 1 个 终端 便 能 满足 我 们 的 需求 。 那 我 们 本 节 要 干吗 呢 ? 
在 我 们 的 系统 中 没有 复杂 的 显卡 寄存 器 操作 ,我们 只 有 一 个 终端 因此 所 有 的 输出 都 往 这 一 个 屏幕 上 
挤 ， 这 就 容易 让 输出 凌乱 不 堪 。 为 了 让 这 一 个 屏幕 上 的 内 容 井 然 有 序 ， 既 然 我 们 已 经 实现 了 锁 ， 我 们 可 以 
通过 锁 实 现 输出 互 斥 ， 这 样 屏幕 上 的 字符 就 会 井然 有 序 ， 终 于 锁 派 上 用 场 了 。 

虽然 我 们 没有 真正 的 多 控制 台 , 但 是 我 们 把 终端 当成 设备 来 对 等， 终端 就 是 我 们 的 标准 输出 设备 ， 
此 我 们 本 节 要 构造 出 一 个 终端 设备 ， 以 后 的 打印 输出 就 通过 它 了 。 

好 啦 ， 不 再 卖 关 子 了 ， 上 菜 ， 我 们 在 device 目录 中 创建 了 文件 console.c， 请 见 代码 10-5。 


代码 10-5 (project/c10/b/device/console.c ) 
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1 #include "console.h" 
2 #include "print.h" 
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3 #include "stdint .hn 

4 #include "sync.h" 

5 #include "thread.n" 

6 static struct lock console lock; // 控制 台 锁 
7 

8 


/* 初始 化 终端 */ 
9 void console init() { 


1 lock init 
11 } 


13 /* 获取 终端 */ 


(&console lock); 


14 void console acquire() { 
和 lock acquire(&console lock); 


16 } 


18 /* 释放 终端 */ 


19 void console release() { 
20 lock release(&console lock); 


21 } 











23 /* 终端 中 输出 字符 串 */ 
24 void console put str(char* str) { 


25 console acquire(); 
26 put_str(str); 

23 Console_release(); 
28 } 

29 








30 /* 终端 中 输出 字符 */ 
31 void console put char (uint8 t char asci) { 


32 console acquire(); 
33 But Char(echar dscti)y 
34 console release ();，; 
SS 

36 











37 /* 终端 中 输出 十 











六 进 制 整数 */ 


38 void console put int (uint32 七 num) { 





39 console acquire(); 
40 put_int (num); 

41 console release ();，; 
42 } 


文件 console.c 还 是 比较 简单 的 ， 简 洁 到 我 都 觉得 没什么 可 说 的 ， 哈 哈 ， 毕 竟 它 不 是 真正 意义 上 的 终 
端 ,甚至 连 伪 终 端 都 算 不 上 , 我 们 只 是 通过 它 让 输出 变 得 更 整洁 。 您 看 到 了 , 它 就 是 对 各 种 锁 操 作 的 封装 ， 


完全 就 是 锁 的 应 用 。 


文件 中 定义 的 console_ lock 是 终端 锁 ， 对 终端 的 所 有 操作 都 是 上 
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绕 申 请 这 个 锁 展开 的 。 它 必须 是 全 局 














唯一 的 ， 因 此 类 型 是 静态 static。 








文件 开头 定义 的 初始 化 终端 函数 console init、 获 取 终 端 函数 console acquire 和 释放 终端 函数 console release 























较 简 单 ， 一 看 就 明白 。 











后 面 定义 了 三 个 输出 函数 ，console put str、console put char 和 console put int， 它 们 分 
































别 是 put_str、put_char 和 put_ int 的 封装 ， 用 于 在 终端 中 打印 字符 串 、 单 个 字符 和 十 六 进 制 整数 。 这 三 个 终端 打印 
函数 共性 是 : 在 输出 前 后 增加 了 console_acquire 去 获取 终端 ，console_release 去 释放 终端 ， 以 此 来 实现 互 斥 。 
说 完了 ， 看 看 如 何 应 用 吧 ， 先 将 console init 添加 到 init_ all 中 ， 如 代码 10-6 所 示 。 






































代码 10-6 (project/c10/b/kernel/init.c ) 


9 /* 负 责 初始 化 所 有 模块 */ 
10 void init all() { 
1 注 put_ str ("init all\n"); 
了 idt init(); // 初始 化 中 断 
13 mem init() // 初始 化 内 存 管理 系统 
14 thread init (); // 初始 化 线程 相关 结构 
5 timer init (); // 初始 化 PIT 
16 console init (); // 控 制 台 初始 化 最 好 放 在 开 中 断 之 前 


£7- 直 

















除了 在 init all: 


























整 ， 只 是 这 样 的 顺序 看 着 顺眼 。 


| 


添加 了 console init 外 ， 其 他 模块 的 初始 化 顺序 也 有 所 














下 面 是 应 用 测试 ， 咱 们 把 main.c 中 的 字符 串 输出 函数 put_str 统统 改 为 通过 终端 函数 console ”put_str 
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输出 ， 如 代码 10-7 所 示 。 
代码 10-7 (project/c10/b/kernel/main.c ) 





10 int main(void) { 


于 主 put str("I am kernel\n"); 

12 init all(); 

13 

14 thread start("k thread a", 31, k thread a, "argA "); 
于 六 thread start("k thread b", 8, k thread b, "argB ") ， 
16 

pg intr enable (); 

18 while(1) { 

19 console put str("Main "™); 

20 }; 

21 return 0; 

22 } 

23 





24 /* 在 线程 中 运行 的 函数 */ 
25 void k thread al(lvoid* arg) { 
26 /* 用 voidx 来 通用 表示 参数 ， 

















































































































被 调用 的 函数 知道 E 什么 类 型 的 参数 ， 自 己 转换 x/ 
27 char* para = arg; 
28 while (1) 
29 console put_ str (para); 
30 } 
31 站 
32 





33 /* 在 线程 中 运行 的 函数 */ 
34 void k thread b (voidx arg) { 
35. /* voidx 来 通用 表示 参数 ， 














































































































被 调用 的 函数 知道 自己 需要 什么 类 型 的 参数 ， 自 己 转 换 */ 
36 char* para = arg; 
37 while (1) 
38 console put str (para); 
39 } 
40 } 























编译 ， 运 行 结 果 如 图 10-10 所 示 。 


Bochs x86 emulaton http://bochs.sourceforge.net/ 















































argf argf argf argh argh argh argf argh argf arg 折 argh argf 
argh argh argh argh argf argf hargh arg gf arg 折 ar gf argh argf 
argh argf Main Main Main Main Main Main Main Main i in Main Main 
Main Main Main Main Main Main Main Main Main in Main Main in Main Main 
Main Main Main Main Main Main Main Main Main Main Main Main Main Main Main 
Main Main Main Main Main Main Main Main Main Main Main in Main Main Main 
Main Main Main Main argB argB argB argB gB argB argB argB argB argB 
argB argB argB argB argB argB argB argB argB argB gyB argB argB 
Main Main Main Main Main Main Main n Main Main Main i 
Main Main Main Main Main Main Main in Main Main in Main 
Main Main Main Main Main in Main Main Main Main Main Main Main 

Main Main Main Main Main Main Main Main Main Main in Main 

Main argf argf argf argh argf arg argh argh argh argf 

argh argf argh argh argh argh argh argh argf argf gh argf 
argh argh argf argh argh argh argh argf argh argf argh argf 
argh argh argh argh argh argf argh argfi Pr argh argfi 6 argh argf 
argh argh argh argh argh argh argf argh a argh argf gf argh argf 
argh argh argf argf argf argf argf argh argf argf argf gf argh argh argf 
argh argf argf argh argf argh argf argh argh argh argh argh argh argh argf 
argh argh argf argh argh argh argh argh argh argh argf argh argf argf 
argh argh argf argf argh Main Main Main Main Main Main Main Main Main Main 
Main Main Main Main Main Main Main Main Main Main Main Main Main Main Main 
Main Main Main Main Main Main Main Main Main Main Main Main Main Main Main 
Main Main Main Main Main Main Main Main Main Main Main Main Main Main Main 
Main Main Main 


CTRL + 3rd button enables nouse | | | | | | | | | | 


10-10 ”通过 终端 输出 字符 有 
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您 看 ， 字 符 串 输出 的 顺序 是 : 

“argA” -> “Main” -> “argB” -> “Main” -> “argA” ->“main”, 

字符 串 打印 顺序 不 再 随 线程 调度 的 顺序 一 致 , 而 且 每 组 字符 串 的 数量 
上 ， 因 此 线程 阻塞 起 作用 了 。 

好 啦 ， 我 们 的 终端 到 这 就 算 完成 了 ， 已 经 能 够 满足 咱们 需求 ， 今 后 也 不 再 更 新 它 了 。 

















较 之 前 关中 断 的 版 本 多 了 一 倍 以 
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日 ， 我 们 
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从 键盘 获取 输入 


的 终端 








pr AAA 











然 简陋 ， 但 
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键盘 已 经 很 少 有 





性 ， 所 以 肯定 不 能 将 过 去 的 成 绩 全 盘 反 
但 大 学 教材 中 依然 用 8086 处 到 
1 的 PS/2 键盘 为 例 


Ey 








好 多 据 
因此 ， 咱 人 


键盘 输 











10.3.1 


计算 机 是 个 系统 ， 系 统 是 指 由 各 功能 独立 的 模块 组 成 的 整体 ， 相当 于 在 内 部 按 功 
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门 也 以 经 




















80 后 这 一 代 人 
] 了， 但 后 来 的 新 型 








人 66 FA 
是 个 二 


算 出 ”了 ， 本 节 咱 们 再 实现 个 “输入 ” 即 从 键盘 获取 键入 的 字符 。 
过 的 键盘 有 三 种 类 型 PS/2 键盘 、USB 键盘 和 蓝牙 键盘 。 虽 然 PS/2 
键盘 都 是 基于 它 发 展 起 来 的 ， 基 础 原理 是 不 变 的 ， 因 为 要 考虑 兼容 












































































































































E 翻 而 重新 发 明 一 套 做 法 ， 这 就 像 Intel 处 理 器 虽然 早已 经 发 展 到 I7 
器 作为 学 习 汇 编 指令 的 模型 一 样 ， 原 理 不 变 ， 经 典 ， 经 得 起 考验 。 








































































































入 原理 简介 





展开 介绍 。 
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台 | 
分 层 ， i 


用 





个 模块 就 








像 个 功能 独立 的 黑 盒 子 ， 上 下 游 模 块 之 间 可 依赖 ， 相 互 提供 数据 。 在 所 有 模块 的 配合 下 ， 使 这 个 系统 作为 











整体 对 外 






































塞 到 主机 是 








这 个 键盘 控 
接收 来 
存 ， 然 后 向 
的 中 断 处 至 









































， 这 涉及 两 个 功 
键盘 是 个 独立 的 设备 ， 
用 是 : 每 当 键盘 上 人 发生 按 键 


自 键盘 编码 器 上 
中 断 代 到 
程序 读 入 8042 处 悍 

它们 的 关系 如 

8048 是 键盘 上 
哪个 键 被 按 下 。 当 和 
当然 知道 是 哪个 键 被 按 


是 供 服务 。 
因此 ， 我 们 平时 所 熟悉 的 键盘 操作 ， 也 是 由 独立 的 模块 分 
能 独立 的 芯片 的 配合 。 

在 它 内 部 有 个 中 
有明 作 ， 
并 不 在 键盘 内 











| 器 可 
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层 实 现 的 ,但 是 并 不 是 简单 地 由 键盘 把 数 
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作 键 盘 编码 器 的 芯片 ， 通 常 是 Intel 8048 或 
它 就 向 键盘 控制 器 报告 哪个 键 被 


部 ， 它 在 主机 内 部 的 主板 上 ， 通 








容 芯 片 ， 它 的 作 
按 下 ， 按 键 是 否 弹 起 。 
常 是 Intel 8042 或 兼容 芯片 ， 它 的 作用 是 
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:就 是 监控 “村 | 














a 手 上 发 














E 按 键 操作 时 





8048 
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行 , 它 毕竟 要 将 按键 信息 传 给 8042, 必须 
那个 键 , 为 此 8048 必然 要 和 8042 
达成 一 个 协议 ， 这 个 协议 规定 了 键盘 上 的 每 个 物 


知道 到 底 是 按 下 了 




















理 键 对 应 的 唯 


数值 ， 说 


























的 按键 进行 











码 ， 











为 每 个 








这 样 双方 都 知 














时 长 按 F5 键 时 ， 
是 说 , 我 们 也 得 
续 按 键 操 作 中 至 











丝 不 苟 地 完成 繁 











下 。 但 光 它 自己 为 


白 了 就 是 对 键盘 .| 
扩 键 分 
道 了 每 个 数值 代表 哪个 键 。 当 某 个 键 被 按 下 时 ,8048 把 这 个 键 对 应 的 数值 发 送 给 8042, 8042 
根据 这 个 数值 便 知道 是 哪个 键 被 按 下 了 。 

您 想 ， 键盘 上 那么 多 的 键 ， 每 个 键 都 要 有 数 
编码 映射 表 ， 当 然 人 家 可 不 是 这 么 俗套 的 名 字 ， 这 张 

回想 一 下 ， 当 我 们 想 在 屏幕 上 连续 输入 多 个 相同 
输入 时 才 松 手 ， 也 就 是 键 被 弹 起 。t 


上 道 还 不 
得 让 8042 

















上 所 有 
配 唯 一 的 数字 ， 








受 | 
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直 ， 因 此 所 有 按键 对 应 的 数值 便 组 成 了 一 张 “按键 -数值 
表 的 官方 名 称 为 键盘 扫描 码 。 

的 字符 时 ， 我 们 通常 都 是 按 下 某 个 按键 不 松手 ， 结 束 
里 输 表示 无 语 的 时 候 ， 或 者 刷新 网 页 
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如 在 聊天 工 














总 之 ， 很 少 有 人 一 
让 8042 知道 何 时 按键 被 弹 起 ， 也 就 是 了 
I 底 输入 了 多 少 个 相同 
也 要 记录 按键 被 松 玫 





F〈 弹 起 ) 时 





一 个 键 的 状态 要 么 是 按 下 ， 要 
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的 工作 。 














下 一 下 地 按键 。 当 我 们 松 开 手 ， 按 键 被 弹 起 时 就 表示 输入 完成 ， 也 就 

f 键 操作 何 时 结束 ， 这 样 8042 才 知 道 用 户 在 一 次 持 
的 字符 。 因 此 , 键盘 扫描 码 中 不 仅仅 要 记录 按键 被 按 下 时 对 应 的 编码 ， 
的 编码 。 总 之 在 输入 框 中 看 似 随 意 的 打字 行为 ， 在 幕后 都 有 一 些 硬件 在 一 
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么 是 弹 起 





因此 一 个 键 便 有 两 个 编码 ， 按 键 被 按 下 时 的 编码 叫 通 码 ， 也 








按键 | 








上 
松手 时 会 持续 产 4 











的 触 点 接 通 了 内 部 
































路 被 断 7 











于 了 ， 不 
无 论 是 按 下 键 ， 或 是 松 开 键 ， 
发 送 到 主板 上 的 8042 芯片 ， 由 8042 处 理 后 保存 在 自 
器 便 去 执行 键盘 中 断 处 理 
这 个 键盘 中 断 处 
到 键 的 ASCII 码 , 扫 



































程序 ， 将 8042 











E 相 同 的 码 ， 直 到 按键 被 松 3 
持续 产生 码 了 ， 故 断 码 











路 ， 使 硬件 产生 了 一 个 码 ， 故 通 码 也 称 
开 时 才 终 止 ， 因 此 按键 被 松 开 弹 起 时 产生 的 编码 叫 断 码 ， 也 就 是 
描 码 是 由 通 码 和 断 码 组 成 的 。 

巴 按键 对 应 的 扫描 码 ( 通 码 或 


也 称 为 breakcode。 
当 键 的 状态 改变 后 ,键盘 中 的 8048 芯片 























处 理 过 的 扫 











码 从 它 上 
































香 程 序 是 中 























我 们 的 键盘 中 断 处 型 
描 码 转换 成 对 
空格 键 的 扫 
按键 的 表现 行为 是 


az AT 


件 ” 招 
中 只 能 得 到 
































们 程序 员 负 责编 写 
码 是 硬件 提供 的 编码 集 , ASCII 是 软件 





的 , 值得 





























一 个 键 的 扫 
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为 makecode。 按 键 在 被 按 住 不 


f 码 》 

















己 的 寄存 器 中 ， 然 后 向 8259A 发 送 

















FP 断 信号 ， 这 样 处 理 



































注意 的 是 我 们 只 能 得 









































程序 是 同 硬件 











描 码 ， 


打交道 的 ， 
应 的 “软件 ”ASCII 码 。 
该 扫描 码 是 0x39 


全 已 
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丸 此 只 
段 如 我 
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到 硬件 提供 
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理 程序 使 











j 子 们 








出 到 屏幕 。 





因此 ， 按 





编码 来 处 理 ;此 
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程序 负责 的 , 











F 空 格 键 可 


以 在 屏幕 








上 输 昌 











但 绑 
比如 
因此 














惯 。 





们 也 可 以 不 走 寻常 路 ， 完 
将 空格 键 的 扫 
上 ， 按 键 产生 什么 样 的 行为 ， 完 全 是 
产生 对 应 的 字符 的 ASCII 码 。 











描 码 处 理 成 字符 

















全 可 以 将 扫 


























以 上 仅 是 个 大 致 的 原 
到 键盘 扫描 码 的 分 类 ， 











理 , 主机 上 的 
咱们 下 节 再 说 。 























10.3.2 ”键盘 扫描 码 


任何 事物 
虑 到 兼容 性 ， 
键 的 扫 
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计算 机 外 








后 四 








| 会 会 有 六 
建 盘 的 中 断 处 理 
如 ASCII 码 ， 因 此 我 们 可 以 在 中 断 处 到 
转换 成 ASCII 码 0x20， 然 后 将 ASCII 码 0x20 交 给 我 们 的 put_char 函数 , 将 ASCII 码 写 入 显存 ， 也 就 是 输 
D 一 个 空格 ， 

描 码 转换 成 任 
村 g 的 ASCII 码 , 也 就 是 按 空 格 键 时 相当 于 键入 





的 寄存 器 中 读 取 出 来 ， 继 续 进 行 下 en 
到 键 的 扫 
FP 约定 的 编码 集 , 这 两 个 是 1 
码 ， 但 我 们 可 以 将 得 到 的 “ 硬 
门 在 键盘 上 按 下 了 空格 键 ， 我 们 在 键盘 中 汤 处 天 








描 码 ,并 
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程序 






































充当 了 字符 处 到 





程序 便 





上 程序 




















就 是 这 么 来 的 。 


细 介 绍 )， 而 不 是 空格 键 的 ASCII 码 0x20。 
般 的 字符 处 
程序 中 将 空格 的 扫描 码 0x39 














不 符合 





意 字符 的 ASCII 码 ， 





由 字 处 型 














8042 芯片 是 如 











名 有 今天 的 繁荣 ， 


























同 的 键 在 不 同 
方案 有 不 同 











可 想 





E 软 人 





F 负 责 的， 我 们 也 按照 约定 俗 成 的 规则 ， 





0 何 处 班 











根 























盘 上 的 键 不 多 ， 








至 于 为 什么 有 这 人 么 多 套 扫 
是 为 了 方便 工作 ， 


媒体 的 支持 越 来 越 强大 ， 键 盘 上 支持 
增加 了 功能 相同 的 按键 ， 比 如 左右 都 有 shift、alt、ctrl， 于 
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描 码 ， 


个 
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习 是 : 


能 的 原 














编码 时 要 考虑 后 续 上 
因此 扫描 码 规模 也 小 ， 






































高 效 ， 因 此 要 跟着 扩充 、 更 着 
第 一 套 键盘 扫 











XT 键盘 和 今天 的 键盘 确实 








的 软 硬 伯 
旧 扫 描 码 的 编码 方法 足够 


的 功能 键 就 多 了 ， 



































码 必然 是 


























EE 
对 编码 处 理 时 也 要 方便 才 行 ， 因 此 编码 是 有 规律 的 。 
应 对 。 后 来 计算 机 逐渐 发 展 ， 尤 其 是 对 多 











的 发 展 都 是 新 老 交 蔡 的 过 程 ， 发 展 过 程 中 除了 要 
j 知 ， 工 程 师 们 在 兼容 怕 


分 别称 为 scan code set 1、 
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只 是 这 样 不 


eb 4 


自 键盘 中 8048 芯片 的 扫 
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我 们 的 习 















































吸取 前 辈 的 精华 ， 








气 弃 它们 的 糟粕 之 外 ， 
方面 付出 了 多 大 的 努力 。 
码 是 由 键盘 中 的 键盘 编码 器 决定 的 ,不同 的 编码 方案 便 是 不 同 的 键盘 扫描 码 ， 也 就 是 说 ， 相 
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上 为 了 方便 人 们 使 用 键盘 ， 
是 原 有 的 编码 方法 使 得 扫 





























1 或 者 重新 来 一 套 新 的 ， 于 是 便 有 了 新 的 键盘 扫 





描 码 。 
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ee 
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lll 
ee 


| DEL 














a 





4 旦 
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很 不 一 


样 ， 


10-12 1BM Personal Computer XT 键盘 
Fl 一 Fl10 这 几 个 功能 键 都 是 在 键盘 的 左边 








描 码 的 处 理 


显然 不 合理 。 
按 下 什么 





描 码 的 呢 ?” 这 涉及 


还 要 考 








的 编码 方案 下 产生 的 通 码 和 断 码 也 是 不 同 的 《即使 有 相同 的 例外 ， 也 是 巧合 )， 不 同 的 编码 
的 编码 规则 。 
四 不 同 的 编码 方案 ， 键 盘 扫描 码 有 三 套 ， 


Scan code Set 2、scan code set 3 。 


码 就 是 对 键盘 中 所 有 键 的 编码 ， 编 码 的 目的 

















期 键 











在 键盘 的 另 一 














变 得 











。 男 外 ， 这 张 图 





侧 也 
不 再 


| 最 早 的 键盘 使 用 的 ， 它 就 是 XT 键盘 所 用 的 扫描 码 。XT 键盘 如 图 10-12 所 示 。 
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是 黑白 的 ， 似 乎 也 显得 更 加 久远 。 
很 多 用 户 不 喜欢 XT 键盘 上 的 回 车 键 和 左 shift 键 的 位 置 ， 因 此 在 AT 键盘 上 有 了 改进 ， 如 图 10-13 所 示 。 
[NaN 

图 | 



































[thls hs hE = Ns | fed ly 
Mpa 














和 图 10-13 1BM Personal Computer AT 键盘 
这 张 图 是 彩色 的 ， 显 得 很 “近代 ” 
尽管 AT 键盘 上 的 backspace 键 变 得 更 小 了 ， 按 起 来 也 困难 了 ， 但 键 的 位 置 布 局 重新 ， 使 计算 机 用 户 
感到 非常 顺手 ， 因 此 AT 键盘 一 经 推出 后 特别 受 计算 机 用 户 的 欢迎 。 

AT 键盘 上 所 用 的 扫描 码 就 是 第 二 套 键盘 扫描 码 ， 也 就 是 现在 键盘 上 普通 使 用 的 扫描 码 。 您 不 要 觉得 
键 F1~F10 的 位 置 很 怪异 ， 这 和 扫描 码 无 关 ， 言 外 之 意 是 不 管 键 在 哪里 ， 键 对 应 的 扫描 码 是 由 8048 编码 
的 ， 键 的 扫描 码 和 键 的 物理 位 置 无 关 。 
第 三 套 键盘 扫描 码 用 在 IBM PS/2 系列 高 端 计算 机 所 用 的 键盘 上 ， 还 有 一 些 运 行商 业 版 UNIX 系统 的 计算 
机 也 有 用 到 它 , 不 过 这 种 键盘 如 今 很 少 看 到 了 , 因此 第 三 套 键盘 扫描 码 也 很 少 到 了 。 这 种 键盘 如 图 10-14 所 示 。 
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没 辐 国 | 四 
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ss 
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第 三 套 键盘 扫描 码 的 键盘 

综 上 所 述 ， 第 二 套 键盘 扫描 码 几 乎 是 目前 所 使 用 的 键盘 的 标准 ， 因 此 大 多 数 键 盘 向 8042 发 送 的 扫 
码 都 是 第 二 套 扫描 码 。 

您 看 ， 我 说 的 是 现在 “大 多 数 ” 键 盘 用 的 都 是 第 二 套 扫描 码 ， 但 也 难免 还 有 用 第 一 套 和 第 三 套 扫描 码 
的 键盘 ， 相 同 按键 在 不 同 键盘 扫描 码 中 对 应 的 编码 (扫描 码 ) 不 同 ， 我 们 在 中 断 处 理 程 序 中 也 得 根据 扫描 
码 来 判断 按 的 是 哪个 键 ， 那 我 们 如 何 知 道 键盘 用 的 是 哪 套 键盘 扫描 码 呢 ? 

任何 不 兼容 的 两 种 事物 都 可 以 通过 加 一 个 “中 间 层 ”的 方式 解决 兼容 ， 这 就 是 8042 存在 的 理由 之 
8042 是 8048 和 CPU 之 间 的 中 间 层 。 

我 们 (程序 员 ) 不 是 不 知道 键盘 用 的 是 哪 种 扫描 码 吗 ， 那 好 ， 只 要 8042 知道 就 行 。 为 了 兼容 第 一 套 
键盘 扫描 码 对 应 的 中 断 处 理 程序 ， 不 管 键盘 用 的 是 何 种 键盘 扫描 码 ， 当 键盘 将 扫描 码 发 送 到 8042 后 ， 都 
由 8042 转换 成 第 一 套 扫 描 码 ， 这 就 是 我 们 上 一 节 中 所 说 的 8042 的 “处 理 ” 
因此 , 我 们 在 键盘 的 中 断 处 理 程序 中 只 处 理 第 一 套 键盘 扫描 码 就 可 以 了 。 那 我 们 介绍 下 第 一 套 键盘 扫 
描 码 。 请 见 表 10-1。 
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表 10-1 第 一 套 键盘 扫描 码 
键 通 码 断 码 键 通 码 断 码 
以 下 是 主键 盘 区 及 功能 区 
<esc> 01 81 <caps lock> 3a ba 
Fl 3b bb a le 9e 
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键 通 码 断 码 键 通 码 断 码 
以 下 是 主键 盘 区 及 功能 区 
F2 3c bc S 1f 9f 
F3 3d bd d 20 a0 
F4 3e be f 21 al 
FS 3f bf g 22 a2 
F6 40 c0 h 23 a3 
F7 41 cl j 24 a4 
F8 42 c2 k 25 a5 
F9 43 c3 1 26 a6 
F10 44 c4 27 a7 
Fl1l 57 d7 28 a8 
F12 58 d8 <enter> lc 9c 
~ 29 a9 <L-Shift> 2a aa 
ll 02 82 Zz 2c ac 
@2 03 83 X 2d ad 
#3 04 84 C 2e ae 
$4 05 85 V 2f af 
%5 06 86 b 30 b0 
^6 07 87 n 31 bl 
&7 08 88 m 32 b2 
*8 09 89 <, 33 b3 
(9 0a 8a >. 34 b4 
)0 0b 8b 2/ 35 b5 
- 0c 8c <R-shift> 36 b6 
十 = 0d 8d <L-ctrl> ld 9d 
<backspace> 0e 8e <L-alt> 38 b8 
<tab> Of 8f <space> 39 b9 
q 10 90 <R-alt> e0,38 e0,b8 
WwW 11 91 <R-ctrl> e0,1d e0,9d 
e 12 12 
13 93 
t 14 94 
15 95 
u 16 96 
i 17 97 
0 18 98 
p 19 99 
{[ la 9a 
}] lb 9b 
卜 2b ab 
以 下 是 附加 键 及 小 键盘 区 
PrintScreen SysRq e0,2a,e0,37 e0,b7,e0,aa NumLock 45 c5 
Scroll Lock 46 c6 / e0,35 e0,b5 
Pause Break el 1d45 el 9d c5 无 * 37 b7 
Insert e0,52 e0,d2 - 4a ca 
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续 表 
键 通 码 断 码 键 通 码 断 码 
以 下 是 附加 键 及 小 键盘 区 

Home e0,47 e0,c7 7Home 47 c7 
Page Up e0,49 e0,c9 8Up 48 c8 
Delete e0,53 e0,d3 9PgUp 49 c9 
End e0,4f e0,cf 4Left 4b cb 
Page Down e0,51 e0,d1 5 4c CC 
< 一 e0,46 e0,c6 6Right 4d cd 
一 e0,4d e0,cd lEnd 4f cf 
个 e0,48 e0,c8 2Down 50 d0 
e0,50 e0,d0 3PgDn 51 dl 
0Ins 52 d2 
.Del 53 d3 
4e ce 

Enter e0,1c e0,9c 

表 有 点 长 ， 表 中 的 键 是 以 它们 在 键盘 上 实际 的 位 置 顺 序列 出 的 ， 从 左 到 右 、 从 上 到 下 。 



























































任何 键盘 扫描 码 都 是 有 规律 的 ， 这 主 
























































要 








E 方 





在 主键 盘 区 中 灰色 的 部 分 是 为 了 区 分 键盘 中 单独 的 一 行 ， 另 外 的 灰色 部 分 是 为 了 
是 为 了 处 理 六 





便 。 























区 分 附加 键 和 小 键盘 区 。 














大 多 数 情况 下 第 一 套 扫 描 码 中 的 通 码 和 断 码 都 是 1 字 节 大 小 。 您 看 ， 表 10-1 中 的 通 码 和 断 码 ， 它 们 的 关 




















系 是 : 断 码 = 0x80 + 通 码 。 顺 便 说 一 句 ， 在 第 





























二 套 键盘 扫 
































码 中 ， 般 的 通 码 是 1 字 





节 大 小 ， 断 码 是 在 通 码 











前 再 加 1 字 节 的 0xF0， 共 2 字 节 ， 我 们 的 8042 工作 之 一 就 是 根据 第 二 套 扫描 码 中 通 码 和 断 码 的 关系 将 它们 解 
码 ， 然 后 按照 第 一 套 扫 描 码 中 通 码 和 断 码 的 关系 转换 成 第 一 套 扫 描 码 。 


















































我 们 继续 回来 说 第 一 套 键盘 扫描 码 。 


















































对 于 通 码 和 断 码 可 以 这 样 理解 ， 它 们 都 是 一 字 节 大 小 ， 
高 位 若 值 为 0, 表示 按键 处 于 按 下 的 状态 , 否则 为 1 的 话 ， 表 示 按 键 红 





































































































最 高 位 也 就 是 第 7 位 的 值 决定 按键 的 状态 ， 最 














发 送 的 是 第 几 套 扫描 码 ， 当 我 们 按 下 它 的 时 候 ， 最 终 被 8042 转换 成 0x1， 








被 8042 转换 成 0x80+0x1=0x81。 











当 我 们 松 











和 起。 比如 按键 <Esc>, 不 管 键盘 向 8042 


开 它 的 时 候 ， 最 终 会 


完整 的 击 键 操作 包括 两 个 过 程 ， 先 是 被 按 下 ， 也 许 是 被 按 下 一 瞬间 ， 也 许 是 持续 保持 被 按 下 ， 然 后 








是 被 松 开 ， 总 之 ， 按 下 的 动作 是 先 于 松 开 发 生 的 ， 因 

















们 按 下 字符 a 时 ， 按 照 第 一 套 键盘 扫描 码 来 说 ， 



































占 6 字 节 。 原 因 是 这 样 的 ， 并 不 是 一 种 键盘 
用 的 ， 它 后 来 也 被 一 些 更 新 的 键盘 所 使 用 。 










































































就 要 用 





XT 键盘 上 上 
是 在 后 来 的 键盘 中 才 加 进去 的 ， 因 此 表示 扩展 extend， 
盘 上 ， 左 边 有 alt 键 ， 其 通 码 为 0x38， 断 码 为 0xb8。 右 边 的 














此 每 次 按键 时 会 先 产 生 通 码 ， 
先是 产生 通 码 0xle， 后 是 产生 断 码 0x9e。 




















再 产生 断 码 。 比 如 我 















































面 为 了 表示 都 是 同样 功能 的 alt 键 ， 另 一 方 













































































松 开 是 按 下 的 逆 过 程 ， 为 了 体现 这 个 
PrintScreen 的 通 码 是 4 字 节 ， 其 值 为 : 
























































大 家 一 定 注意 到 了 ， 有 些 按键 的 通 码 和 断 码 都 以 0xe0 开头 ， 它 们 占 2 字 节 ， 甚 至 Pause 键 以 0xel 开头 ， 
套 键 盘 扫 描 码 ， 最 初 第 一 套 键盘 扫 














省 码 是 由 XT 键盘 所 使 

































































的 键 很 少 ， 比 如 右边 回 车 键 附近 就 
所 以 在 扫描 码 前 面 加 了 0xe0 作为 前 级。 比如 在 XT 键 

















alt 键 是 后 来 在 新 的 键盘 上 力 












































没有 alt 和 ctrl 键 ， 这 


























[进去 的 ， 因 此 ， 一 方 

















四 表示 不 是 左边 那个 alt， 而 是 右边 的 alt， 于 是 这 个 扩展 的 alt 键 的 
扫描 码 便 为 “0xe0 和 原来 左边 alt 的 扫描 码 ”。 因此 ， 右 i 








力 alt 键 的 通 码 便 为 “0xe0,0x38” 断 码 为 “0xe0,0xb8”。 
“ 逆 ” 字 ， 咱 们 看 下 截屏 键 PrintScreen 的 通 码 和 晰 码 。 
e0，2a，e0，37， 给 人 的 感觉 是 由 两 个 扩展 通 码 组 成 的 ， 即 “e0， 























2a” 为 一 对 ,“e0，372” 为 一 对 。 断 码 依然 是 0x80+ 通 人 码 ， 但 由 于 松 开 是 按 下 的 逆 过 程 ， 故 断 码 值 和 通 码 值 的 
断 码 中 的 “e0，aa” 对 应 通 码 





顺序 相反 ， 即 e0，b7，e0，aa。 断 码 中 的 “e0，b7” 对 应 通 码 中 的 “e0，37”， 





























是 第 在 











中 的 “e0，2a”。 也 就 是 说 ， 当 我 们 按 下 截屏 键 PrintScreen 时 (假设 键盘 使 用 的 是 











送 的 通 码 是 以 e0->2a->e0->37 的 顺序 ， 松 姑 
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建 租 扫描 码 )， 键 盘 发 





F PrintScreen 时 ， 键 盘 发 送 的 断 码 是 e0->b7->e0->aa 的 顺序 。 





虽然 8048 和 8042 都 知道 击 键 操作 何 时 发 生 和 结束 , 但 我 们 程序 员 是 如 何 知道 的 呢 ? 最 终 的 键盘 操作 






































































































































是 由 咱们 来 处 理 的 ， 我 1 何 时 发 生 何 时 结束 ， 也 就 是 得 清楚 击 键 的 过 程 ， 这 样 咱们 才 知 道 用 
户 到 底 豆 了 哪些 按键 。 

为 了 让 我 们 获取 击 键 的 过 程 ， 在 每 一 次 击 键 动 作 的 “ 按 下 ”“ 按 下 保持 ”和 “ 弹 起 ”三 个 阶段 ， 确 切 地 说 
是 每 次 8048 向 8042 发 扫描 码 的 时 候 ，8042 都 会 向 中 断代 理 (咱们 是 8259A) 发 一 次 中 断 ， 即 “ 键 被 按 下 ?” 
时 发 中 断 ,“ 持 续 按 着 不 松手 ”时 会 持续 发 中 断 ,“ 松 开 手 ， 键 被 弹 起 ”时 也 发 中 断 ， 因 此 ， 我 们 的 键盘 中 断 处 
理 程序 每 次 都 会 随 着 键盘 发 执行 ， 也 就 是 也 会 收 到 完整 的 击 键 过 程 ， 包 括 键 的 持续 按压 状态 。 











基本 上 是 这 样 的 





(1) ctrl 键 先 被 按 下 。 
(2) 保持 ctrl 键 按 但 





(3) 按 下 a 键 。 





(4) 松 开 ctrl 键 。 


(5) 松 开 a 键 。 





般 情 况 下 ,尽管 我 们 是 按照 以 J 
换 )， 但 其 实 只 要 前 三 个 步骤 发 生 时 ，Windows 就 会 和 
天 个 键 哪个 先 被 弹 起 ， 都 不 影 






















































































举 个 例子 , 通常 在 Windows 下 ctrl+a 键 是 全 选 ， 这 个 按键 过 程 是 怎样 的 1 
































上 五 个 步 又 完成 的 文本 全 选 (也 许 有 
双 当 前 文本 区 中 

















重要 ， 也 就 是 无 论 这 


< 








下 面 咱们 分 析 一 下 细节 ， 假 设 键盘 使 用 的 是 多 
下 的 是 左边 的 ctrl 键 
是 第 二 套 扫描 码 ， 可 见 图 10-15)，8042 收 到 0x14 
区 寄存 器 ， 然 后 8042 向 中 断代 理发 中 断 ， 随 后 处 理 器 执行 
取 扫 描 码 , 即 0xld。 键盘 处 理 程 
股 情况 下 左 

















步骤 〈1) 






































自己 的 输出 组 






















































































， 假 设 我 们 按 1 













































































处 理 程序 从 8042 的 输 昌 



































它 一 看 是 <L-ctrl> 的 通 码 〈 其 实 是 <R-ctrl> 

































































换 成 第 一 套 键 盘 扫描 









































发 中 断 ， 每 次 键盘 中 断 处 到 
































前 已 经 按 下 了 ctrl， 

































































步骤 1 中 一 样 ， 键 盘 处 理 程 
胆 不 重要 ， 键 盘 处 到 
同样 的 键 ， 当 然 这 取决 于 

步骤 (3) 中 ，a 键 被 
将 其 转换 成 第 一 套 键 盘 扫 j 
断 处 理 程序 开始 执行 ,， 从 8042 的 输出 缓冲 区 寄存 器 
查看 之 前 ctrl 键 已 经 被 按 下 了 习 
shift 等 控制 键 一 般 是 与 下 一 次 按键 组 合 ， 这 是 由 了 












































程序 也 许 只 记录 上 一 次 按 下 上 






































二 8048 会 向 8042 发 上 
码 0xle 后 保存 到 自己 的 输 则 



























































有 记录 )， 因 此 判断 


































































































宫 训 的 操作 习惯 ， 即 控制 


键盘 中 断 处 天 


新 代理 




































































































































































过 程 罗 哩 罗 唆 地 说 完了 , 那 为 什么 步骤 4 和 步骤 5 不 被 处 理 




















普通 键 后 被 按 下 。 这 次 按 下 的 不 是 控 
这 一 消息 上 报 给 上 层 模块 ， 上 层 模块 判断 这 是 要 执行 全 选 的 功能 ， 于 是 文本 
于 ，8048 向 8042 发 送 它 的 第 二 套 键盘 扫描 码 0xf0 和 0x14〈 断 码 )， 前 








步骤 〈4) 中 ，<L-ctr> 键 被 松 7 





巴 记录 ctrl 键 是 否 按 下 的 全 局 变量 清空 。 然 后 和 









































面 有 提起 过 ， 第 二 套 键盘 扫描 码 的 断 码 一 般 是 2 字 节 ， 由 多 
字 节 转换 成 第 一 套 键 盘 扫 
表示 键 被 松 开 了 ， 不 管 松 开 f 

步骤 (5) 中 ，a 键 被 松 开 
其 转换 成 0x9e 后 保存 ， 之 后 发 中 断 ， 键 盘 中 断 处 理 各 




































































的 是 什么 键 ， 忽 略 ， 不 做 入 
向 8042 发 送 它 的 第 二 













































































被 全 部 选中 。 





程序 ， 键 盘 中 断 
E 序 会 判断 这 次 按 下 的 是 哪个 键 ， 
生 ctrl 都 被 认为 是 ctrl 键 。 











发 中 断 ， 键 盘 ， 











































































































已? 也 许 您 没 注意 过 , 但 步 双 


极 少数 同学 的 步骤 4 和 步骤 $ 要 调 
的 文本 全 部 选中 ， 即 步 又 四 
当前 文本 被 选中 ， 这 是 为 何 呢 ? 
二 套 键 盘 扫 描 码 。 

比 时 8048 向 8042 发 出 了 <L-ctrl> 键 的 通 码 0x14( 这 
其 转换 为 第 一 套 键盘 扫描 码 ， 即 0x1d， 将 其 保存 到 


和 步骤 五 并 不 








它们 只 是 位 
置 不 同 ， 并 不 代表 是 两 个 不 同 的 功能 ， 键 被 放 在 不 同 的 位 置 是 为 方便 人 们 操作 ， 当 然 这 只 是 传统 的 作法 )， 
它 便 在 某 个 全 局 变量 中 记录 ctrl 键 
步骤 (2) 中 ，<L-ctrl> 键 持续 按 住 不 松手 ， 因 
码 0xld 并 向 中 断代 到 





此 8048 会 持续 向 8042 发 送 0x14，8042 每 次 都 将 其 转 
程序 都 会 从 8042 中 得 到 0x1d。 和 
看 是 <L-ctrl> 的 通 码 ， 依 然 会 在 全 局 变量 中 记录 下 ctrl 键 被 按 下 ， 尽 管 之 
的 是 哪个 ， 不 关注 之 前 按 下 了 多 少 次 


i a 键 的 第 二 套 键盘 扫描 码 0x1c( 通 码 )，8042 
缓冲 区 寄存 器 ， 之 后 向 中 
获取 到 0xle。 键盘 处 理 程序 判断 这 次 按 下 的 是 a 键 ， 
户 按 下 的 是 “ctrlta” 组 合 键 。ctrl、alt、 
键 先 被 按 下 ， 其 他 


巴 “ctrl+a?” 

















的 前 级 0xf0 和 其 通 码 组 成 。8042 将 这 两 个 
断 处 理 程序 一 看 最 高 位 为 1， 这 是 断 码 ， 


键盘 扫描 码 0xf0 和 0xlc〈 断 码 )，8042 将 
读 出 ， 一 看 是 键 被 弹 起 ， 和 忽略 。 
呢 ? 原因 是 役 情 况 下 ， 用 / 1 的 想法 是 


461 


“ 按 ” 键 的 方式 表达 的 ， 
达 完 毕 的 标志 ， 所 以 步 
击 键 产生 的 扫 











强调 的 是 


描 码 是 由 键盘 9 


“ 按 te 














输出 缓冲 区 寄存 器 中 。 
区 分 按 下 的 是 否 是 那 























些 以 0xe0 了 














决 于 该 键 扫 
中 断 ， 


描 码 中 包含 











也 是 8 位 宽度 ， 即 每 次 只 能 存储 
只 要 8042 收 到 1 字 节 
的 字 节 


的 扫 


个 扫 
描 码 后 多 
数 ， 





























并 不 是 通过 按键 松 开 
又 4 和 步骤 5 就 忽略 了 ， 不 再 考虑 ctrl 键 和 a 键 的 状态 。 
FP 的 8048 传 给 主板 上 的 8042 的 ，8042 将 扫描 码 转 码 处 理 后 存 入 自己 的 
虽然 并 不 是 所 有 的 扫描 码 都 是 1 字 节 ， 
开头 的 多 字 节 操作 码 ， 
码 ， 要 么 是 通 码 ， 要 么 
它 就 会 向 中 断 











来 表达 需求 。 键 被 弹 起 时 ， 


一 般 是 用 户 思想 表 
































但 它们 是 以 字 节 为 贞 





以 便 后 续 处 理 )， 
是 断 码 。 

















因此 8042 的 输 昌 


位 发 送 的 〈 也 许 这 样 便 
缓冲 区 寄存 器 

















理发 中 断 信 号 。 因 此 按键 时 所 发 的 中 断 次 数 ， 取 





通常 情况 下 键 的 通 码 和 断 码 各 1 个 ， 因 此 通常 情 


况 下 一 个 字符 会 发 两 次 














但 有 的 按键 的 扫描 码 是 多 个 字 节 ， 如 右 alt 键 ， 每 按 一 次 将 产生 4 次 中 断 。 


字 时 , 那 可 是 发 生 了 无 数 次 中 断 啊 , 对 于 文字 编辑 工作 来 说 , 中 断 次 数 更 是 天 文 数字 (突然 很 心疼 计算 机 )。 


可 想 而 知 ， 平 时 我 们 打 


不 知道 您 注意 到 没有 ， 表 10-1 中 并 未 列 出 大 写字 母 ， 不 知道 您 对 此 是 否 感到 奇怪 ， 如 果 觉 得 这 很 正常 那 就 





我 就 放心 了 。 前 








掉 说 过 啦 ， 键 盘 只 负责 输 















































es 





体 的 表现 形式 取决 于 字符 处 理 软 件 




















<caps lock> 键 再 ] 


实 ” 它 按照 约定 俗 成 的 规则 去 表达 按键 “J 





近 其 他 字母 键 时 会 显示 大 写字 母 ， 但 这 依然 是 字符 处 理 软件 的 功能 ， 














， 昌 说 一 般 情 况 下 我 们 先 按 下 


























E 常 ”的 行为 而 已 ， 通 常 键盘 中 断 处 玫 


只 是 字符 处 理 


软件 比较 “ 老 



































程序 就 是 充当 了 字符 处 理 软 








件 的 角色 ， 当 它 收 到 了 <caps lock> 键 的 通 码 和 断 码 时 ， 也 就 是 表示 <caps lock> 键 已 经 被 按 下 并 弹 起 ， 此 后 便 将 








后 面 获取 的 字母 的 扫 





田 








码 转 换 成 对 应 的 大 写字 母 ， 

















这 个 转换 过 程 是 咱们 程序 员 自 














己 控 适 








吊 的 ， 因 此 ， 只 要 咱们 愿 




















意 ， 完 全 可 以 无 视 <caps lock> 键 ,将 键入 的 字母 一 律 展现 为 小 写 或 大 写 ， 甚 至 展示 为 数字 、 标 点 符号 等 ， 当 然 





不 建议 这 么 任 怕 
总 结 一 下 。 





E， 只 是 想 





告诉 大 家 ， 计 算 机 中 各 种 文本 ， 都 是 字符 处 到 





扫描 码 有 





发 给 





8042 为 了 兼容 
每 处 理 一 个 字 节 的 扫描 
。 然后 向 中 断代 到 
寄存 器 ， 会 获得 第 一 套 
因此 我 们 可 以 “ 假 ; 



































3 套 , 现在 一 
8042 的 都 是 第 二 套 键盘 扫描 码 。 
生 ， 将 接收 到 的 第 二 套 键盘 扫描 码 转换 成 第 
码 后 ， 将 其 存储 到 自己 的 输出 缓冲 
E 8059A 发 中 断 信号 
键盘 扫描 码 。 

设 ” 现 在 键盘 用 的 就 是 第 一 套 扫 















































般 键 盘 中 的 8048 芯片 支持 的 是 第 

















软件 的 杰作 ， 








和 键盘 关系 不 大 。 








大 





但。 








二 套 扫 














和 











此 每 当 有 击 键 发 生 时 , 8048 



































区 寄存 器 
， 这 样 我 们 的 键盘 中 断 处 理 



































现 将 两 套 扫描 码 印 在 同一 个 键盘 上 给 大 伙 过 目 ， 如 图 10-15 所 示 。 
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4 图 10-15 ”键盘 扫描 码 示意 














套 扫描 码 。8042 是 按 字 节 来 处 理 


程序 通过 读 取 8042 的 输出 缓冲 


的 ， 





区 

















描 键 , 这 样 想像 比较 直接 。 为 了 方便 对 比 和 “假设 ”， 








好 ， 有 关 扫 描 码 的 部 分 到 这 就 结束 啦 ， 大 家 下 节 见 。 
10.3.3 8042 简介 


本 节 是 对 8042 名 副 其 实 的 简介 ， 因 为 咱们 的 键盘 操作 非常 简单 ， 不 涉及 对 其 编程 ， 只 用 了 它 一 个 端 
口 接收 扫描 码 而 已 ， 所 以 讲 得 太 细 致 的 话 实在 是 有 些 矛 盾 。 

说 良心 话 ， 本 节 的 内 容 对 于 咱们 的 及 原因 是 我 经 常 有 这 样 的 体会 : 虽然 只 用 到 某 方 面 一 
点 点 知识 ， 但 不 把 周边 内 容 也 介绍 的 话 ， 这 会 让 人 感到 迷茫 ， 甚 至 不 知道 自己 在 做 什么 …… 好 啦 ， 开 始 开始 。 

ee 

考虑 到 本 书 中 对 它 的 应 用 实在 是 有 限 ， 甚 至 是 过 于 有 限 ， 介 绍 多 了 还 “扰民 ” 因此 咱们 就 浅 尝 轰 止 
吧 。 有 关 8042 的 资料 网 上 就 很 多 呢 ， 大 伙 有 兴趣 自己 看 看 。 
话 得 从 头 说 起 ， 其 实在 计算 机 中 不 只 一 个 处 理 器 ,我 们 党 说 的 处 理 器 是 指 传统 意义 上 的 Intel 或 AMD 
的 处 理 器 。 计算 机 内 部 是 分 层 的 , 各 层 负责 一 定 的 功能 , 将 所 有 功能 串 在 一 起 就 是 一 个 完整 的 计算 机 系统 。 
因此 很 多 外 部 设备 中 都 有 自己 的 处 理 器 , 它们 可 以 响应 来 自 外 部 的 信号 和 设置 硬件 本 身 的 功能 ,最 主要 的 
就 是 它们 分 担 了 传统 处 理 器 的 计算 任务 ， 比 如 显卡 的 CPU 称 为 GPU， 它 承担 了 图 像 泻 染 的 工作 ， 这 样 传 
统 处 理 器 就 不 用 做 自己 不 擅长 的 事 。 
和 键盘 相关 的 芯片 只 有 8042 和 8048， 它 们 都 是 独立 的 处 理 器 ， 都 有 自己 的 寄存 器 和 内 存 。 

Intel 8048 芯片 或 兼容 芯片 位 于 键盘 中 ， 它 是 键盘 编码 器 ， 相 当 于 键盘 的 “代言 ”人 ， 是 键盘 对 外 表 
现 击 键 信息 、 帮 助 键盘 “说 话 ” 的 部 件 。 它 除了 负责 监控 禄 键 扫描 码 外 ， 还 用 来 对 键盘 设置 ， 比 如 设置 键 
盘 上 的 各 种 LED 显示 灯 的 开启 和 关闭 ， 默 认 情 况 下 NumLock 的 LED 灯 是 亮 的 ， 这 就 是 8048 的 功劳 。 

Intel 8042 芯片 或 兼容 芯片 被 集成 在 主板 上 的 南 桥 芯 片 中 ， 它 是 键盘 控制 器 ， 也 就 是 键盘 的 IO 接口 ， 
因此 它 是 8048 的 代理 ， 也 是 前 面 所 得 到 的 处 理 器 和 键盘 的 “中 间 层 ” 8048 通过 PS/2、USB 等 接口 与 8042 
通信 ， 处 理 器 通过 端口 与 8042 通信 (IO 接口 就 是 外 部 硬件 的 代理 ， 它 和 处 理 器 都 位 于 主机 内 部 ， 因 此 处 
理 器 与 IO 接口 可 以 通过 端口 直接 通信 )。 

既然 8042 是 8048 的 IO 接口 ， 对 8048 的 编程 也 是 通过 8042 完成 的 ， 所 以 只 要 学 习 8042 足 侨 ，8048 
不 再 介绍 。 

8042 有 4 个 8 位 的 寄存 器 ， 如 表 10-2 所 示 。 























































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































表 10-2 8042 寄存 器 
寡 存 器 端 口 读 / 写 

Output Buffer〈 输 出 缓冲 区 ) 0x60 读 
Input Buffer〈 输 入 缓冲 区 ) 0x60 写 
Status Register〔 状 态 寄 存 器 ) 0x64 读 
Control Register 〈 控 制 寄存 器 ) 0x64 写 

您 看 ， 四 个 寄存 器 共用 两 个 端口 ， 这 说 明 在 不 同 场合 下 同一 端口 有 不 同 的 用 途 。 

8042 是 连接 8048 和 处 理 器 的 桥梁 ，8042 存在 的 目的 是 : 为 了 处 理 器 可 以 通过 它 控制 8048 的 工作 方 
























































式 ， 然 后 让 8048 的 工作 成 果 通 过 8042 回 传 给 处 理 器 。 此 时 8042 就 相当 于 数据 的 缓冲 区 、 中 转 站 ， 根 据 数 
据 被 发 送 的 方向 ，8042 的 作用 分 别 是 输入 和 输出 。 
e 处 理 器 把 对 8048 的 控制 命令 临时 放 在 8042 的 寄存 器 中 ， 让 8042 把 挖 天 
8042 充当 了 8048 的 参数 输入 缓冲 区 。 
。 8048 把 工作 成 果 临 时 提交 到 8042 的 寄存 器 中 ， 好 让 处 理 器 能 从 8042 的 寄存 器 中 获取 它 (8048) 
的 工作 成 果 ， 此 时 8042 充当 了 8048 的 结果 输出 缓冲 区 。 
8042 作为 输入 、 输 出 缓冲 区 的 区 别 ， 如 图 10-16 所 示 。 
图 10-16 中 ， 上 半 部 分 的 数据 从 左 到 右 传 送 ， 表示 8042 作为 输入 缓冲 区 ， 下 半 部 分 数据 从 右 到 左 传送 ， 
表示 8042 作为 输出 缓冲 区 。 






























































二 








命令 发 送 给 8048， 此 时 
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结论 : 8042 作 为 输入 输出 缓冲 区 
。 当 需 要 把 数据 从 处 理 器 发 到 8042 时 (数据 传送 尚未 发 生 时 )， 

0x60 端 的 作用 是 输入 缓冲 区 , 此 时 应 该 用 out 指令 写 入 0x60 端口 。 数据 临时 
。 当 数据 已 从 8048 发 到 8042 时 ，0x60 端口 的 作用 是 输出 缓冲 开 所 量 lis 数据 源 
































， 此 时 应 该 用 in 指令 从 8042 的 0x60 端口 (输出 缓冲 区 寄存 器 ) 读 048] < —— [8042 < 
8048 的 输出 结果 。 [e048]— > 输出 > [eos2 一 一 > 外 要 关 | 
a 数据 源 数据 最 终 

下 面 介 绍 下 各 寄存 器 的 作用 。 数据 临时 目的 地 

。 输出 缓冲 区 寄存 器 

8 位 宽度 的 寄存 器 , 只 读 , 键盘 驱动 程序 从 此 寄存 器 中 通过 in 指令 读 
取 来 自 8048 的 扫描 码 、 来 自 8048 的 命令 应 答 以 及 对 8042 本 身 设置 时 ，8042 自身 的 应 答 也 从 该 寄存 器 中 获取 。 
注意 ， 输 出 缓冲 区 寄存 器 中 的 扫描 码 是 给 处 理 器 准备 的 ， 在 处 理 器 未 读 取 之 前 ，8042 不 会 再 往 此 寄 
存 器 中 存 入 新 的 扫描 码 。 
也 许 您 要 问 了 ，8042 是 怎样 知道 输出 缓冲 区 寄存 器 中 的 值 是 否 被 读 取 了 呢 ? 这 个 简单 ，8042 也 有 个 
智能 芯片 ， 它 为 处 理 器 提供 服务 ， 当 处 理 器 通过 端口 跟 它 要 数据 的 时 候 它 当然 知道 了 ， 因 此 ， 每 当 有 in 
间 令 来 读 取 此 寄存 器 时 ，8042 就 将 状态 寄存 器 中 的 第 0 位 置 成 0, 这 就 表示 寄存 器 中 的 扫描 码 数据 已 经 被 
取 走 ， 可 以 继续 处 理 下 一 个 扫描 码 了 。 当 再 次 往 输出 绥 冲 寄存 器 存 入 新 的 扫描 码 时 ，8042 就 将 状态 寄存 
器 中 的 第 0 位 置 为 1， 这 表示 输出 缓冲 寄存 器 已 满 ， 可 以 读 取 了 。 

总 之 一 句 话 ， 键 盘 中 断 处 理 程序 中 必须 要 用 in 指令 读 取 “输出 缓冲 寄存 器 ”否则 8042 无 法 继续 响 
应 键盘 操作 。 

。 输入 缓冲 区 寄存 器 

8 位 宽度 的 寄存 器 ， 只 写 ， 键 盘 驱 动 程序 通过 out 指令 向 此 寄存 器 写 入 对 8048 的 控制 命令 、 参 数 等 ， 
对 于 8042 本 身 的 控制 命令 也 是 写 入 此 寄存 器 

。 状态 寄存 器 

8 位 宽度 的 寄存 器 ， 只 读 ， 反 映 8048 和 8042 的 内 部 工作 状态 。 各 位 意义 如 下 。 

(1) 位 0: 置 1 时 表示 输出 缓冲 区 寄存 器 已 满 ， 处 理 器 通过 in 指令 读 取 后 该 位 自动 置 0。 

(2) 位 1: 置 1 时 表示 输入 缓冲 区 寄存 器 已 满 ，8042 将 值 读 取 后 该 位 自动 置 0。 

(3) 位 2: 系统 标志 位 ， 最 初 加 电 时 为 0， 自 检 通 过 后 置 为 1。 

(4) 位 3: 置 1 时 ， 表 示 输 入 缓冲 区 中 的 内 容 是 命令 ， 置 0 时 ， 输 入 缓冲 区 中 的 内 容 是 普通 数据 。 

(5) 位 4: 置 1 时 表示 键盘 启用 ， 置 0 时 表示 键盘 禁用 。 

(6) 位 5: 置 1 时 表示 发 送 超时 。 

(7) 位 6: 置 1 时 表示 接收 超时 。 

(8) 位 7: 来 自 8048 的 数据 在 奇偶 校 验 时 出 错 。 

。 控制 寄存 器 

8 位 宽度 的 寄存 器 ， 只 写 ， 用 于 写 入 命令 挖 于 

(1) 位 0: 置 1 时 启用 键盘 中 断 。 

(2) 位 1: 置 1 时 启用 鼠标 中 断 。 

(3) 位 2: 设置 状态 寄存 器 的 位 2。 

(4) 位 3: 置 1 时 ， 状 态 寄 存 器 的 位 4 无效 。 

(5) 位 4: 置 1 时 禁止 键盘 。 

(6) 位 5: 置 1 时 禁止 鼠标 。 

(7) 位 6: 将 第 二 套 键盘 扫描 码 转换 为 第 一 套 键盘 扫描 码 。 

(8) 位 7: 保留 位 ， 默 认为 0。 
其 实 还 有 一 些 控制 命令 没 说 ,但 咱们 真心 用 不 上 ， 甚 至 连 上 面 介绍 的 四 个 寄存 器 咱们 也 只 用 上 了 一 个 
而 已 ， 咱 们 对 8042 的 介绍 到 此 为 止 。 
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4 图 10-16 8042 A 出 缓冲 区 






































































































































































































































































































































































































































































































































































































































。 每 个 位 都 可 以 设置 一 种 工作 方式 ， 意 义 如 下 。 
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下 一 节 ， 我 们 要 实战 。 
10.3.4 测试 键盘 中 断 处 理 程序 


本 节 通 过 写 一 个 极其 简单 的 键盘 中 断 处 理 程 序 来 演示 键盘 的 中 断 处 理 过 程 。 
























































本 节 中 的 键盘 





程序 咱 得 注册 到 idt_- 

















咱们 还 有 一 些 前 期 
































table 中 才 行 ， 

















想 想 看 ， 咱 们 


























VECTOR 来 实现 的 

















断 处 理 程序 本 身 很 简单 ， 一 会 儿 您 就 知道 了 ， 其 实 就 两 句 话 的 事 。 写 好 了 的 中 断 处 理 


的 准备 工作 要 做 。 
的 中 断 机 制 是 这 样 的 ， 一 个 中 断 向 量 号 要 有 一 个 中 断 入 口 ， 为 了 省 事 ， 咀 们 是 用 宏 
中 断 入 口 ， 因 此 所 有 的 中 断 入 口 程序 儿 乎 都 一 样 ， 只 是 中 断 向 量 号 不 同 。 宏 展开 后 ， 






















































































但 现在 ， 我 指 的 是 目前 ， 并 不 是 仅仅 调用 register_handler 去 注册 就 行 了 ， 















































中 断 入 口 程序 名 为 intr%lentry。 其 中 %1 是 中 断 向 量 号 ， 在 入 口 程 序 中 用 这 个 中 断 疝 量 号 作为 idt_table 中 










































































的 索引 ， 调 用 最 终 C 语言 版 本 的 中 断 处 理 程序 。 








到 目前 为 止 ， 我 们 























只 为 时 钟 添加 了 中 断 处 理 程序 ， 它 的 中 断 向 量 号 是 0x20。 因 此 在 kernel.S 中 ， 











“VECTOR 0x20,ZERO” 是 最 后 一 个 中 断 入 口 。 


回 


























顾 一 下 8259A 的 下 引 脚 ， 键 盘 的 中 断 信 号 接 在 主 片 的 下 1 引 脚 上 ， 也 就 是 它 对 应 的 中 断 向 量 为 0x21， 




















因此 我 们 要 修改 一 下 kernel.S， 至 少 添 加 一 名 “VECTOR 0x21,ZERO”。 





为 了 一 步 到 位 ， 








咱们 把 8259A 











加 16 个 中 断 入 口 。 


















































中 的 全 部 中 断 一 次 注册 好 吧 ， 一 共 16 个 R 引 脚 ， 咱 们 在 kemel.S 中 再 增 














请 见 代 码 10-8。 


代码 10-8 (project/c10/c/kernel/kernel.S ) 


















































































































































… 略 

81 VECTOR 0x20, ZERO ;时 钟 中 断 对 应 的 入 
82 VECTOR 0x21,2ZERO ;键盘 中 断 对 应 的 入 
83 VECTOR 0x22,2ZERO ;级 联 用 的 

84 VECTOR 0x23,2ZERO ; 串口 2 对 应 的 入 
85 VECTOR 0x24,2ZERO 7 串 对 应 的 入 
86 VECTOR 0x25,2ZERO ;并 口 2 对 应 的 入 
87 VECTOR 0x26, ZERO ;软盘 对 应 的 入 

88 VECTOR 0x27,2ZERO ;并 对 应 的 入 
89 VECTOR 0x28,ZERO ; 实时 时 钟 对 应 的 入 
90 VECTOR 0x29,2ZERO ; 重 定语 

91 VECTOR 0x2a, ZERO ;保留 

92 VECTOR 0x2b,ZERO ;保留 

93 VECTOR 0x2cv ZERO ;ps/2 鼠标 

94 VECTOR 0x2d,ZERO ; fpu 浮 点 单元 异常 
95 VECTOR 0x2e,ZERO ;硬盘 

96 VECTOR 0x2f, ZERO ;保留 

这 下 主 从 8259A 上 的 IR 引 脚 都 有 相应 的 中 断 入 口 了 ， 在 实现 系统 调用 之 前 够 用 了 。 





不 过 ， 这 才 完 成 了 部 分 工作 , 
中 断 入 口 程 序 必须 在 中 断 描述 符 表 idt 中 注册 才 行 ， 在 中 断 描 述 符 表 中 注册 中 断 描述 符 是 在 文件 interrupt.c 


中 用 函数 idt_desc_init 实现 的 ， 它 所 注册 的 中 断 描述 符 的 数量 依赖 于 IDT_DESC_CNT， 为 此 我 们 要 把 






































们 还 有 两 个 地 方 要 改 ， 它 们 都 是 在 interrupt.c 中 。 



































IDT_DESC_CNT 改 为 合适 的 数 。 











目前 咱们 已 经 打 























于 了 键盘 中 断 ， 为 了 使 键盘 测试 变 得 简单 ， 








































































































3 


3 们 和 暂时 先 把 时 钟 中 断 关 闭 ， 只 打开 键盘 


























的 中 断 ， 您 肯定 想到 了 ， 完 成 这 个 目的 ， 就 是 写 8259A 的 中 断 屏 蔽 寄存 器 
以 上 两 处 的 修改 请 见 代 码 10-9。 


代码 10-9 (project/c10/c/kernel/interrup.c ) 


… 略 


12 #define IDT 


LO 


DESC CNT 0x30 

















// 目前 总 共 支 持 的 中 断 数 

















28 static struct gate desc idt[IDT DESC CNT]; 
































// idt 是 中 断 描 述 符 表 ， 本 质 上 就 是 个 中 断 门 描述 符 数 组 

29 

30 char* intr name[IDT DESC CNT]; // 用 于 保存 异常 的 名 字 
过 和 








465 





32 /太太 大 火炎 炎炎 痰 定义 中 断 处 理 程序 数组 认定 机 二 疝 汪 





33 * 在 kernel1.Ss 中 定义 的 intrxxentry 只 是 中 断 处 理 程序 的 入 口 ， 












































34 * 最 终 调用 的 是 ide table 中 的 处 理 程序 */ 
35 intr handler idt table[IDT DESC CNT]; 


36 /大 大 大 大 大 火炎 火炎 火炎 炎炎 火炎 火炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 大 炎炎 大大 大大 大 大 




















37 extern intr handler intr entry table[IDT DESC CNT]; 





























// 声明 引 








E 义 在 kernel.s 中 的 中 断 处 理 函 数 入 口 数组 

















39 /x* 初始 化 可 编程 中 断 控 制 器 8259A */ 


40 static void pic init (void) { 





EL 


42 /* 初始 化 主 片 */ 


48 /* 初始 化 从 片 */ 
略 























54 /x* 测 试 键盘， 只 打开 键盘 中 断 ， 其 他 全 部 关闭 */ 

















I outb (PIC M DATA, Oxfd); 

56 outb (PIC S DATA, Oxff); 

57 

58 Ut EE pic init done\n"); 
59. 于 

… 略 


您 看 ， 很 多 中 断 相 关 的 结构 都 与 IDT DESC_CNT 有 关 ， 中 断 描述 符 idt、 数 组 intr name 都 要 用 
















































































IDT_DESC_CNT 作为 数组 长 度 ， 甚 至 所 声明 的 外 部 数组 intr_entry_table〈 位 于 kernel.S 中 ) 也 用 到 了 它 ， 


数组 intr_entry - 


此 版 本 int 
部 中 上 断 。 


值 为 0xfd。 























table 中 的 元 素 就 是 程序 入 口 intr%lentry。 











errup.c 中 的 第 12 行将 IDT_DESC_CNT 改 为 了 0x30, 这 满足 了 目前 8259A 所 支持 的 全 部 外 


























第 55 行 操作 主 片 上 的 中 断 屏 蔽 寄存 器 ， 只 打开 了 键盘 中 断 ， 即 位 1 为 0， 其 他 位 都 为 1， 因 此 写 入 的 






































第 56 行 操作 从 片上 的 中 断 屏 蔽 寄存 占 ， 屏 蔽 了 从 片上 的 所 有 中 断 ， 所 以 值 为 0x 伴 。 














好 啦 ， 现 在 把 之 前 创建 的 线程 也 注释 掉 ， 现 在 的 main.c 长 这 样 ， 见 代码 10-10。 








代码 10-10 (project/c10/c/kernel/main.c ) 


10 int main(void) { 


于 二 和 


12 init_ 


str("I am kernel\n"); 
all (); 


14 // thread start ("k thread a", 31, k thread a, "argA "); 
5 thread start ("k thread b", 8, k thread b, "argB "); 


16 

17 intr enable(); 

18 while(1); //{ 

19 //console put str("Main "); 
20 // 1}; 

2 return 0; 

22 于 


























做 了 这 么 多 ， 我 们 只 是 在 做 准备 工作 而 已 ， 咱 们 的 键盘 中 断 处 理 程序 还 没 写 呢 。 不 要 急 ， 很 简单 的 。 
hy se device 目录 中 ， 为 此 ， 我 们 在 该 目录 下 创建 文件 keyboard.c， 在 其 中 定义 






























































键盘 中 断 处 理 程序 。 给 各 位 客 官 上 菜 唆 ， 见 代码 10-11。 








#includ 
#includ 
#includ 
#includ 
#includ 


#define 


/* 键盘 


static 





POWwWOoOJJOOOODODPp 


记 记 


小 
© 
[ey 


put_ 


代码 10-11 (project/c10/c/device/keyboard.c.10-10 ) 


e "keyboard.h" 
e "Pint .hn 

e "interrupt.h" 
e "io.h" 

e "global.h" 











KBD BUF_PORT 0x60  // 键盘 buffer 寄存 器 端口 号 为 0x60 


Pp 断 处 理 程序 */ 
void intr keyboard handler (void) { 
chart kK 3)s 























12 /* 必须 要 读 取 输出 缓冲 区 寄存 器 ， 否 则 8042 不 再 继续 响应 键盘 中 断 */ 














13 inb (KBD BUF PORT); 
14 return; 

二 

16 


17 /* 键盘 初始 化 */ 
18 void keyboard init() { 


19 put_ str("keyboard init start\n"); 

20 register handler (0x21, intr keyboard handler); 
21 put str("keyboard init done\n"); 

22 } 








代码 10-10 是 不 是 太 短小 精 悍 了 ? 至 少 它 能 很 好 地 演示 键盘 中 断 机 制 。 其 中 函数 intr_ keyboard_handler 就 是 






































inb(KBD_BUF_PORT) 读 取 8042 的 输出 缓冲 区 寄存 器 。 

















































































































键盘 中 断 处 理 程 序 ， 它 的 实现 就 两 句 话 ， 每 收 到 一 个 中 断 ， 就 通过 put_char(k) 打 印字 符 火 ， 然 后 再 调用 














顺便 说 一 句 ， 函 数 inb 是 有 返回 值 的 ， 它 返回 的 是 从 端口 读 取 的 数据 ， 虽 然 此 处 没有 将 其 赋 给 任何 变 
量 ,， 但 不 要 觉得 这 会 让 返回 值 “ 没 地 方 放 ” 然后 整个 人 都 觉得 不 好 了 ， 因 为 根据 ABI 约定 ， 返 回 值 是 存 













































































放 在 寄存 器 eax 中 的 ， 我 们 这 里 没有 将 返回 值 赋 给 内 存 变 量 ， 编 译 器 只 是 没有 将 返回 值 从 eax 寄存 器 : 


































































































mov 到 某 块 内 存 而 已 。 
这 个 例子 有 两 个 目的 ， 一 是 为 了 演示 击 键 时 产生 的 中 断 次 数 ， 每 按 一 下 键 ， 您 看 产生 多 少 个 字符 
! 区 寄存 器 的 话 ，8042 是 不 会 继续 工作 的 。 




















就 行 了 。 二 是 为 了 演示 不 读 取 输 出 组 
编译 运行 ， 咱 们 在 bochs 中 测试 一 下 ， 如 图 10-17 所 示 。 








es 


















































就 会 被 当成 调试 命令 。 
当 我 在 屏幕 窗口 中 输入 a 键 时 ， 由 于 a 的 通 码 和 断 码 各 为 一 字 节 ， 屏 幕 ， 

















注意 ， 咀 们 这 次 要 在 bochs 的 屏幕 窗口 中 按键 ， 不 是 在 控制 台中 输入 ， 否 则 





















































上 打 


印 出 两 个 k， 左 边 有 下 夯 线 的 那 一 对 k， 前 一 个 k 代表 通 码 的 中 断 ， 后 一 个 K 代表 























的 是 断 码 的 中 断 。 当 我 再 次 按 下 <R-alf> 键 时 ， 其 通 码 和 断 码 各 为 2 字 节 ， 因 此 
4 个 字符 k。 














hread_init start 





产 电 





岁 Ea in i ne 当 我 注释 掉 ¢ inb(KBD BUF PORT) 2 训 














》 





thread_init start 
thread_init done 
timer_init start 
timer_init done 


keyboard init start 
keyboard init done 
kkkkkk 





4 图 10-17 键盘 中 断 测试 

















E 了 4 次 中 断 ， 故 打印 了 





于 8042 的 输出 缓冲 区 寄 



































存 器 未 被 读 取 , 任凭 我 怎么 敲 键 盘 , 屏幕 窗 

















都 只 : 


记 示 了 一 个 字符 k,，8042 



































不 再 处 理 任 何 按键 信息 ， 如 图 10-18 所 示 。 
































^ 图 10-18 未 读 取 输出 缓冲 区 寄存 器 时 



































能 得 到 ， 现 在 改 一 下 代码 ， 如 代码 10-12 所 示 。 


代码 10-12 (project/c10/c/device/keyboard.c.10-11 ) 


“9 /* 键盘 中 断 处 理 程序 */ 
10 static void intr keyboard handler (void) { 
11 /* 必须 要 读 取 输出 缓冲 区 寄存 器 ， 否 则 8042 不 再 继续 响应 键盘 中 断 */ 
































12 uint8 t scancode = inb (KBD BUF _ PORT) ， 
ee put int (scancode); 

14 return; 

下 

.. 略 
































编译 运行 后 ， 在 屏幕 上 继续 按 a 键 和 <R-alt>， 结 果 如 图 10-19 所 示 。 

咱们 还 是 看 有 下 画 线 的 两 组 数据 。 左边 第 一 组 中 , 0x1E 为 a 键 的 通 码 ，0x 
为 a 键 的 断 码 。 第 二 组 中 ，0xE0 和 0x38 是 <R-alt> 的 通 码 ， 它 的 断 码 为 0xE0 
0OXB8 。 


















































简单 演示 就 到 这 了 ， 下 一 节 中 咱们 让 键盘 操作 “正常 ”起 来 ， 按 什么 就 显示 





什么 ， 像 通常 的 键盘 输入 那样 直观 。 








| Wns | 现在 您 “领教 ”了 不 读 取 输出 缓冲 区 寄存 器 


9E 
和 


示 








的 厉害 了 ? 哈哈 , 我 想 
您 还 是 对 扫描 码 比 较 好 奇 ， 扫 描 码 必须 要 读 取 “ 输 出 缓冲 区 寄存 器 ” 才 





em_init done 


thread_init start 


hread_init done 
timer_init start 


timer_init done 


keyboard init start 
keyboard init done 
1E9EEQ38EQB8 








La 
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10-19 打印 扫描 码 
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> 编写 键盘 驱动 


驱动 程序 是 什么 ? 























































































































































































































还 是 那 句 话 ， 计 算 机 按 功 能 分 层 ， 各 层 模 块 各 司 其 职 ， 下 层 模 块 为 上 层 提供 服务 ， 这 里 的 模块 我 指 的 
是 人 硬件。 操作 系统 看 似 功能 强大 ， 但 它 的 能 力 取决 于 硬件 能 做 什么 。 

在 计算 机 中 ， 硬 件 是 用 软件 来 交互 的 ， 想 让 硬件 做 什么 ， 必 须 通过 软件 的 方式 告诉 它 。 硬 件 为 方便 软 
件 对 它 的 “ 调 遗 ” 它 为 软件 提供 了 接口 ， 这 通常 是 通过 IO 指令 进行 一 堆 复 杂 的 寄存 器 设置 ， 然 后 通过 读 
取 寄 存 器 检测 相应 的 状态 ,然后 再 进行 数据 交换 。 虽然 这 已 大 大 方便 了 我 们 对 硬件 的 控制 , 但 我 们 依然 是 
“懒惰 的 ”不 希望 每 次 找 硬 件 帮 忙 时 都 做 这 种 重复 性 的 体力 劳 动 ， 这 种 很 “ 直 白 地 ”寄存 器 控制 指令 显然 
还 方便 得 不 够 。 我 们 不 想 要 “过 程 ” 只 想 要 个 “结果 ”。 



























































为 了 方便 获取 “结果 ” 我 们 将 这 些 复杂 的 硬件 控制 指令 封装 成 一 个 过 程 ， 每 次 只 把 对 硬件 的 操作 需 
求 提交 给 此 过 程 ， 由 此 过 程 实施 底层 的 控制 细节 ,然后 返回 给 调用 者 一 个 结果 ， 这 个 直接 同 底层 硬件 打 交 
道 的 过 程 便 是 驱动 程序 。 

今天 我 们 要 编写 键盘 中 断 处 理 程序 ， 这 是 我 们 的 第 一 个 硬件 驱动 程序 。 


10.4.1 转 义 字符 介绍 


在 开始 动手 写 代码 之 前 ， 先 介绍 点 转 义 字符 的 知识 ， 也 许 您 用 得 着 。 

字符 集中 的 字符 分 为 两 大 类 ， 一 类 是 可 见 字符 ， 如 字符 'w',， 这 是 看 得 见 的 字符 。 另 一 类 是 不 可 见 的 控 
制 字符 ， 比 如 回 车 符 、 制 表 符 等 。 字 符 通常 情况 下 是 通过 键盘 输入 的 〈 手 写 板 、 鼠 标点 击 都 不 算 )， 因 此 ， 
键盘 中 的 各 种 键 也 分 为 两 大 类 ， 一 类 按键 负责 输入 可 见 字 符 ， 另 一 类 按键 负责 输入 控制 字符 。 

前 面 介绍 过 ， 按 键 的 行为 是 由 字符 处 理 软件 来 解释 的 ， 字 符 处 理 软件 通常 是 上 层 模块 ， 它 所 处 理 的 对 
象 并 不 是 扫描 码 ， 而 是 字符 集中 的 字符 编码 ， 如 ASCI 码 。 因 此 ， 我 们 的 键盘 驱动 有 责任 将 扫描 码 转换 成 
对 应 的 ASCII 码 。 

转换 工作 就 是 建立 源 到 目标 映射 关系 , 因此 几乎 都 是 硬 编 码 , 也 就 是 这 种 映射 关系 是 在 程序 中 固定 写 死 的 ， 
比如 当 扫 描 码 为 0x2 时 ( 通 码 )， 在 未 按 住 shift 键 的 情况 下 ， 我 们 将 其 转换 为 字符 '1'。 
于 是 问题 来 了 ,键盘 上 的 控制 键 ， 它 们 对 应 的 字符 是 不 可 见 的， 对 于 这 些 不 可 见 的 字符 ,我 们 对 其 转 
换 的 时 候 ， 如 何在 程序 中 写 入 对 应 的 字符 呢 ? 聪明 的 你 肯定 想到 了 转 义 字符 。 

大 伙 儿 一 般 用 到 的 转 义 字 符 都 是 “ 反 斜 杠 字 符 N 开 头 + 单个 字母 ”的 形式 ， 比 如 水 平 制 表 符 用 Tab 键 
用 \t 表 示 ， 退 格 键 backspace 用 "\b' 表 示 ， 但 有 些 字符 并 没有 字符 表示 的 形式 ， 比 如 Esc 键 。 

不 知道 大 伙 是 否 都 了 解 ， 在 C 语言 中 有 三 种 转 义 字符 。 

(1) 一 般 转 义 字 符 ，"\+ 单 个 字母 ' 的 形式 。 

(2) 八进制 转 义 字符 ，N0+ 三 位 八进制 数字 表示 的 ASCII 码 ' 的 形式 。 

(3) 十 六 进 制 转 义 字符 ，"\x+ 两 位 十 六 进 制 数 字 表 示 的 ASCII 码 ' 的 形式 。 

上 面 的 t 就 属于 第 1 种 一 般 转 义 字符 。 因 此 若菜 些 控 制 键 没 有 一 般 转 义 字 符 ， 咱 们 可 以 用 八进制 或 十 
六 进 制 转 义 字 符 去 表示 它 ， 总 之 后 两 种 是 表示 任意 字符 的 万 能 方法 , 您 甚至 可 以 在 字符 串 中 用 夹杂 这 种 转 
义 形式 表示 字符 ， 屡 试 不 爽 。 拿 字符 '&' 的 ASCII 码 举例 ， 十 进 制 为 pr ee 
38， 八 进 制 为 46， 十 六 进 制 为 0x26， 下 面 用 echo 命令 做 了 演示 ， ”四 党 
如 图 10-20 所 示 。 ip tmp]$ echo -en 'u\x26me\n' 
您 看 ， 对 于 字符 '&' 的 ASCII 码 ， 第 一 条 echo 命令 是 用 八进制 bs 入 
转 义 的 , 第 二 条 echo 命令 是 用 十 六 进 制 转 义 的 ， 效 果 相 同 ， 都 打印 “图 ?0 20 人 六 制 和 十 六 进 制 转 义 字符 
出 亲情 般 温 馨 的 u&me。 
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10.4.2 ”处 理 扫描 码 










































































































































































































































































































































































































































































想必 通过 之 前 的 例子 ， 大 伙 儿 已 经 了 解 键 盘 输 入 的 本 质 了 。 键 盘 中 断 处 理 程序 负责 接收 按键 信息 ， 也 
就 是 按键 的 扫描 码 ， 然 后 就 是 对 各 种 扫描 码 的 处 理 ， 把 不 同 扫 描 码 解释 为 不 同 的 表现 行为 。 简 单 来 说 这 也 
是 驱动 程序 做 的 事 ， 但 只 是 一 部 分 ， 本 节 要 完成 这 部 分 工作 。 

分 析 一 下 人 家 都 是 怎么 处 理 的 ， 通 常情 况 下 : 

当 按 下 的 键 是 可 见 字符 时 ， 屏 幕 上 都 会 将 其 显示 出 来 ， 比 如 按 下 了 a 键 ， 屏 幕 上 应 该 输出 字符 aa， 给 
用 户 一 个 反馈 ， 这 样 用 户 才 觉 得 自己 没 按 错 ， 这 是 为 打造 好 的 用 户 体验 最 起 码 的 素质 。 

当 按 下 的 键 是 控制 字符 时 ， 我 们 应 该 做 出 相应 的 控制 行为 ， 并 在 屏幕 上 展现 出 这 种 行为 ， 比 如 按 下 了 
backspace 键 ， 咱 们 也 应 该 在 屏幕 上 让 用 户 觉得 光标 所 在 处 前 面 的 字符 被 删 掉 了 。 

咱们 也 按照 这 种 传统 的 作法 实现 ， 这 分 两 阶段 来 完成 。 

(1) 如 果 是 一 些 用 于 操作 方面 的 控制 键 ， 简 称 操作 控制 键 ， 如 <shift>、<ctrl>、<caps lock>， 它 通常 
是 组 合 键 ， 需 要 与 其 他 键 一 起 考虑 ， 然 后 做 出 具体 的 行为 展现 ， 在 键盘 驱动 中 完成 处 理 。 

(2) 如 果 是 一 些 用 于 字符 方面 的 键 ， 无 论 是 可 见 字符 ， 或 是 字符 方面 的 控制 键 〈 简 称 字符 控制 键 )， 
如 <backspace> ， 统 统 交 给 字符 处 理 程 序 完成 ， 比 如 咱们 的 put_char。 还 记得 吗 ? put_char 能 够 处 理 


<backspace>， 也 就 是 \b'。 






























































































































































































































































































































































对 于 第 一 阶段 ， 它 与 字符 无 直接 的 关系 ， 因 此 咱们 就 在 键盘 驱动 中 处 理 。 

对 于 第 二 阶段 ， 咱 们 得 知道 用 户 按 下 的 是 什么 字符 ， 不 能 把 操作 控制 键 当成 字符 传 给 字符 处 理 程序 ， 
比如 把 shift 键 的 扫描 码 传 给 put_char， 这 不 就 乱 了 吗 ? 因此 ， 咱 们 得 把 按键 的 扫描 码 转换 成 对 应 的 字符 ， 
也 就 是 将 通 码 转换 为 字符 的 ASCII 码 ， 这 就 是 前 面 所 说 的 源 到 目标 的 映射 关系 。 

大 伙 儿 看 下 表 10-1， 里 然 表 中 的 键 看 似 无 规律 ， 但 仔细 观察 一 下 ， 它 们 的 通 码 几乎 是 连续 的 ， 范围 是 
0x1~~0x58， 其 中 0x5$4 一 0x56 不 存在 ， 其 他 键 的 通 码 都 是 连续 分 布 的 。 因 此 ， 咱 们 可 以 创建 二 维 数组 来 记 
录 这 映射 关系 ， 用 通 码 作为 数组 的 索引 。 

目前 咱们 用 不 到 所 有 键 的 功能 ， 为 处 理 简 单 ， 这 里 并 不 打算 支持 所 有 的 按键 ， 暂 时 只 支持 主键 盘 区 ， 
因此 咱们 的 数组 范围 暂时 为 0x1 一 0x3A， 以 后 用 到 的 时 候 再 加 吧 。 

好 啦 ， 可 以 介绍 键盘 中 断 处 理 程序 了 ， 请 见 代 码 10-13-1。 


\D 0 ~U 必 mw 上 情 





代码 10-13-1 



































































































































#include "keyboard.h" 

#include "print.h" 

#include "interrupt.h" 

#include "io.h" 

#include "global.h" 

#define KBD BUF PORT 0x60 // 键盘 buffer 寄存 器 端口 号 为 0x60 
/* 用 转 义 字符 定义 部 分 控制 字符 */ 

#define esc N033 // 八进制 表示 字符 ， 也 可 以 
#define backspace NB 

#define tab SRE 

#define enter TNEY 

#define delete '\177' ”// 八进制 表示 字符 ， 十 六 进 制 为 "'\x7f' 
/* 以 上 不 可 见 字符 一 律 定 义 为 0 */ 

#define char invisible 0 

#define ctrl 1 char char invisible 

#define ctrl r char char invisible 

#define shift 1 char char invisible 

#define shift r char char invisible 

#define alt 1 char char invisible 

#define alt r char char invisible 

#define caps lock char char invisible 

/* 定义 控制 字符 的 通 码 和 断 码 */ 


#define 


shift 1 make 


0x2a 


( project/c10/d/device/keyboard.c ) 


二 六 进 制 '\xlb' 
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代码 10-12-1 只 是 keyboard.c 的 
输出 缓冲 区 寄存 器 的 端口 。 下 
码 (break)， 它 们 将 在 扫描 码 数组 中 用 
第 10 一 14 行 定义 了 控制 键 的 ASCII 码 ， 由 于 它们 都 是 不 可 见 
其 中 esc 和 delete 没有 一 般 转 义 字 符 的 形式 ， 因 此 
进 制 形式 ， 这 么 做 3 








的 。 
的 是 八 
制 出 
































#define shift r make Ox36 

#define alt 1 make 0x38 

#define alt r make 0xe038 

#define alt r break 0xe0b8 

#define ctrl 1 make Oxld 

#define ctrl r make 0xe01d 

#define ctrl r break 0xe09d 

#define caps lock make 0x3a 

/* 定义 以 下 变量 记录 相应 键 是 否 按 下 的 状态 ， 

* ext scancode 记录 makecode 是 否 以 0xe0 





























头 */ 





static bool ctrl status, shift status, alt status, caps lock status, ext scancode; 



























































四 是 预先 定义 的 按键 扫 
到 。 

































































第 17 一 24 行 定 义 的 是 




















FE 要 是 为 了 


明 作 





























































































































苗 码 ， 都 是 








pr AT 


子 付 ， 


j 宏 定义 的 控 


它们 都 是 用 转 义 








V4 


字符 





只 能 考虑 八进制 或 二 
容 ， 并 不 是 所 有 的 C 标 ; 
现 的 较 早 ， 很 古老 的 编译 器 也 支持 ， 但 十 六 进 制 形式 的 转 义 字符 是 在 c89 后 才 实 现 的 ， 尽管 
持 c89， 甚 至 有 的 编译 器 都 支持 c99 了 ， 但 保持 




















容 也 没什么 不 好 。 


佳 都 支持 这 两 种 数 近 


六 进 市 





I 形式 。 您 看 ， 











这 六 





部 分 ， 程 序 开 头 定义 了 KBD _BUF PORT 为 0x60， 这 是 8042 输入 和 
央 键 的 通 码 Cmake) 及 上 断 


的 形式 定义 
咀 们 这 里 用 





























多 式 的 转 义 


符 ， 八 进 




















J 
前 





gcc 











空 制 键 的 “ASCII 码 ” 加 了 引号 的 原 
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都 文 


您 懂 的 ， 这 类 键 是 没有 ASCII 的 ， 

















































































































在 控制 键 中 只 有 字符 控制 键 才 有 ASCI 码 。 后 面 定 义 的 数组 中 要 用 到 ASCI 码 ， 为 了 与 数组 保持 格式 上 
的 一 致 ， 所 以 将 其 统一 定义 为 0， 相 当 于 占 位 用 的 ， 一 会 儿 介绍 数组 时 您 就 清楚 了 。 

第 27 一 35 行 定义 的 是 操作 控制 键 的 扫描 码 ， 它 们 是 前 面 提 到 过 的 “两 阶段 ”中 的 第 一 阶段 ， 用 于 组 
合 键 中 的 判断 。 比 如 按 下 了 shift 时 再 按 字 母 键 ， 就 表示 输入 的 是 大 写字 符 。 

操作 控制 键 与 其 他 键 配 合 时 是 先 被 按 下 的 ， 因此， 每 次 在 接收 一 个 按键 时 ， 需 要 查看 上 一 次 是 否 有 按 
下 相关 的 操作 控制 键 ， 所 以 咱们 得 记录 操作 控制 键 在 之 前 是 否 被 按 下 了 ， 也 就 是 将 操作 控制 键 的 当前 状态 
记录 在 某 个 全 局 变量 中 ， 我 们 在 第 39 行 声 明 的 全 局 变量 就 是 用 于 这 个 目的 的 。 

下 面 咱们 继续 看 代码 10-13-2， 还 是 keyboard.c。 

代码 10-13-2 (project/c10/d/device/keyboard.c ) 
… 略 

41 /* 以 通 码 make_code 为 索引 的 二 维 数组 */ 

42 static char keymap[] [2] = { 

43 /* 扫描 码 未 与 shift 组 合 */ 

WD LE */ 

450: /JK OxOO 7 0, Ow 

46 /* 0x01 */ esc, esc}, 

47 /* Ox02 */ Ll 下 

48 /* Ox03 */ roy Cd 

49 /* Ox04 */ We '#"'}, 

50 /* Ox05 */ '4', 凡凡 

Dl Yk OROG. «A Ro Se 

52. 7/% OKO 4 6. CA 

53 /% 0K08 </ wp 中 

54 /* Ox09 */ v8: Mh 

55 /* OxOA */ SO "('), 

56 /* OxO0B */ Oy sj 

57 /* OxO0C */ 区 

BA DOD */ "一 "7 "+ 

S59 /0x0B */ backspace, backspace}, 

60 /* OxOF */ tab, tab}, 

61 /* Ox10 */ veh CO 

62 /* Oxll */ 'w', WII) 

63 /* 0xX12 */ 'e', 由 了 8 才 证 

64 /* 0xX13 */ bs "Ry 

65.7/* OQxT4- */ EE ye 

G6: /EOxLS: / 'y', Dy 

67 /二 ORL6. Cy Ur 
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69 /* Ox18 */ Vo Os 

了 0 /* Ox19 */ VD; "P7}， 

71 /* OxlA */ a 下 

2 ORLB <*/ 人 二 

了 3 OKTLGC: */ enter, enter}, 

了 和 双关 101D 六 trl l chary ‘Ctrl l enary} 
了 5 7 二 ORLE */ 2 AT 

67Y 直人 放大 本 Ss 

7 O20 We Dy 

78: ,7/% "OR21. */ mE "FE'}; 

79 /* Ox22 */ Lg 由 

80 /* Ox23 */ ET 'H'}, 

81 /* Ox24 */ ny 

82 .7/025 要/ Ee 'K'}, 

83 /* 0x26 */ Te Ee 

84 /* Ox27 */ yy ry 

85 /* 0x28 */ 人 rm 

86 /* Ox29 */ es Ey 

87 /* Ox2A */ Shift 1 char; Shift 1} -ehar}y 
88 /* 0x2B */ SR 

89 /x 0x2C. */ rz! 2 

90 /* Ox2D */ rt pA 

91 /* Ox2E  */ Te Cn 

902/* OX2E 光 人 Va VE 

93 /* 0x30 */ 本 "By 

94 7 iDx3L 去/ 1 'N'}, 

95 /* Ox32 */ 'm', 'M'}, 

96° /* Ox33 wy/ Us Deg 

97 /* 0x34 */ HW Sy 

98) /* 0x35 */ WA 人 

9.9577 OKI36T KY shift, Ee "ehar, “Shift F.Chary, 
二 DB ww .ORI ai Cr 

101 /O038. */ alt 1 char, alt 1 char}, 
L002 /039 7/ yy ey 

103 /* Ox3A */ caps_lock char, caps lock char} 
104 /* 其 他 按键 暂 不 处 理 */ 

上 5 

106 




















这 里 定义 的 二 维 数组 keymap 便 是 本 节 键 盘 驱 动 的 核心 , 此 数组 主要 是 定义 了 与 shift 组 合 时 的 字符 效 
数组 范围 是 0~0x3A， 这 是 咱们 说 好 的 目前 所 支持 的 主键 盘 区 的 按键 范围 ， 您 可 以 对 照 图 10-15 中 的 
第 一 套 按键 扫描 码 看 看 。 
主 




















































































































键盘 区 主要 是 与 上 档 键 shift 配合 使 用 ， 您 看 ， 如 果 之 前 已 经 按 下 了 shift 键 并 且 按 住 不 松手 : 
当 在 主键 盘 区 中 按 下 数字 键 时 ， 这 表示 按键 为 数字 上 面 的 符号 ， 如 '3' 变 成 了 向。 
。 当 在 主键 盘 区 中 按 下 字母 键 时 ， 这 表示 按键 为 大 写字 母 ， 如 'a' 变 成 了 'A'。 
有 无 shift 键 参与 时 按键 效果 是 不 同 的 ， 所 以 我 们 主要 以 这 种 和 shift 键 配 合 的 情况 来 建立 通 码 到 对 应 
字符 的 映射 ， 这 里 的 字符 就 是 指 字符 的 ASCII 码 。 
keymap 中 每 个 数组 元 素 都 是 一 维 数组 ， 代 表 某 个 按键 在 有 无 shift 键 配合 情况 下 的 表现 。 
储 数 组 中 的 第 0 个 元 素 是 某 个 按键 未 与 shift 键 组 合 时 对 应 的 字符 ASCII 码 值 ， 第 1 个 元 素 是 某 个 
按键 与 shift 键 组 合 时 对 应 的 字符 ASCII 码 值 。 举 个 例子 ，a 的 通 码 为 0xle， 比 如 按 下 a 键 ， 若 之 前 未 按 
下 shift 键 ， 咱 们 应 该 处 理 为 小 写字 符 'a'， 所 以 keymap[0x1e][0] 等 于 'a'。 否 则 若 已 经 按 下 了 shift 键 ， 咱 们 
应 该 处 理 为 大 写字 符 'A'， 所 以 keymap[0xle][1] 等 于 'A'。 
没有 通 码 为 0 的 键 ， 因 此 数组 第 0 个 一 维 数组 keymap[0][]， 听 们 为 其 定义 两 个 0 值 。 
keymap 数组 就 介绍 到 这 ， 下 面 咱们 看 代码 10-13-3。 


代码 10-13-3 (project/c10/d/device/keyboard.c ) 










































































































































































NS 
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107 /* 键盘 中 断 处 理 程序 */ 
108 static voidq intr keyboard handler (void) { 


110 /* 这 次 中 断 发 生前 的 上 一 次 中 断 ， 以 下 任意 三 个 键 是 否 有 按 下 */ 
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111 bool ctrl down last = ctrl status; 
112 bool shift down last = shift status; 
小 坟 学 bool caps lock last = caps lock status; 
114 
Le bool break code; 
116 uint16 t scancode = inb (KBD BUF PORT); 
汪汪 学 
118 /* 若 扫 描 码 scancode 是 e0 开头 的 ， 表 示 此 键 的 按 下 将 产生 多 个 扫描 码 ， 
119 * 所 以 马上 结束 此 次 中 断 处 理 函 数 ， 等 待 下 一 个 扫描 码 进来 */ 
二 20 if (scancode == 0xe0) { 
二 2 二 ext_scancode = true; // 打开 e0 标记 
122 return; 
123 
124 
125 /* 如 果 上 次 是 以 0xe0 开头 的 ， 将 扫描 码 合并 */ 
126 if (ext scancode) { 
127 scancode = ((0xe000) | scancode); 
128 ext_scancode = false; // 关闭 e0 标记 
129 
130 
下 3 站 break code = ((scancode & 0x0080) != 0);，; // 获取 break code 
132 
133 if (break code) { // 若是 断 码 break_code ( 按键 弹 起 时 产生 的 扫描 码 ) 
134 
135 /* 由 于 ctrl r 和 alt r 的 make code 和 break code 都 是 两 字 节 ， 
136 所 以 可 用 下 面 的 方法 取 make_code， 多 字 节 的 扫描 码 暂 不 处 理 */ 
由 汉子 uint16 七 make code = (scancode &= Oxff7f); 

// 得 到 其 make_code ( 按键 按 下 时 产生 的 扫描 码 ) 
138 
139 /* 若是 任意 以 下 三 个 键 弹 起 了 ， 将 状态 置 为 false */ 
140 if (make code == ctrl 1 make | | make code == ctrl r make) { 
141 ctrl status = false; 
142 } else if (make code == shift 1 make | | make code == shift r make) { 
143 shift status = false; 
144 } else if (make- code == alt 1 make | | make code == alt r make) { 
145 alt_ _Status = false; 
146 } /* 由 于 caps_lock 不 是 弹 起 后 关闭 ， 所 以 需要 单独 处 理 */ 
147 
148 return; // 直接 返回 结束 此 次 中 断 处 理 程序 
149 
150 } 
151 /* 若 为 通 码 ， 只 处 理 数组 中 定义 的 键 以 及 alt_right 和 ctrl 键 , 全 是 make code */ 
152 else if ((scancode > 0x00 && scancode < 0x3b) || \ 
1.53 (scancode == alt r make) [| 
154 (scancode == Ctrl r make)) { 
155 bool shift = false; 

// 判断 是 否 与 shift 组 合 ， 用 来 在 一 维 数组 中 索引 对 应 的 字符 
156 if ((scancode < Ox0e) || (scancode == 0x29) || \ 
1.5:7. (scancode == 0xla) || (scancode == 0xlb) || \ 
158 (scancode == 0x2b) || (scancode == 0x27) || \ 
159 (scancode == 0x28) || (scancode == 0x33) || \ 
160 (scancode == 0x34) || (scancode == 0x35)) { 
161 /太太 类 火炎 大 代表 两 个 字母 的 键 大 大大 大 大 大 大 大 
162 0x0e 数字 ， 0' 一 '9' ,字符 '-' 字符 '=' 
163 Ox29 
164 Oxla 
165 0x1b 
166 0x2b 
167 0x27 
168 0x28 
169 0x33 
170 0x34 
汪汪 0x35 
生 人 分 大火 大 炎炎 类 类 大火 炎 大火 大 大 类 大 大 类 大 类 大 大 大 大 大 大 大 大 大 大 类/ 
173 if (shift down last) // 如 果 同 时 按 下 了 shift 键 
174 shift = true; 
175 } 
176 } else { // 默认 为 字母 键 
BE 全 if (shift down last && caps lock last) { 
// 如 果 shift 和 capslock 同时 按 下 

178 shift = false; 
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179 else if (shift down last 加 caps lock last) { 
// 如 果 shift 和 capslock 任意 被 按 下 

180 shift = true; 

王 8 于 else { 

182 shift = false; 

183 

184 } 

189 

186 uint8 t index = (scancode &= 0x00f 

J 将 扫描 码 的 高 守 DD 0 让 针对 高 子 了 卫 征 人 0 的 扫描 码 

187 char cur char = keymap[index] [shift]; // 在 数组 中 找到 对 应 的 字符 

188 

189 /* 只 处 理 AscII 码 不 为 0 的 键 */ 

下 9 二 天 {eur chiark :ft 

191 put char (our ehar}s 

192 return; 

1:93 } 

194 

195 /* 记录 本 次 是 否 按 下 了 下 面 几 类 控制 键 之 一 ， 供 下 次 键入 时 判断 组 合 键 */ 

196 if (scancode == ctrl 1 make | scancode == ctrl_r_ make) { 

197 ctrl status = true; 

T98 else if (scancode == shift 1 make | scancode == Shift r make) { 

199 shift status = true; 

200 else if (scancode == alt 1 make | scancode == alt r make) { 

2.01: alt_status = true; 

202 else if (scancode == caps_ 7 _make) 

203 /* 不 管 之 前 是 否 有 按 下 caps_lock 键 ， 次 汪 F 时 则 状态 取 反 ， 

204 * 即 已 经 开启 时 ， 再 按 下 同样 关闭 时 按 下 表示 开启 */ 

205 caps_ lock status = !caps lock status; 

206 

207 } else { 

208 put_ str("unknown key\n"); 

209 } 

210 } 

这 二 二 

代码 10-13-3 确实 有 点 长 ， 键 盘 处 理 程 序 相 对 来 说 是 个 “大 活 儿 ” 拆 开 了 不 好 说 ， 因 此 一 股 脑 就 全 
过 来 了 ， 咱 们 边 看 边 介绍 。 

键盘 中 断 处 理 程 序 始终 是 每 次 处 理 一 个 字 节 ， 所 以 当 扫描 码 中 是 多 字 节 时 ， 或 者 有 组 合 键 时 ， 咱 们 要 

定义 额外 的 全 局 变量 来 记录 它们 曾经 被 按 下 过 。 

ctrl_status、shift_status 和 caps_lock_status 是 定义 在 代码 10-12-1 结尾 处 的 三 个 全 局 变量 ， 它 们 分 

别 记录 <ctrl>、<shift> 和 <caps lock> 三 个 键 的 状态 ， 值 为 true 表示 按 下 ， 值 为 false 表示 弹 起 。 每 次 这 





三 个 键 被 按 下 或 被 弹 起 时 ， 都 将 记录 在 这 些 变量 















































































































































， 对 这 三 个 键 的 处 型 








是 在 intr keyboard handler 中 








































































































































































































































































































































































































对 通 码 和 断 码 各 自 的 处 理 代 码 块 的 结尾 处 ， 一 会 儿 咱 们 再 说 。 

您 看 ， 我 们 只 定义 了 ctrl_status、shift status、alt status 和 caps_ lock status 这 4 个 控制 键 ， 其 中 用 于 
组 合 键 的 只 有 前 三 个 ， 因 此 ， 咱 们 最 多 支持 <ctrl>+<shift>+<alt> 三 个 控制 键 形式 的 组 合 键 。 

函数 intr_keyboard handler 不 再 像 上 一 版 本 那么 简单 ， 这 次 显得 像样 一 些 了 。 在 程序 开头 定义 了 三 
布尔 变量 ctrl down last、shift down last 和 caps_lock last, 分 别 从 那 三 个 全 局 变量 中 获取 这 3 是 
否 被 按 下 并 且 尚 未 松 开 。 

在 第 116 行 从 端口 KBD BUF PORT 获取 扫描 码 ， 开 始 处 理 。 

咱们 目前 只 支持 主键 盘 区 上 的 键 ， 因 此 只 存在 一 个 0xe0 作为 扫描 码 前 级 的 情况 。 我 们 这 里 用 变量 
ext_scancode 作为 0xe0 扩展 扫描 码 的 标记 。 

在 第 120 行 只 要 发 现 扫 描 码 为 0xe0， 就 表示 此 键 的 扫描 码 多 于 一 个 字 节 ， 后 面 还 有 扫描 码 ， 因 此 将 
ext_scancode 标记 置 为 true 后 执行 return 返回 。 

在 第 126 行 通过 ext scancode 标记 判断 上 一 次 是 否 收 到 了 0xe0， 如 果 是 ， 将 此 次 接收 到 的 扫描 码 与 
0xe0 合并 为 完整 的 扫描 码 〈 此 时 为 通 码 或 断 码 ) 用 于 后 续 处 理 ， 并 且 将 ext scancode 置 为 false， 关 闭 扩 
展 扫描 码 标记 。 
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现在 不 知道 此 次 接收 的 扫 
在 第 131 行 通过 break code = ((scancode & en != 二 0) 来 断 扫 








描 码 是 通 码 ， 











描 码 是 











































































































































































































就 是 不 知道 现在 是 按键 按 下 ， 还 是 按键 级 
否 为 断 码 。 断 码 的 第 8 位 为 1， 所 以 








和 起， 因此 















































































































































































































































































































































































































































































































































用 扫描 码 scancode 和 0x0080 进行 位 与 操作 ， 此 时 bread_code 的 值 为 true 或 false。 

第 133 行 判 断 若 为 断 码 ， 就 进入 断 码 的 处 理 代 码 块 ! 

接 下 来 我 们 要 判断 此 次 按键 (扫描 码 ) 对 应 的 字符 是 什么 。 对 为 我 们 的 扫描 码 对 应 的 字符 定义 在 二 维 
数组 keymap 中 ， 通 码 是 此 数组 的 索引 ， 所 以 此 时 接收 的 若 为 断 码 ， 为 了 检索 数组 keymap， 我 们 还 是 要 将 
其 还 原 为 通 码 。 

大 估 儿 知道 ， 第 一 套 键盘 扫描 码 通 码 和 断 码 的 区 别 就 是 扫描 码 第 8 位 的 值 ， 断 码 的 第 8 位 为 1， 通 码 
的 第 8 位 为 0。 因此， 在 第 137 行 ， 将 扫描 码 scancode〈 此 时 它 为 断 码 ) 与 0xff7f 进行 位 与 运算 ， 抹 去 第 
8 位 的 1， 这 样 就 获得 了 其 通 码 ， 并 将 其 存储 到 变量 make_code 中 。 

现在 我 们 已 经 获得 了 断 码 对 应 的 通 码 ， 下 面 我 们 就 用 “ 通 码 ” 来 处 理 键盘 的 “ 弹 起 ” 加 引号 的 目的 是 想 强 
调 ， 咱 们 还 是 在 断 码 的 处 理 流程 中 ， 处 理 的 是 按键 的 弹 起 ， 并 不 是 按 下 ， 只 是 用 通 码 更 为 方便 判断 是 哪个 按键 。 

第 140 一 146 行 判断 此 通 码 是 否 为 ctrl、shift、alt。 一 般 情况 下 这 三 个 键 在 键盘 上 都 是 左右 各 一 个 ， 所 
以 无 论 按 下 哪个 都 表示 按 下 了 同一 功能 的 控制 键 ， 因 此 无 论 弹 起 哪个 也 都 表示 弹 起 了 同一 功能 的 控制 键 。 

拿 第 140 行 的 ctrl 键 的 判断 来 说 :“if (make_code == ctrl 1 make | make_code = ctrl r make)” 拿 通 码 
make_code 分 别 与 左 ctrl 键 的 通 码 ctrl 1 make 和 右 ctrl 键 的 通 码 ctrl r_ make 比较 ， 若 满足 其 一 ， 便 将 
ctrl_ status 置 为 false， 表 示 ctrl 键 此 时 被 松 开 弹 起 了 。 注 意 是 置 为 false， 虽 然 我 们 是 用 通 码 在 判断 ， 但 现 
在 处 于 处 理 断 码 的 代码 块 中 ， 此 代码 块 就 是 判断 是 哪个 键 被 弹 起 了 。 

前 面 咱们 分 析 过 组 合 键 的 弹 起 顺序 了 , 一 般 是 先 松 开 控 制 键 , 再 松 开 字符 键 ， 所 以 这 三 个 键 的 状态 变量 
ctrl_status、shift_status 和 alt_status 并 不 是 本 次 使 用 ， 是 供 下 次 判断 组 合 键 用 的 ， 本 次 只 是 记录 是 否 松 开 了 它 
们 。 下 次 在 进入 键盘 中 断 时 ， 在 intr keyboard handler 的 开头 通过 ctrl down last = ctrl status 获取 上 一 次 ctrl 
键 是 否 处 于 弹 起 的 状态 (也 就 是 没有 按 下 它 )。 

对 于 alt 和 shift 的 处 理 也 是 一 样 ， 最 后 结束 断 码 的 处 理 ， 通 过 return 返回 。 

以 上 是 对 断 码 的 处 理 。 

若 此 次 接收 的 键 为 通 码 的 话 ， 则 进入 通 码 的 处 理 代码 块 ， 这 里 的 主要 工作 就 是 根据 通 码 和 shift 键 是 否 
按 下 的 情况 ， 在 数组 keymap ti 

我 们 最 大 支持 的 通 码 为 0x3a， 即 只 支持 到 <caps_lock> 键 ， 因 此 咱们 要 防止 越界 ， 所 以 第 132 一 154 行 
通过 “scancode > 0x00 && scancode < 来 限制 对 数组 keymap 的 访问 。 另 外 ， 我 们 将 来 也 要 文 持 ctrl 
或 alt 相关 的 快捷 键 ， 但 <R-ctrl> 和 <R-alt> 的 通 码 是 以 0xe0 开头 的 扩展 扫描 码 ， 范 围 不 在 0x3b 之 内 ， 所 以 





加 了 “或 ”判断 “(scancode 一 


接 下 来 我 人 























] 要 将 扫 




















键盘 






















































































alt r make) || (scancode == 
时 码 转 换 为 字符 了 。 
区 主要 就 是 数字 键 和 字母 键 ， 因 














ctrl T_ make) ”。 



























































此 现在 要 考虑 的 是 之 前 是 否 按 下 了 <shift> 键 和 <capslock> 键 ， 大 伙 





























































































































儿 知 道 ， 主 键盘 区 中 部 分 键 有 两 个 意义 ， 当 与 shift 配合 使 用 时 ， 表 示 键 中 上 面 的 字符 ， 为 方便 讨论 ， 暂 
称 它们 为 双 字 符 键 。<shift> 键 和 <capslock> 键 对 双 字 符 键 和 字母 键 的 影响 是 不 一 样 的 ， 下 面 分 别 讨论 。 

。 当 键 入 的 是 双 字 符 键 时 

如 果 同 时 按 下 了 <shift> 键 ， 则 应 该 转换 为 数字 键 上 面 的 那个 符号 ， 比 如 当前 按 下 的 是 数字 2， 之 前 大 
按 下 shift 未 松手 的 话 ， 现 在 应 该 将 其 转换 为 字符 '@'。 

<capslock> 键 是 否 开 启 ， 对 双 字 符 键 无 影响 。 

。 当 键 入 的 是 字母 键 时 

如 果 之 前 开启 了 <caps lock> 键 ， 则 应 该 转换 为 大 写字 母 。 

如 果 之 前 同时 按 下 了 <shift> 键 不 松手 ， 但 没有 按 下 <capslock> 键 ， 则 也 应 该 转换 为 大 写字 母 。 

若 之 前 同时 按 下 了 <capslock> 键 和 <shift> 键 ， <shift> 键 将 <capslock> 键 的 功能 抵消 ,因此 键入 的 是 字母 
键 应 该 转换 为 小 写字 母 。 

实际 上 ， 转 换 后 的 具体 字符 是 在 二 维 数 组 keymap 中 的 一 维 数组 中 ， 以 上 的 讨论 本 质 上 是 决定 使 用 按 
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键 所 在 一 维 数组 中 的 第 0 个 元 素 ， 还 是 第 1 个 元 素 作为 转换 后 的 
字符 ， 第 1 个 元 素 是 有 <shift> 键 时 对 应 的 字符 ， 








<shift> 键 要 么 按 下 ， 要 么 松 开 。 因 此 ， 我 们 可 以 






































无 论 <capslock> 键 和 <shift> 键 怎样 配合 ， 其 最 终 效 
E<capslock> 键 和 <shift> 键 的 各 种 配合 统统 归 
依然 是 值 为 1 表示 按 下 ， 值 为 0 表示 弹 起 ， 因 此 ， 




















否 按 下 ， 我 们 用 个 bool 变量 shift 来 记录 <shift> 键 的 状态 ， 
咱们 目前 只 要 确定 shift 的 值 便 确定 了 转换 结果 ， 总 结 为 : 


















































若 shift 为 false， 则 表示 shift 为 0， 这 表示 
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ta 
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第 155 行 定 义 了 布尔 变量 shift，|) 
false 。 


下 面 分 两 种 情况 来 处 理 ， 先 处 理 双 字符 键 。 



































若 shift 为 tue， 则 表示 shift 为 1， 这 表示 
j 它 来 索引 按键 所 在 一 给 


数组 




















嫩 



































双 字 符 键 也 不 少 ， 下 面 列 出 它们 的 通 码 及 字符 意义 。 














Ar 


数字 0~~9、 字 符 '- 
符 "' 的 通 码 是 0x29。 
符 T' 的 通 码 是 0xla。 
符 了 的 通 码 是 0xlb。 
符 愉 的 通 码 是 0x2b。 
:的 通 码 是 0x27。 
符 \" 的 通 码 是 0x28。 
符 ,' 的 通 码 是 0x33。 
符 '' 的 通 码 是 0x34。 
符 / 的 通 码 是 0x35。 
第 的 代码 
如 果 是 这 些 双 字符 键 ， 
下 面 处 理 字母 键 ， 主 键盘 区 : 





字 
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子 - 


Pr 














一 























子 - 
156 一 160 行 
止 | 


便 是 对 


A 














已 们 的 判断 。 














已 





















































、 字 符 '=' 的 通 码 是 < 0x0e。 


az AT 





字符 。 第 0 个 元 素 是 无 <shife> 键 时 对 应 的 


















































等 同 于 
并 于 <shift> 键 是 





























数组 中 第 0 个 元 素 ， 即 keymap[ 通 码 ][0]。 
第 1 个 元 素 ， 即 keymap[ 通 码 ][1]。 
日 中 的 两 个 元 素 ， 默 认为 false， 即 bool shift = 


六 且 按 下 了 <shift>， 也 就 是 让 (shift down_last) 成 立 的 话 ， 就 将 shift 置 为 true。 
的 可 见 字 符 ， 除 了 双 字 符 键 就 是 字母 键 。 


“if (shift down _last && caps_lock_last)” 表 示 如 果 同 时 按 下 <shift> 和 <caps lock>， 抵 销 了 大 写 功能 ， 


所 以 shift 为 false。 





代码 “else if (shift down last || caps_lock_last)” 表 示 如 果 <shift> 和 <caps lock> 仅 按 下 了 一 个 ， 大 写 功 


能 开启 ， 因 此 shift 为 true。 
在 其 他 情况 下 ，shift 为 false。 























接 下 来 我 们 要 用 通 码 作 为 数组 keymap 的 索引 了 , 在 第 186 行 声明 变量 index 来 记录 数组 索引 值 ， 此 时 

















oar 























可 描 码 为 通 码 ， 直接 拿 扫 描 码 和 0x00 任 做 位 与 操作 误 
为 什么 用 0x00ff， 而 不 用 0xff? 原因 是 有 可 能 此 扫 























CE 可 以 了 ， 即 代码 uint8_t index = (scancode &= 0x00ff)。 
i 码 是 2 字 节 ， 高 字 节 是 0xe0， 我 们 要 抹 去 它 。 











Index 作为 二 级 数组 keymap 中 的 索引 ，shift 作为 二 级 数组 keymap 中 一 级 数组 的 索引 ， 需 要 的 数据 齐 


了 ， 所 以 下 一 行 通过 代码 “cur_char = keymap[index][shift]” 在 数组 中 找到 对 应 的 
| 键 ) 是 不 可 见 的 ， 其 值 为 0， 我 们 没 法 显示 它们 ， 所 
否 为 0， 若 不 为 0， 则 表示 当前 按键 是 可 显示 字符 或 
出 ， 随 后 通过 return 返回 。 









































在 数组 keymap 中 ， 部 分 控制 字符 《如 操作 控 御 
以 在 第 190 行 通过 “if (cur_char)” 来 判断 cur_char 是 
格式 控制 字符 ， 然 后 通过 “put_char(cur_char)” 将 其 输 

如 果 cur_char 为 0， 根 据 日 前 keymap 的 定义 ， 表 示 它 们 是 操 
之 一 ， 只 有 这 4 个 按键 对 应 的 ASCII 码 为 0， 注意 ， 现 在 处 于 通 





哪 一 个 按 下 了 。 









































接 下 来 便 是 对 这 4 个 键 进行 判断 ， 如 果 哪 个 键 被 按 下 了 就 将 其 状态 变量 置 为 true， 
还 是 <R-ctrl>)， 这 句 判 
此 就 会 将 状态 变量 ctrl_status 置 为 tue， 即 ctrl_status = true。 
| 键 ， 再 按 下 





子 ， 比 如 本 次 按 下 了 ctd 键 (无 论 是 <L-ctrl>， 
ctrl T make)” 都 会 成 立 ， 


前 面 噬 


















































们 分 析 过 组 合 键 的 按 下 顺序 了 ,一 般 是 先 按 下 控 各 








pp 




















eren 


子 付 。 








芷 控制 键 <ctl>、<shift>、<alf 或 <capslock> 


码 的 代码 块 中 ， 





汤 “if (scancode = 


> 码 夺 


于 从; 








’ 











= ctrl | make | scancode 





忆 此 要 判断 下 是 它们 中 的 

















供 下 次 判断 组 合 键 。 举 个 例 











之 后 : 退出 。 





断 执 行 完毕 ， 














键 ， 所 以 这 三 个 键 的 状态 变 
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量 ctrl_status、shift_status 和 alt_status 并 不 是 本 次 使 用 ， 是 供 下 次 判断 组 合 键 用 的 ， 本 次 只 是 记录 是 否 按 
下 了 它们 。 下 次 在 进入 键盘 中 断 时 ， 在 intr keyboard handler 的 开头 通过 ctrl down last = ctrl status 获取 
上 一 次 ctrl 键 是 否 按 下 。 
<caps lock> 键 有 些 特殊 , 它 不 像 <ctrl>、<shift>、<alt> 那 样 “ 按 下 时 ?开启 ,“ 弹 起 时 ”关闭 。<caps lock> 
生效 于 每 一 次 完整 的 击 键 操作 ， 即 “ 按 下 再 弹 起 ”开启 ， 下 一 次 的 “ 按 下 再 弹 起 ” 则 关闭 ， 相 当 于 状态 取 
反 ， 开 启 时 按 下 此 键 是 关闭 ， 关 闭 时 按 下 此 键 是 开启 。 因 此 对 它 的 处 理 也 特别 一 点 ， 对 此 键 的 状态 取 反 即 
可 ， 即 代码 caps_lock status = !caps lock status。 
咱们 支持 的 键 是 有 限 的 , 对 于 那些 通 码 在 0x3b 以 上 的 按键 ,咱们 在 else 代码 块 中 执行 put_str("unknown 
key\n") 提 示 未 知 键 。 
键盘 驱动 就 介绍 完了 ， 下 面 编译 运行 看 效果 。 
此 次 编译 时 gcc 提示 警告 变量 ctrl_down_last 未 用 到 ， 这 个 变量 以 后 会 用 ， 和 暂时 忽略 警告 ， 如 图 10-21 所 示 。 
好 入 没 编译 了 ， 这 里 是 通过 make build 1>/dev/null 来 编译 的 ， 咱 们 通常 只 关注 报错 ， 因 此 这 里 将 标准 
输出 重 定 问 到 /dev/null， 这 样 就 不 会 显示 多 余 的 编译 信息 扰乱 咱们 了 。 最 后 通过 make hd 写 入 硬盘 ， 当 然 
也 可 以 直接 执行 make all。 
在 bochs 中 运行 效果 如 图 10-22 所 示 。 


























































































































































































































































































































































































































[work@localhost d]$ make build 1>/dev/null 
device/keyboard.c: 在 函数 ‘intr_keyboard_handler’ 中 : 
device/keyboard.c:111: 警告 : 未 使 用 的 变量 “ctrl_down_last? 
[work@localhost d]$ make hd 

dd if=,./build/kernel .bin \ lkeyboard init start 
Ikeyboard init done 


of=/home/work/my_workspace/bochs/hd66M.img \ 
bs=512 count=200 seek=9 conv=notrunc 
bcdeFGHI jklm 
It works? a _ x 


记录 了 41+1 的 读 入 

记录 了 41+1 的 写 出 

21088 字 节 (21 kB) 已 复制 ，0.000140782 种 ，150 MB/ 秒 
work@localhost d]$ IPS: 30,705H | 


4 图 10-21 编译、 警告 、 写 入 硬盘 4 图 10-22 键盘 驱动 


在 keyboard init done 下 面 我 们 输入 了 一 个 回 车 , 所 以 显示 出 了 个 空 行 , 这 说 明 我 们 对 回 车 键 的 处 理 
正确 的 。 然 后 写 入 了 小 写字 母 abcde， 然 后 我 按 下 了 <caps lock> 键 ， 在 屏幕 上 键入 了 fehi， 屏 幕 上 输出 
大 写字 母 FGHI， 接 着 我 又 按 住 <L-shift> 键 入 了 jklm， 屏 幕 上 输出 了 小 写字 母 让 Im。 回 车 换行 ， 键 入 i 键 ， 
屏幕 输出 了 大 写 I， 随 后 我 关闭 <caps lock> 键 ,继续 键 入 后 面 的 字符 ， 其 中 的 字符 ' 是 通过 <R-shift>+1 键 
入 的 。 男 外 ， 在 以 上 键入 过 程 中 我 多 次 按 下 <backspace> 删 除 之 前 的 字符 ， 目 前 来 说 一 切 正常 。 

套用 登 月 第 一 人 阿姆斯特朗 的 那 句 名 言 : 本 节 所 做 的 工作 对 于 计算 机 来 说 仅仅 是 一 小 步 , 但 对 于 咱们 
来 说 却 是 一 大 步 。 
咱们 暂时 取得 了 阶段 性 的 胜利 ， 终 于 有 和 计算 机 交流 的 机 会 了 ， 不 过 更 多 的 交流 还 在 后 面 ， 下 节 咱 们 
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形 输入 缓冲 区 


到 现在 ， 咱 们 的 键盘 驱动 仅 能 够 输出 中 们 所 键入 的 按键 ， 这 还 没有 什么 实际 用 途 。 在 键 各 上 操作 是 为 
了 与 系统 进行 交互 ， 交 互 的 过 程 一 般 是 键入 各 种 shell 命令 ， 然 后 shell 解析 并 执行 。 
shell 命令 是 由 多 个 字符 组 成 的 ,并 且 要 以 回 车 键 结 束 ,， 因 此 咀 们 在 键入 命令 的 过 程 中 ， 必 须要 找 个 组 
冲 区 把 已 键入 的 信息 存 起 来 ， 当 凑 成 完整 的 命令 名 时 再 一 并 由 其 他 模块 处 理 。 
本 节 咀 们 要 构建 这 个 缓冲 区 。 


10.5.1 生产 者 与 消费 者 问题 简 述 
在 构建 绥 冲 区 之 前 ， 咀 们 得 知道 它 的 设计 思路 ， 打 算 解 决 哪些 问题 ， 因 此 还 是 要 先 来 点 “前 奏 ”。 
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我 们 知道 ， 在 计算 机 中 可 以 并 行 多 个 线程 ， 当 它们 之 间 相 互 合作 时 ， 必 然 会 存在 共享 资源 的 问题 ， 这 
是 通过 “线程 同步 ”来 解决 的 。 
“线程 同步 ”是 操作 系统 课程 中 必 讲 的 内 容 ， 而 诠释 “线程 同步 ”最 典型 的 例子 就 是 善 名 的 “生产 者 与 消费 
者 问题 ” 初次 接触 它 的 时 候 真 的 很 头疼 。 
“同步 ”是 指 多 个 线程 相互 协作 ， 共 同 完 成 一 个 任务 ， 属 于 线程 间 工 作 步 调 的 相互 制 
多 个 线程 “分 时 ”访问 共享 资源 。 












































约 站 6 互 斥 2 是 指 




































































































































































































































































生产 者 与 消费 者 问题 是 描述 多 个 线程 协同 工作 的 模型 ， 当 初 是 由 荷兰 人 Dijkstra 为 演示 信和 号 量 而 提出 
的 ， 信 号 量 解 决 了 协同 工作 中 的 “同步 ”和 “ 互 斥 ”。 缓冲 区 

生产 者 与 消费 者 模型 如 图 10-23 所 示 。 

下 面 结合 图 10-23 和 大 伙 儿 复习 下 这 个 经 典 模 型 。 空 数据 数据 空 ”| 空 

有 一 个 或 多 个 生产 者 、 一 个 或 多 个 消费 者 和 一 个 固定 大 小 | 1 
的 缓冲 区 ,所 有 生产 者 和 消费 者 共享 这 同一 个 缓冲 区 。 生产 者 消费 者 生产 者 
生产 某 种 类 型 的 数据 ,每 次 放 一 个 到 缓冲 区 中 , 消费 者 消费 这 消费 数据 生产 数据 
种 数据 ， 每 次 从 缓冲 区 中 消费 一 个 。 同 一 时 刻 ， 缓 冲 区 只 能 被 4 图 10-23 生产 者 与 消费 















































一 个 生产 者 或 消费 者 使 用 。 当 缓冲 区 已 满 时 ， 生 产 者 不 能 继续 往 缓冲 区 中 添加 数据 ， 当 缓冲 区 为 空 时 ， 消 
费 者 不 能 在 缓冲 区 中 消费 数据 。 

概念 介绍 完了 ,解释 得 似乎 还 是 很 抽象 ， 不 过 好 在 很 多 计算 机 中 的 设计 思路 都 来 自 于 生活 ， 咱 们 还 是 
拿 生 活 中 具体 的 例子 再 了 解 下 。 
一 群 学 生 的 故事 …… 每 当 上 午 快 下 课 的 时 候 ， 同 学 们 都 数 着 一 股 劲 , 干吗 ? 不 是 回 寝室 ， 更 不 是 下 课 
后 请 教 老 师 问 题 , 而 是 化 身 为 追 风 少 年 冲 向 食堂 。 是 啊 …… 经 过 一 上 午 繁重 的 脑力 劳动 再 加 上 正 处 于 长 身 
体 的 时 候 ， 大 伙 儿 早已 经 饥 肠 纺 转 了 ， 都 想 第 一 个 冲 到 食堂 开 吃 ， 不 想 在 打 饭 时 还 要 排队 挨 人 包 e。 

食堂 运作 流程 一 般 都 是 这 样 的 。 

。 食堂 里 的 大 师傅 负责 亮 饪 。 

e 将 做 好 的 饭菜 放 到 打 饭 窗口 里 面 的 不 锈 钢 菜 盘 里 。 窗 
有 固定 大 小 的 菜品 数 。 

。 随后 学 生 在 窗口 排队 打 饭 。 

为 方便 陈述 ， 将 打 饭 窗口 里 面 的 不 锈 钢 业 倪 简称 为 窗口 。 

随 着 时 间 推 移 ， 打 饭 的 学 生 越 来 越 多 ， 窗 口 里 的 菜 越 来 越 少 ， 大 师傅 们 又 继续 烹饪 ， 及 时 往 窗口 中 补 
菜品 。 

现在 咱们 根据 生产 者 与 消费 者 的 角色 对 号 入 座 , 大 师傅 是 食物 的 生产 者 ， 打 饭 的 窗口 相当 于 食物 的 组 
冲 区 ， 也 是 固定 大 小 ， 学 生 相 当 于 食物 的 消费 者 ， 您 看 生产 者 、 绥 冲 区 、 消 费 者 三 样 都 齐 了 ， 这 就 是 典型 
的 生产 者 与 消费 者 问题 。 

。 当 窗 口 里 少 了 某 个 菜品 时 ， 大 师 传 们 就 开始 炒 沫 亮 饪 了 ， 炒 好 了 后 就 继续 往 窗 口 里 放 ， 直 到 窗口 
中 的 每 样 菜 品 都 齐全 为 止 ， 然 后 坐 到 一 旁 休息 ， 如 果 刚 炒 完 第 一 种 业 时 就 已 经 有 人 排队 打 饭 了 ， 食 堂 工作 
人 员 就 会 喊 一 声 :“ 可 以 打 饭 了 ” 这 时 候 学 生 蜂 拥 而 至 …… 这 就 是 生产 者 的 行为 ， 当 缓冲 区 中 数据 不 满 时 
就 生产 ， 当 缓冲 区 由 空 变 不 空 时 就 唤醒 消费 者 ， 只 要 缓冲 区 已 满 时 就 去 休 眼 。 

e 只 要 窗口 中 还 有 菜 ， 不 管 菜品 是 否 齐全 ， 学 生 依然 会 在 窗口 继续 打 饭 。 直 到 窗口 中 一 点 菜 都 没有 
时 学 生 打 饭 的 活动 才 停止 ， 然 后 朝 大 师傅 大 喊 一 声 :“ 师 倩 ， 没 菜 啦 ” 随后 淡定 地 排队 ， 终 于 不 再 为 过 多 
的 选择 而 纠结 ， 这 时 候 大 师傅 不 再 休息 了 ， 继 续 襄 饪 。 这 就 是 消费 者 的 行为 ， 当 缓冲 区 中 数据 不 空 时 就 消 
费 ， 只 要 缓冲 区 为 空 时 就 会 休眠 ， 休 眠 前 会 唤醒 生产 者 。 

总 结 一 下 ， 生 产 者 与 消费 者 问题 描述 的 是 : 

对 于 有 限 大 小 的 公共 绥 冲 区 ， 如 何 同步 生产 者 与 消费 者 的 运行 ， 以 达到 对 共享 缓冲 区 的 互 斥 访问 ， 并 
且 保 证 生产 者 不 会 过 度 生 产 ， 消 费 者 不 会 过 度 消 费 ， 缓 冲 区 不 会 被 破坏 。 

对 于 这 种 缓冲 区 的 破坏 ， 要 么 是 对 缓冲 区 访问 溢出 ， 也 就 是 数据 存 取 的 地 址 超过 了 组 ; 

































































































































































































































































所 容纳 荣 盘 的 数量 也 是 有 限 的 ， 因 此 具 


















































[I 




































































































































































































































































































































































































































































































































































又 的 范围 ， 要 
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么 是 缓冲 区 中 的 数据 被 破坏 , 也 就 是 新 数据 把 尚未 读 取 的 老 数 据 履 盖 。 就 像 往 篮子 里 放水 果 和 取水 果 一 样 ， 
篮子 大 小 是 固定 的 ， 能 放 多 少 也 就 能 取 多 少 ， 不 能 装 得 过 多 ， 和 否则 水 果 就 溢出 来 了 ， 也 不 能 取 的 过 多 ， 否 
则 篮子 底 儿 就 被 掏 漏 了 , 更 不 能 因为 篮子 中 无 多 余 空 间 容 纳 新 的 水 果 , 而 把 篮子 中 原来 的 水 果 压 扁 破 坏 ( 数 
据 覆 盖 ) 占用 旧 水 果 的 空间 。 

好 啦 ,我 相信 生产 者 与 消费 者 问题 大 伙 儿 至 少 在 概念 上 已 经 清楚 了 ,我 们 接 下 来 要 做 的 就 是 去 用 代码 


实现 这 种 思想 ， 趾 们 下 节 再 叙 。 







































































































































































10.5.2 ”环形 缓冲 区 的 实现 


缓冲 区 是 多 个 线程 共同 使 用 的 共享 内 存 ， 线 程 在 并 行 访问 它 时 难免 会 乱 套 ,我 们 不 能 指望 线程 们 会 老 
老实 实 排 好 队 ， 以 串 行 的 方式 逐个 使 用 缓冲 区 。 缓 冲 区 大 小 无 关 紧 要 ， 问 题 的 关键 在 于 缓冲 区 操作 上 ， 因 
此 最 好 是 在 缓冲 区 的 操作 方法 上 下 功夫 ， 保 证 对 缓冲 区 是 互 斥 访问 ， 并 且 不 会 对 其 过 度 使 用 ， 从 而 确保 不 
会 使 缓冲 区 遭 到 破坏 。 也 就 是 说 ， 只 要 我 们 能 够 设计 出 合理 的 缓冲 区 操作 方式 ， 就 能 够 解决 生产 者 与 消费 
者 问题 。 

内 存 中 的 缓冲 区 就 是 用 来 暂 存 数据 的 一 片 内 存 区 域 , 内 存 是 按 地 址 来 访问 的 ， 因此 内 存 缓冲 区 实际 上 
是 线性 存储 。 但 是 我 们 可 以 设计 出 逻辑 上 非 线 性 的 内 存 缓冲 区 , 通过 合理 的 操作 方式 可 以 构造 出 任何 我 们 
想 要 的 数据 结构 ， 在 这 里 我 要 介绍 下 环形 缓冲 区 。 
环形 缓冲 区 本 质 上 依然 是 线性 缓冲 区 ， 但 其 使 用 方式 像 环 一 样 ， 没 有 固定 的 起 始 地 址 和 终止 地 址 ， 环 













































































































































































































































































































































































内 任何 地 址 都 可 以 作为 起 始 和 结束 ， 如 图 10-24 所 示 。 二 区 
对 于 缓冲 区 的 访问 ,我 们 提供 两 个 指针 ， 一 个 是 头 指 针 ， EEC 
用 于 往 缓冲 区 中 写 数据 ， 另 一 个 是 尾 指 针 ， 用 于 从 缓冲 区 中 ”低地 址 f 和 “高 地 址 
读数 据 。 每 次 通过 头 指针 往 缓冲 区 中 写 入 一 个 数据 后 , 使 头 指 / \ 
针 加 1 指向 缓冲 区 中 下 一 个 可 写 入 数据 的 地 址 , 每 次 通过 尾 指 
针 从 缓冲 区 中 读 取 一 个 数据 后 , 使 尾 指针 加 1 指向 缓冲 区 中 下 二 
一 个 可 读 入 数据 的 地 址 ， 也 就 是 说 , 缓冲 区 相当 于 一 个 队列 ， 
数据 在 队列 头 被 写 入 ， 在 队 尾 处 被 读 出 。 
用 线性 空间 实现 这 种 逻辑 上 的 环形 空间 , 只 要 我 们 控制 好 逻辑 上 环形 
头 指针 和 尾 指针 的 位 置 就 好 了 ， 无 论 它们 怎样 变化 ， 始 终 让 ^ 图 10-24 ”环形 缓冲 区 
它们 落 在 缓冲 区 空间 之 内 ， 当 指针 到 达 缓 冲 区 的 上 边界 后 ， 想 办 法 将 指针 置 为 缓冲 区 的 下 边界 (通常 是 对 






























































缓冲 区 大 小 取 模 )， 从 而 使 头 尾 指针 形成 回路 ， 逻 辑 上 实现 环形 缓冲 区 。 这 两 个 指针 相当 于 缓冲 区 的 游标 ， 
在 缓冲 区 空间 内 来 回 滑 动 。 

我 们 的 环形 缓冲 区 是 个 线性 队列 ， 队 列 可 以 用 线性 数据 结构 来 实现 ， 比 如 数组 和 链表 ， 为 了 简单 ， 咱 
们 用 数组 来 定义 队列 ， 实 现 环形 缓冲 区 。 

我 们 的 环形 缓冲 区 及 其 方法 定义 在 ioqueue.h 和 ioqueue.c 文件 中 ， 统 一 放 到 了 device 目录 下 ， 好 啦 ， 
上 菜 ， 见 代码 10-14。 
















































































代码 10-14 (project/c10/e/device/ioqueue.h ) 


1 #ifndef _ DEVICE IOQUEUE H 
2 #define DEVICE IOQUEUE H 
3 #include "stdint.n" 

4 #include "thread.nhn" 

5 #include "sync.h" 

6 

7 #define bufsize 64 

8 

9 /* 环形 队列 */ 


10 struct ioqueue { 
11 /7/ 生产 者 消费 者 问题 
12 Struct lock DC 











































































































































































































13 /* 生产 者 ， 缓 冲 区 不 满 时 就 继续 往 里 面 放 数 据 ， 

14 * 否则 就 睡眠 ， 此 项 记录 哪个 生产 者 在 此 缓冲 区 上 睡眠 */ 

ee) struct task struct* producer; 

16 

17 /* 消费 者 ， 缓 冲 区 不 空 时 就 继续 从 里 面 拿 数据 ， 

18 * 否则 就 睡眠 ， 此 项 记录 哪个 消费 者 在 此 缓冲 多 上 睡眠 */ 

19 strupt task struct* Consumers 

20 char buf [bufsizel]; // 缓冲 区 大 小 

21 int32 t head; // 队 首 ， 数 据 往 队 首 处 写 入 
22 int32 t tail; // 队 尾 ， 数 据 从 队 尾 处 读 出 
23 J}? 

… 略 




















struct ioqueue 结构 便 是 咱们 定义 的 环形 缓冲 区 ， 它 包括 六 个 成 员 ， 其 中 : 
lock 是 本 缓冲 区 的 锁 ， 每 次 对 缓冲 区 操作 时 都 要 先 申 请 这 个 锁 ， 从 而 保证 组 ; 
producer 是 生产 者 ， 此 项 来 记录 当 缓 冲 区 满 时 ， 在 此 缓冲 区 睡眠 的 生产 者 线程 
consumer 是 消费 者 ， 此 项 来 记录 当 绥 冲 区 空 时 ， 在 此 缓冲 区 睡眠 的 消费 者 线程 。 
buf[bufsize] 是 定义 的 缓冲 区 数组 ， 其 大 小 为 bufsize， 在 上 面 用 define 定义 为 64。 
head 是 缓冲 区 队列 的 队 首 地 址 ，tail 是 队 尾 地 址 。 

下 面 看 对 应 的 方法 ， 见 代码 10-15。 


代码 10-15 (project/c10/e/device/ioqueue.c ) 


























区 操作 互 斥 。 

















o 










































































AS 























#include "iodqueue .hn 
#include "interrupt.h" 
#include "global.h" 
#include "debug.h" 


/* 初始 化 io 队列 iog */ 

void ioqueue init(struct ioqueue* ioqg) 
lock init (giogq->lock); // 初始 化 ie 队列 的 锁 
ioq->producer = ioq->consumer = NULL; // 生产 者 和 消费 者 置 空 
ioq->head = ioq->tail = 0; // 队 列 的 首尾 指针 指向 缓冲 区 数组 第 0 个 位 









































} 














/* 返回 pos 在 缓冲 区 中 的 下 一 个 位 置 值 */ 
static int32 七 next pos(int32 t pos) { 
return (pos + 1) % bufsize; 



































PppPppPpPPPPPP 
OOOAOGONPOLOOIOUUAODP 





} 

/* 判断 队列 是 否 已 满 */ 

bool ioq full(struct ioqueue* ioq) { 
20 ASSERT (intr get status() == INTR OFF); 
21 return next pos (ioq->head) == ioq->tail; 
22 } 
23 
24 /* 判断 队列 是 否 已 空 */ 
25 static bool ioq empty(struct ioqueue* ioq) { 
26 ASSERT (intr get status() == INTR OFF); 
2:7 return ioq->head == ioq->tail; 
2.8:> 叶 
29 

















30 /* 使 当前 生产 者 或 消费 者 在 此 缓冲 区 上 等 待 */ 


31 static void ioq wait (struct task struct** waiter) { 

















32 ASSERT (*waiter == NULL && waiter != NULL) ; 
沪 芝 *waiter = running thread(); 

34 thread block (TASK BLOCKED); 

二 号 

36 


37 /* 唤醒 waiter */ 
38 static void wakeup (Struct task struct** waiter) { 


39 ASSERT (*waiter != NULL); 
40 thread unblock (*+waiter); 
41 *waiter = NULL; 

42 } 

43 





44 /* 消费 者 从 ioq 队列 中 获取 一 个 字符 */ 


45 char ioq getchar(struct ioqueue* ioq) { 





479 


作 ， 














48 /* 若 缓冲 区 ( 队列 ) 为 空 ， 把 消费 者 ioq- >consumer 记 为 当前 线程 自己 ， 


















































49 的 是 将 来 生产 者 往 缓冲 区 里 装 商 品 后 ， 生 产 者 知道 唤醒 哪个 消费 者 ， 









































50 * 也 就 是 唤醒 当前 线程 自己 */ 
51 while (ioqg _ empty(iodq)) { 

















52 lock acquire(&ioq->lock); 
人 ioq wait (&ioq->consumer); 
54 lock release(&ioq->lock); 
55 } 

56 


5 char byte 
58 ioq->tail 


= ioq->buf [iog->taill]; 
= next pos (ioq->tail); 
60 if (iogq->producer != NULL) { 

61 wakeup (&ioq->producer); 

62 } 


64 return byte; 
53 二 











67 /* 生产 者 往 ijoqg 队列 中 写 入 一 个 字符 byte */ 








// 从 缓冲 区 中 取 
// 把 读 游 标 移 到 下 一 位 置 





PE 








// 唤醒 生产 者 


68 void ioq putchar (struct Da ioq, char byte) { 
69 ASSERT (intr get status() == INTR OFF); 









































71 /* 若 缓 冲 区 ( 队列 ) 已 经 满 了 ， 把 生产 者 ijoq->producer 记 为 自己 






































费 者 知道 唤醒 哪个 生产 者 ， 









































72 * 为 的 是 当 缓冲 区 里 的 东西 被 消费 者 取 完 后 让 消 
73 * 也 就 是 唤醒 当前 线程 自己 */ 

74 while (ioq full(ioq)) { 

卫生 lock acquire(&ioq->lock); 

76 ioq wait (&ioq->producer); 

72 lock release(&ioq->lock); 

78 } 

79 iodq->buf [ioq->head] = byte; 

80 ioq->head = next pos (ioq->head); 
81 

82 if (iodq->consumer != NULL) { 

83 wakeup (&iogq->consumer); 

84 } 

BD. 

86 





























咱们 从 上 往 下 说 ，ioqueue_init 函数 接受 一 个 缓冲 区 参数 ioq， 用 于 初始 化 组 ; 
先 通过 初始 化 io 队列 的 锁 ， 再 将 生产 者 和 消费 者 置 为 NULL， 最 后 再 将 缓冲 区 的 队 头 和 队 尾 置 为 下 标 0。 
next pos 函数 接受 一 个 参数 pos， 功 能 是 返回 pos 在 组 ; 





// 把 字 节 放 入 缓冲 区 中 
// 把 写 游标 移 到 下 一 位 置 








// 唤醒 消费 者 

















区 ioq。 此 函数 负责 三 样 工 










































































区 中 的 下 一 个 位 置 值 ， 它 是 将 pos+1 后 再 对 





























bufsize 求 模 得 到 的 ， 这 保证 了 缓冲 区 指针 回 绕 Se buf， 从 而 实现 了 环形 缓冲 区 。 


原理 是 “next pos(ioq->head) == 
这 一 


ioq->head 是 否 等 于 ioq->tail， 知 头 尾 相 等 则 为 空 。 

















“thread block(TASK BLOCKED)” 将 当前 线程 阻塞 。 
wakeup 函数 接受 一 个 参数 waiter, 它 同样 也 是 pcb 类 型 的 二 级 指针 ,， 因 此 传 给 它 的 实 参 也 是 缓冲 区 ， 











ioq fll 函数 接受 一 个 缓冲 区 参数 ioq。 功 能 是 

















ioq_empty 函数 接受 一 个 缓冲 区 参数 ioq。 

















近 


了 则 返回 false。 











队列 是 否 已 满 , 知已 满 则 返回 true， 


















































ioq->tail ”， We 置 是 否 和 队 尾 位 置 相等 ， 即 是 否 会 碰撞 。 从 
点 看 出 ， 虽 然 缓冲 区 大 小 bufsize 是 64 字 节 ， 但 其 最 大 容量 为 63 字 节 。 
































功能 是 返回 队列 是 否 为 空 ， 若 空 则 返回 true。 原 理 是 判断 











ioq_wait 函数 接受 一 个 参数 waiter， 它 是 pcb 类 型 的 二 级 指针 ， 因 此 传 给 它 的 实 参 将 是 线程 指针 的 地 




















址 ， 函数 功能 是 使 当前 线程 睡眠 ， 并 在 缓冲 区 中 等 待 。 估 计 大 伙 儿 都 猜 到 了 ， 传 给 waiter 的 实 参 一 定 是 组 
区 中 的 成 员 producer 或 consumer。 在 函数 体内 就 做 了 两 件 事 ， 将 当前 线程 记录 在 waiter 指向 的 指针 中 ， 
也 就 是 缓冲 区 中 的 producer 或 consumer， 因 此 


























*waiter 相当 于 ioq->consumer 或 ioq->producer。 随 后 调用 























的 成 员 producer 或 consumer。 函 数 功 能 就 是 通 
者 )， 随 后 将 *waiter 置 空 。 
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前 过 “thread _ unblock(*waiter)” 唤 醒 *waiter (生产 者 或 消费 











咱们 对 缓冲 区 操作 的 数据 单位 大 小 是 1 








字 节 ,， 即 生产 者 每 次 往 缓 冲 区 中 放 一 字 节 数据 ,消费 者 每 次 从 











缓冲 区 中 取 一 字 贡 数据 。 








ioq_getchar 函数 接受 一 个 缓冲 区 参数 ioq， 函 数 功 能 是 从 ioq 的 队 尾 处 返回 一 个 字 节 ， 
区 中 取 数 据 ， 因 此 ioq getchar 是 由 消费 者 线程 调用 共 
函数 体 中 ， 先 通过 “while(ioq_empty(ioq))” 
可 取 ， 只 好 先 在 此 缓冲 区 上 睡眠 ， 直 到 有 生产 者 将 数据 添加 到 此 缓冲 







































































的 ， 消 费 者 有 可 能 有 多 个 ， 它 们 之 








间 是 竞争 























了 ， 因 此 在 当前 消费 者 被 叫 醒 后 还 要 再 
































while 循环 体 中 先 通 过 “lock_acquire(&ioq->lock)” 申 请 组 

















consumenD” 将 自己 阻塞 ， 也 束 是 在 此 缓冲 区 上 休眠 。 您 看 





























者 &ioq->consumer， 此 项 用 来 记录 哪个 消费 者 没有 拿 到 数 





























加 数据 的 时 候 就 知道 叫 醒 它 继续 拿 数 据 ] 
如 果 绥 冲 

















在 while 循环 判断 








取 1 字 节 的 数据 ， 接 着 通过 “ioq->tail = next pos(ioq->taiD)” 将 队 
， 缓 冲 区 就 腾 出 一 个 数据 单位 











在 消费 者 读 取 了 一 个 字 节 























循环 

















争 的 关系 ， 栈 
判断 缓冲 区 是 















































。 醒 来 后 执 












































mm 






































区 中 添加 数 和 















































PS 






































这 样 消费 者 便 知道 唤醒 
如 果 绥 冲 区 不 满 的 话 ， 通 






































ioq_putchar 函数 接受 两 个 参数 ， 
主 缓冲 区 ioq 中 添加 byte， 这 是 由 生产 者 线程 调用 的 。 
在 函数 体 中 也 是 先 通 过 while 循环 判断 绥 ; 
ioq->lock， 然 后 通过 调用 “ioq _wait(&ioq->producer)” 将 
nr 























区 不 为 空 的 话 ， 











a E 别 的 消费 者 刚 办 
较 保 险 ， 所 以 用 


10.5 “环形 输入 缓冲 区 


这 属于 从 缓 ; 











中 。 但 是 你 懂 
I 把 缓冲 区 中 的 数据 取 走 
while 循环 来 重复 判断 。 

区 的 锁 , 持 有 锁 后 , 通过 “ioq wait(&ioq-> 
里 传 给 ioq_wait 的 实 参 就 是 
居 而 休 卢 。 这 样 等 将 来 某 个 生产 者 往 缓冲 区 中 添 
\ 行 “lock_release(&ioq->lock)” 释 放 锁 。 
过 代码 “byte = ioq->buffiogq->tail] ”从 绥 ; 


























缓冲 区 的 消费 











证 









































毛 吕 





新 为 下 一 个 位 置 。 























判断 缓冲 区 ioq 是 否 为 空 ， 如 采 为 空 融 表示 没 有 数据 
区 后 再 被 叫 醒 重 关 

































































区 队 尾 获 




















空间 了 ,这 时 候 要 判断 一 下 是 否 有 生产 者 


在 此 缓冲 区 上 休眠 。 若 之 前 此 缓冲 区 是 满 的 ， 正 好 有 生产 者 来 添加 数据 
重 眠 。 因 此 要 判断 ioq->producer 是 否 不 等 于 NULL， 如 果 不 等 于 NULL， 这 说 明 Z 
函数 ioq_putchar〈 生 产 者 往 添加 组 ; 





后 ， 飞 





B 个 和 


生产 者 一 定 会 在 此 缓冲 区 上 











前 有 生产 者 线程 在 调用 






































局 的 方法 ， 后面 马上 介绍 ) 往 组 ; 











数据 时 因为 组 























区 . 











满 而 休 眼 了 ， 既 然 现在 绥 冲 区 已 被 当前 消费 者 线程 腾 晶 
冲 区 中 添加 数据 。 因 此 调用 “wakeup(&ioq->producer)” 唤 醒 生 产 者 。 之 后 通过 return byte 返回 获取 数据 。 























个 是 缓冲 区 允 








单位 的 空间 了 ， 


Er 


比 时 应 该 叫 醒 生 产 者 继续 往 绥 

















































































































ioq->consumer， 因 此 调用 “wakeup(&ioq->consumer)” 将 消费 者 唤 



































个 是 待 加 入 字 节 数据 byte， 


,阻塞 并 登 





随后 释放 锁 。 
“io0g->buf[ioq->head|] = 
随后 通过 “ioq->head = next >head)” 将 队 首 更 新 为 下 一 位 置 。 
这 里 依然 要 判断 是 否 有 消费 者 在 此 组 
会 导致 消费 者 休眠 。 现在 当前 生产 者 线程 已 经 往 缓冲 区 中 添加 了 数据 , 现在 可 以 ; 








区 上 休眠 。 若 之 前 此 缓 六 
































下 一 节 去 应 用 它 。 


10.5.3 ”添加 键盘 输入 缓冲 

















有 关 环 境 缓冲 区 的 实现 到 这 就 介 


内 


绍 完了 ,我 知道 




















据 了 。 如 果 ioq->consumer 不 等 于 NULL， 这 说 明之 前 已 经 有 消费 者 线程 因 


两 是 





HH 生 o 


首 您 已 经 迫不及待 想 








虽然 我 们 的 环形 缓冲 区 支持 多 个 生产 者 和 消费 者 ,但 目前 我 们 应 





产 者 和 单一 消费 者 的 环境 中 ， 即 生产 者 是 键盘 





















































本 节 改 动 比较 小 ， 没 喻 可 说 的 啦 ， 直 接 上 代码 。 
代码 10-16 


… 略 


38 struct iodqueue kbd buf; 


193 if* {tur char) { 


iO 


键盘 驱动 中 处 理 的 字符 存 入 环形 缓冲 区 当中 。 















































205 /* 若 kbqd buf 中 未 满 并 
































// 定义 键盘 缓冲 


待 加 入 的 cur_char 不 为 0， 





206 * 则 将 其 加 入 到 缓冲 区 kba_buf 中 */ 














区 | 





I 区 ioq 是 否 为 满 ， 如 果 满 了 的 话 ， 先 
记 在 缓冲 区 iog 的 成 员 producer : 












































PF 区 为 空 ， Wa 





























为 缓冲 区 空 而 休眠 ， 

















实际 测试 了 ， 好 啦 ，n 











请 缓冲 区 的 锁 

















byte”， 将 数据 byte 写 入 缓冲 区 的 队 首 ioq->head。 


消费 者 来 取 数 据 ， 因 此 
各 消费 者 唤醒 让 它 继续 取 数 





被 登记 在 





们 赶紧 进入 























j 的 场合 非常 
KE 动 ， 消 费 者 是 将 来 的 shell， 那 现在 您 知道 了 ， 本 市 要 将 在 


请 大 伙 儿 参见 代码 10-16。 


( project/c10/e/device/keyboard.c ) 





j 在 单一 生 


























481 


… 略 


2 


后 的 











Oo 
3 


代码 10-16 中 ， 第 38 行 定义 了 kbd_buf， 这 就 是 之 前 所 介绍 的 环 玫 
为 了 能 够 使 用 kbd buf， 在 keyboard init 函数 中 添加 了 对 其 初始 化 的 调用 


if (!ioq full(g&kbd buf)) { 
put_ char (cur char); // 临时 的 
ioq putchar (&kbd buf, cur char); 
} 
return; 


} 


/* 键盘 初始 化 */ 

void keyboard init () { 
put str("keyboard init start\n"); 
ioqueue init (&kbd buf); 
register handler (0x21, intr keyboard handler); 
put_ str("keyboard init done\n"); 
























































区 缓冲 区 ， 我 们 用 它 来 做 键盘 的 缓 六 
“ioqueue init (&kbd buf) ”。 





FP 区 。 





应 用 缓冲 区 的 地 方 是 在 键盘 驱动 中 啦 ， 在 将 扫描 码 转 换 为 字符 之 后 ， 在 第 207 行 ， 先 通过 “if 
(!ioqg_full(&kbd_buf))” 判 断 缓冲 区 是 否 已 满 ， 如 果 未 满 则 通过 “ioq_putchar(&kbd_buf, cur_char)” 将 转换 


字符 cur_char 加 入 到 缓冲 区 中 。 
不 过 在 此 之 前 ， 我 们 还 通过 “put_ char(cur_ chan ”来 打印 ， 这 是 临时 放 在 这 的 ， 为 的 是 演示 缓冲 

















































































































情况 























10.5.4 生产 者 与 消费 者 实例 测试 
本 节 中 的 代码 纯粹 为 演示 生产 者 与 消费 者 ， 和 咀 们 的 实际 I 








乡 











。 理 论 情况 是 咱们 缓冲 区 只 支持 63 个 字 节 ， 多 输入 的 字符 将 不 再 响应 ， 一 会 儿 咱们 要 验 说 
前 译 之 后 在 bochs 中 和 运行， 大伙 儿 先 看 效果 吧 ， 如 图 10-25 所 示 。 





























Bochs x86 emulaton http://bochs.sourceforge. 

















I am kernel 

init_al 

idt_init start 
idt_desc_init done 
pic_init done 

idt_init done 

em_init start 


nel_pool_bitmap_star 99A000 kernel pool_ phy_addr_ ste 
user_pool bitmap_start A1EQ user pool phy_addr_start:1 
mem_ pool_init done 





nn BBBBBBBBB 123456789 















































区 写 满 的 
E 这 个 功能 。 


大 伙 儿 注意 ， 图 10-25 最 下 面 一 行 是 我 键入 的 字符 串 ， 字 符 串 分 为 7 组 ， 前 6 组 中 ， 每 组 第 10 个 字母 为 
空格 。 第 7 组 是 字符 串 ccc， 因 此 一 共 是 63 个 字符 。 这 是 咱们 缓冲 区 的 最 大 容量 了 ， 之 后 我 再 怎么 键入 键盘 


仅仅 这 样 测试 似乎 还 意犹未尽 ， 虽 们 目前 只 有 生产 者 ， 还 没有 测试 消费 者 昵 ， 下 
足 ， 由 键盘 中 断 往 缓冲 区 里 生产 数据 ， 再 创建 一 个 新 线程 从 缓冲 区 里 消费 数据 。 


在 




















































































































be! 

















o 























屏幕 都 不 会 再 输出 字符 。 这 对 应 于 第 207 行 的 实际 代码 “并 (lioq full(&kbd buf)” 缓冲 区 满 了 ， 条件 不 成 立 ， 
因此 执行 后 面 的 return 返 




























































































































































































党 | 



































EA 


们 现实 的 应 用 中 也 不 是 键盘 上 所 有 操作 都 被 处 理 ， 当 键入 的 按键 数量 超过 缓冲 













































































程序 不 会 继续 往 此 缓冲 区 上 添加 数据 ， 因 此 后 来 的 键入 操作 会 被 丢弃 。 
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节 ， 咀 们 来 个 自给 














区 大 小 时 ， 











没关系 ， 算 是 内 核 开 发 中 的 小 插 


日 


日 

















| 。 





有 可 能 


主机 会 发 出 “ 咬 哎 ”地 提示 音 以 警告 按键 操作 过 多 。 咀 们 的 处 理 也 类 似 ， 当 缓冲 区 满 了 的 时 候 ， 键 盘 中 断 





目前 只 有 生产 者 ， 也 就 是 键盘 驱动 ， 现 在 咱们 添加 两 个 消费 者 线程 k_thread a 和 k_thread b， 让 它们 









































从 键盘 缓冲 区 中 消费 数据 。 



































为 了 测试 键盘 驱动 ， 虽 们 目前 只 打开 了 键盘 中 断 ， 为 了 让 消费 者 线程 能 够 上 处 理 器 运行 ， 现 在 必须 要 


























打开 时 钟 中 断 。 修 改 下 interruptc， 将 时 钟 中 断 和 键盘 中 断 都 打开 ， 请 见 代 码 10-17。 
代码 10-17 (project/c10/e_PandC/kernel/interrupt.c ) 


40 static void pic init (void) { 
































54 /* 测试 键盘 ， 只 打开 键盘 中 断 ， 其 他 全 部 关闭 */ 
3 outb (PIC M DATA, Oxfc); 

56 outpb (PIC S DATA, Oxff); 

站 























第 55 行 ， 通 过 “outb (PIC_M_DATA, 0xfc)”， 写 入 数值 0xfc 到 主 片 的 中 断 屏蔽 寄存 器 ，0xfe 低 2 位 


为 0， 这 两 位 对 应 的 是 时 钟 中 断 和 键 稻 中 断 ， 它 们 为 0， 表示 不 屏蔽 中 断 ， 即 打开 这 两 个 中 断 。interrupt'c 








的 修改 到 此 为 止 。 





























键盘 缓冲 区 是 全 局 数据 结构 ， 它 在 生产 者 和 消费 者 之 间 共 享 ， 因 此 在 添加 生产 者 线程 之 前 ， 还 要 在 























keyboard.h 中 添加 此 缓冲 区 的 声明 ， 这 样 外 部 函数 就 可 以 访问 到 它 ， 见 代码 10-18。 


代码 10-18 (project/c10/e_PandC/device/keyboard.h ) 
1 #ifndef DEVICE KEYBOARD H 
2 #define DEVICE KEYBOARD H 
3 void keyboard init (void); 
4 extern struct ioqueue kbd buf; 
5 #endif 























第 4 行 添 加 了 kbd_buf 的 外 部 声明 ， 在 消费 者 线程 中 会 用 到 它 。 
下 面 我 们 在 main.c 中 添加 消费 者 线程 ， 请 见 代 码 10-19。 


代码 10-19 (project/c10/e_PandC/kernel/main.c ) 

















… 略 

7 /* 临时 为 测试 添加 */ 

8 #include "iodqueue .hn 
9 #include "keyboard.h" 


11 void k thread a(voidqx) 7 
12 void k thread _b (voidqx) 7 


13 

14 int main(void) { 

45 put_str("I am kernel\n"); 

16 init all(); 

7 thread start ("consumer a", 31, k thread a, " A "); 
18 thread start ("consumer b", 31, k thread b, " B "); 
19 intr enable(); 

20 while(1); 

2.1 return 0; 

22 } 

23 





24 /* 在 线程 中 运行 的 函数 */ 
25 void k _ thread al(lvoid* arg) { 





26 while(1) { 

27 enum intr status old status = intr disable(); 
28 if (!lioq empty(&kbd buf)) { 

29 console put str(arg); 

30 char byte = ioq getchar (&kbd buf); 
号 十 console put char (byte) ; 

32 } 

3 intr set status(old status); 

34 } 

Sgret 

36 

37 /x* 在 线程 中 运行 的 函数 */ 








38 void k thread bl(void* arg) { 
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第 10 章 输入 输出 系统 
39 while(1) { 
40 enum intr status old status = intr disable(); 
41 if (!ioq empty(&kbd buf)) { 
42 console put str(arg); 
43 char byte = ioq getchar (&kbd buf); 
44 console put char (byte); 
45 } 
46 intr set status(old status); 
47 了 
48 } 

这 里 咱们 只 添加 了 两 个 消费 者 线程 : k_ thread_a 和 thread b， 这 两 个 线程 是 咱们 的 老 朋 友 了 ， 这 次 对 
它们 稍 加 修改 ， 让 它们 从 键盘 缓冲 区 中 获取 数据 ， 成 为 消费 者 线程 。 主 线程 只 用 了 while(]) 来 悬 停 ， 并 没 
有 作为 消费 者 ， 这 里 不 想 贴 太 多 元 余 代码 ， 留 待 大 伙 儿 自行 测试 吧 《〈 话 说 我 这 里 悄悄 测试 过 ， 结 果 正 党 )。 

k thread a 和 thread b 是 一 样 的 , 拿 k thread a 举例 , 在 while 循环 体 中 不 断 输出 参数 arg 和 从 键盘 
缓冲 区 中 获取 的 数据 。 不 过 在 输出 它们 之 前 ， 先 通过 intr disable 关中 断 ， 其 实 这 不 是 必须 的 ， 仅 仅 是 “迁就 ” 
函数 ioq_getchar 和 ioq putchar 中 的 “ASSERT(intr get_status() == INTR_OFF)” 咱们 对 缓冲 区 的 操作 必须 在 
关中 断 的 情况 下 进行 。 

第 17 一 18 行 也 有 了 修改 ， 通 过 thread_start 将 线程 k_thread a 封装 为 线程 ， 并 命名 为 consumer a, 将 





















































































































































































































































线程 k_thread_b 命名 为 consumer_b。 为 了 区 别 这 两 个 消费 者 , 咱们 传 给 它们 的 参数 分 别 为 “A _” 和 “B_” 
(注意 字母 前 有 个 空格 )， 让 它们 在 从 缓冲 区 中 取 数 据 前 先 各 自 输 出 自己 的 参数 ,这 样 容 易 分 清 是 谁 从 缓冲 
区 中 拿 走 了 数据 。 
编译 运行 之 后 ， 咱 们 看 看 执行 效果 ， 如 图 10-26 所 示 。 
em_init done 
thread_init start 
thread_init done 
加 | _k A_ um 加 
避 是 _k A_ EE 
i | _k A 大 a 
EE 咒 Ek A El 
IPS: 21,711M | | | | | | | | | 
4 图 10-26 生产 者 与 消费 者 实例 
在 bochs 中 执行 C 命令 持续 执行 后 ， 程 序 输出 “keyboard init done” 后 悬 停 。 这 时 候 我 在 键盘 上 按 住 
k 键 不 松手 ， 屏 幕 上 一 直 交 蔡 输 出 “B k”， 和 “A_k”， 这 符合 咱们 的 预期 ， 说 明 ioqueue 起 作用 了 。 
好 啦 ， 咱 们 又 往 前 走 了 一 大 步 ， 本 章 到 此 结束 ， 下 章 再 见 。 
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一 直 以 来 我 们 的 程序 都 在 最 














后 果 将 不 可 估量 。 





高 特权 级 0 级 下 工作 ， 这 意味 着 任 
动 任何 系统 资源 。 如 果 不 改 变 这 种 现状 的 话 ， 某 个 不 听话 的 程序 

































































操作 系统 存在 的 目的 之 一 就 是 资源 管理 ， 这 里 












































无 上 的 权力 ， 因 此 ， 被 管理 的 程序 不 能 
对 象 就 是 用 户 进程 。 
本 章 将 开始 介绍 



























































j 户 进程 及 相关 的 内 容 。 











早 在 第 5 章 中 咱们 已 经 简单 介 





绍 过 TSS 了， se 


我 们 把 用 户 程序 的 特权 级 降级 到 3 级 ， 这 样 操作 系统 才能 高 


为 什么 要 有 任务 状态 段 将 





关 的 剩 下 


“Linux 从 


位 于 TSS 中 。 现 在 咱们 接着 把 和 TSS 有 
人 老师 经 常 说 : 



















































































竺 学 习 i 
可 能 的 原因 是 。 

(1) 自己 在 这 方面 基础 薄弱 ， 该 了 
(2) 或 许 自己 只 是 某 个 知识 点 没 搞 清 楚 ， 
里 解 错 了 。 
(3) 对 方 站 在 他 自 
(4) 对 方 自己 就 
因此 ， 我 在 这 里 和 
的 兄弟 们 。 


多 任务 的 起 源 ， 很 久 很 久 以 前 


































































































A 














己 的 知识 层面 上 解释 ， 
























































大 伙 儿 说 说 TSS 和 牺 








lo eA 

我 们 
言 规则 编译 出 来 的 ， 编 译 器 也 是 程序 ， 
统 紧 密 耦 合 ， 因 此 编译 器 依赖 宿主 系统 ， 
] ， 应 用 程序 是 编译 器 的 应 | 
j 啦 。 





























































































































i 
2 
长 长 
po 














任何 软件 的 运行 都 需要 落实 到 硬件 上 ， 操 作 系统 权力 
区 别 是 : 操作 系统 是 直接 和 硬件 


只 


不 过 它 和 一 般 软 件 的 





文 撑 ， 
待遇 。 


操作 系统 能 做 什么 ， 完 全 取决 于 硬件 给 它 提供 





导 












































TSS 0 对 于 这 人 句 话 ， 如 果 最 初 就 不 明白 的 话 ， 继 给 
来 已 经 建立 的 知识 体系 ， 让 人 更 加 糊涂 。 
过 程 中 会 遇 到 很 多 类 似 的 情况 : 如 果 一 开始 就 不 懂 


因此 对 咱们 来 说 显得 
不 是 特别 明白 ， 只 是 对 此 知识 熟练 了 ， 
务 切换 的 渊源 吧 ， 和 希望 能 够 帮助 当初 和 我 一 检 


平时 工作 中 所 用 的 文档 都 是 用 某 种 应 用 程序 创建 


分 说 完 。 
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解 的 基础 知识 不 足 。 
从 而 导致 整个 知识 链 是 混乱 的 ， 但 自 


(== 








看 就 包括 安全 隔离 的 内 容 。 
有 大 高 的 特权 ， 必 须要 比 操作 系统 的 权力 低 ， 通 常 这 个 被 管理 
枕 无 忧 。 


绍 和 1O 端 











第 11 训 用 

















者 口 特权 相关 的 IO 位 图 ， 


» 


户 进 程 


可 程序 都 和 操作 系统 平起平坐 ， 可 以 改 
至 可 以 给 操作 系统 致命 一 击 ， 取 而 代 


要 想 服 众 ， 必 须 得 拥有 至 高 

















] Intel 的 做 法 ， 而 是 用 了 一 3 
eet 





后 


， 之 后 无 论 





Fos | 
人 








大 





此 认同 、 

















它 为 了 编译 出 某 操作 
“相当 于 ”其 应 
j， 编 译 器 又 是 操作 系统 的 应 




















接受 了 而 





Do 








系统 平台 



















































































的 功能 支持 。 这 就 像 驾 驶 汽车 一 样 ， 











要 看 车 本 身 提供 了 哪些 驱动 的 方法 , 比如 有 
我 们 的 操作 系统 也 只 是 众多 计算 机 硬件 的 驾驶 员 。 

















方向 盘 、; 




















打交道 的 软件 ， 


门 等 , 而 驾驶 员 也 


高 也 只 是 软件 ， 它 的 运行 


4 























么 解释 都 不 明 











的 , 应 用 程序 一 般 是 由 某 种 编译 器 按 
上 的 应 用 程序 ， 必 须 与 宿命 操作 系 
j 程 序 ， 咱 返 返 这 个 关系 : 文档 是 应 


# 对 此 感到 








太 high-level， 不 够 通 透 。 





此 位 图 


白 。 





有 的 








己 的 方法 ， 
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并 不 知道 是 哪个 知识 


照 某 种 语 





























同样 必须 由 硬 伯 





af ; 国 











的 








aes 











是 地 














WV 








如 何 驱动 这 看 





程序 的 
。 那 操作 系统 是 谁 的 应 用 ? 当然 是 硬件 的 





:来 


文 个 


j 软 件 可 没 这 



































j 这 些 引 





区 动 方法 而 已 








从 是 灵活 应 | 


车 ， 











Li 





操作 系统 最 直接 控制 的 就 是 CPU, 要 想 让 CPU 这 颗 奔腾 的 心 永远 地 跳 下 去 , 首先 必须 把 内 存 分 成 段 ， 


把 内 存 按 “ 内 














存 块 ” 访问 ， 其 次 必须 让 代码 段 寄 存 器 CS 和 指令 寄存 器 [E]IP 指向 下 一 条 待 执行 的 























是 人 家 CPU 开发 厂商 规定 的 ， 也 就 是 说 ， 要 想 让 这 果 CPU 帮 咱 们 执行 指令 ， 咱 们 就 必须 遵守 人 


























规矩 ， 否则 干 





指向 的 内 容 当 








指令 。 这 
家 厂商 的 


希 就 不 要 用 人 家 的 CPU。 因此 , 不 管 CS 和 [EJ]IP 指向 的 到 底 是 什么 人 家 CPU 就 是 把 CS:[EJIP 























有 些 冷 酪 无情， 但 又 合理 得 让 人 无 言 以 对 。 






























































成 指令 ， 咱 们 要 是 任性 地 把 它们 指向 普通 的 数据 ， 吃 苦头 的 可 是 咱们 自己 。 这 些 规矩 看 上 去 









































现在 该 说 说 TSS 的 事 了 。TSS 是 Task State Segment 的 缩写 ， 即 任务 状态 段 ， 早 在 第 5 章 介 绍 IO 特 








权 级 的 时 候 已 经 部 分 地 介绍 过 它 了 ， 瑟 了 的 话 ， 大 伙 儿 可 以 回头 看 看 第 5 章 中 的 TSS 简介 ， 划 



























































还 是 容 我 慢 慢 和 您 介绍 吧 ， 话 得 从 头 说 起 。 
我 们 知道 ， 软 件 的 能 力 取决 于 硬件 的 支持 ， 但 操作 系统 和 CPU 之 间 的 能 力 约束 并 不 是 绝对 
说 白 了 并 不 是 说 谁 单方 向 决定 了 对 方 的 能 力 ， 原因 是 : 虽说 厂商 才 是 功能 提供 者 , 但 需求 方才 是 促进 硬件 



































结构 已 经 


在 图 5-46 展示 了 。 途 今 为 止 我 们 只 介绍 了 TSS 中 的 VO 位 图 ， 它 还 有 很 多 其 他 字段 没 介 绍 呢 ， 除 了 和 了 IO 
端口 特权 相关 外 ， 它 到 底 还 用 来 做 什么 呢 ? 


单 向 的 ， 
























































发 展 的 原因 和 动力 。 咱 拿 骑 自行 车 举例 ， 骑 车 的 时 候 ， 要 想 让 自行 车 停 下 来 ， 咱 们 确实 可 以 用 脚 
开 安 全 性 不 说 ， 这 样 太 费 鞋 了 。 因 此 自行 车 制造 商 便 提供 了 手 闸 ， 想 停车 的 时 候 双手 一 捏 闸 就 行 
咱们 依然 可 以 用 “ 脚 刹 ”来 代 蔡 。 操 作 系 统 也 是 一 样 ， 它 想 实现 菏 种 功能 ， 如 果 软 件 上 的 解决 方式 不 好 ， 
























































































































































































































































刹车 ， 抛 
了 ， 不 过 


或 者 干脆 解决 不 了 ， 就 只 能 向 CPU 等 硬件 厂商 提 需 求 ， 让 硬件 一 级 直接 支持 ， 硬 件 三 商 因 此 给 硬件 增加 
新 的 功能 ， 从 而 使 硬件 得 到 了 发 展 ， 软 件 〈 操 作 系统 ) 便 可 以 利用 硬件 的 新 功能 ， 因 此 也 变 得 更 加 强大 。 






































之 后 硬件 再 去 支持 新 的 需求 , 如 此 展 性 循环 下 去 , 硬件 和 软件 逐渐 形成 规模 , 这 就 是 相互 促进 发 展 的 结果 。 





好 啦 ， 不 能 扯 太 远 了 ， 虽 们 回来 说 TSS。 
































大 伙 儿 知道 ,起 初 的 CPU 只 支持 单 任务 , 但 后 来 随 着 多 任务 的 需求 越 来 越 迫 切 ， 操 作 系统 厂商 和 CPU 三 




















商 便 开始 构想 多 任务 的 方案 了 。 不 过 ,这 次 可 不 像 让 自行 车 停 下 来 那样 简单 了 ,对 于 自行 车 我 们 还 可 
用 “ 脚 镜 ”来 实现 停车 的 功能 ,但 这 次 面临 的 困难 相当 于 开 汽 车 , 汽车 的 动能 太 大 了 ， 芍 驶 员 再 用 
卵 击 石 ， 因 此 ， 最 好 的 办 法 是 汽车 本 身 提供 个 制 动 方法 ， 也 就 是 刹车 。 

操作 系统 毕 竞 只 是 软件 , 能 做 的 事实 在 有 限 , 在 软件 层面 实现 的 多 任务 调度 有 点 类 似 今天 的 






















































































以 将 就 着 
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镜 也 是 以 














































































































j 户 态 多 线 


程 ， 效 率 不 高 且 安 全 性 上 有 诸多 问题 ， 于 是 向 CPU 厂商 提 了 这 个 需求 ， 希 望 硬 件 给 予 多 任务 的 原生 支持 。 
硬件 三 商 为 此 提供 了 硬件 解决 方案 ， 其 中 最 主要 的 就 是 LDT 和 TSS， 我 们 下 节 再 说 。 


11.1.2 LDT 简介 






























































友情 提示 ， 本 节 只 是 作为 内 容 扩展 ， 为 的 是 满足 部 分 读者 的 好 奇 心 ， 咀 们 在 项 目 中 并 不 会 用 到 LDT， 




















所 以 大 伙 儿 可 以 选择 不 看 。 不 过 话说 回来 了 ， 正 是 由 于 好 奇 心 特 别 大 ， 所 以 才 会 想 了 解 操 作 系统 的 原理 
既然 选择 了 本 书 ， 岂 有 不 看 的 道理 。 














































































































大 伙 儿 知道 , 程序 是 一 堆 数据 和 指令 的 集合 ,它们 只 有 被 加 载 到 内 存 并 让 CPU 的 寄存 器 中 指向 它们 后 ， 











在 IA32 架构 的 CPU 上 ， 内 存 被 设计 成 需要 按照 分 段 的 方式 来 访问 。 软 件 只 是 硬件 的 应 用 ， 
































CPU 才能 执行 该 程序 。 程 序 从 文件 系统 上 被 加 载 到 内 存 后 ， 位 于 内 存 中 的 程序 便 称 为 映像 ， 也 称 为 任务 。 
























































咱们 软件 工程 师 来 说 ， 咱 们 要 在 这 种 CPU 上 开发 程序 ， 内 存 分 段 访问 这 是 硬性 规定 ， 必 须 遵守 












































通常 情况 下 ， 为 了 使 程序 组 织 清晰 有 条 理 ， 程 序 员 都 会 将 数据 分 类 存储 : 数据 集中 连续 地 放 一 起 ， 





















































连续 地 放 一 起 





异常 。 比 如 把 














因此 对 于 
。 尽 管 在 
指令 集中 








。 但 这 也 只 是 出 于 审美 , 并 不 是 强制 要 求 。 咱们 只 要 按照 CPU 的 规定 ， 让 代码 段 寄 存 器 CS:[E]P 
指向 程序 映像 中 的 指令 就 行 了 ， 让 数据 段 寄存 器 DS 指向 映像 中 的 数据 就 行 了 ， 如 果 不 这 么 做 ，CPU 就 会 抛 






































CS 指向 了 映像 中 的 数据 部 分 ，CPU 不 会 检查 待 执行 的 指令 是 否 合法 ， 因 为 它 检 查 不 了 ， 原 因 












































是 CPU 中 的 指令 繁多 , 万 一 某 个 原本 作为 数据 的 二 进 制 串 “ 恰 好 ”等 于 某 个 指令 呢 。 这 里 虽然 用 了 “恰好 ”， 






























































但 其 实 这 并 不 是 少数 ， 而 是 大 部 分 情况 下 都 能 够 被 CPU 的 指令 部 件 识别 成 某 种 指令 ， 只 不 过 会 错 





























下 去 ， 直 到 无 法 执行 为 止 。 同 样 一 组 数 在 不 同 的 上 下 文中 不 同 的 意义 ， 就 像 生日 本 身 是 个 数字 ， 但 
































误 地 执行 
在 密码 输 















































入 框 中 即使 输入 的 是 生日 数字 也 只 会 被 当成 密码 。 在 计算 机 中 也 一 样 ， 同 样 一 组 二 进 制 数 在 不 同 的 
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上 下 文中 








也 有 不 同 的 意义 ， 具 体 代表 什么 ， 取 决 于 CPU 怎么 看 待 它 。CPU 只 把 CS:[E]IP 指向 的 内 存 当 成 指令 ， 把 
DS 指向 的 内 存 当 作 普通 数据 ， 因 此 必须 人 为 地 保证 填充 到 这 些 段 寄存 器 中 的 值 是 正确 的 。 虽 们 只 要 往 对 应 

























































































的 寄存 器 中 写 入 合适 的 值 就 成 了 ， 其 他 的 咱们 不 用 管 ， 由 处 理 器 内 部 的 处 理 框 架 自 动 完成 。 这 就 像 咀 们 在 软 





















































件 开发 过 程 中 


j 到 的 框架 一 样 ， 只 不 过 这 次 的 框架 是 由 硬件 CPU 提供 的 。 

















按照 内 存 分 段 的 方式 ， 内 存 中 的 程序 映像 自然 被 分 成 了 代码 段 、 数 据 段 等 资源 ， 这 些 资源 属于 程序 私 























有 的 部 分 ， 因 上 出 














b Intel 建议 ， 为 每 个 程序 单独 赋予 一 个 结构 来 存储 其 私有 的 资源 ， 这 个 结构 就 是 LDT。 

















LDT 是 Local Descriptor Table 的 缩写 ， 即 局 部 描述 符 表 。 说 到 这 您 肯定 猜 到 了 ，LDT 和 GDT 是 对 应 


的 ，GDT 是 全 
的 作用 及 属性 ， 







































































局 描述 符 表 ， 里 面 存放 的 是 用 于 全 局 的 内 存 描述 符 。 描 述 符 的 功能 就 是 描述 一 段 内 存 区 域 
它 只 是 对 应 内 存 区 域 的 身份 证 。 










































































LDT 属于 任务 私有 的 结构 ， 它 是 每 个 任务 都 有 的 ,其 位 置 自然 就 不 固定 。 为 了 使 用 它 ， 最 起 码 得 先 








够 找到 它 。 我 想 您 肯定 想到 了 ，GDT 是 全 局 唯一 的 结构 ， 它 的 位 置 是 固定 且 已 知 的 ， 它 已 经 由 LGDT 指 





















































能 
令 将 其 起 始 地 址 及 偏 移 量 存储 到 GDTR 寄存 器 中 。 因 此 ，LDT 必须 像 其 他 描述 符 那 样 在 GDT 注册 , 之 后 
便 能 够 用 选择 子 找 到 它 。 























描述 符 的 作用 是 描述 一 段 内 存 区 域 的 属性 , 其 中 最 重要 的 属性 是 内 存 区 域 的 起 始 地 址 及 偏 移 大 小 。 
述 符 表 是 位 于 内 存 中 的 表格 ， 因 此 ， 描 述 符 表 依 然 可 以 用 描述 符 来 表示 。 




























































































在 这 之 前 ， 咱 们 都 是 把 描述 符 写 入 描述 符 表 ， 如 段 描述 符 写 入 GDT 中 ， 从 来 没有 把 描述 符 表 再 写 入 其 他 表 
的 情况 。LDT 虽然 是 描述 符 “ 表 ” 为 了 在 GDT 中 注册 ， 必 须 也 得 为 它 找 个 描述 符 ， 用 此 描述 符 来 描述 
某 任务 的 LDT 的 起 始 地 址 及 偏 移 大 小 ， 此 描述 符 便 称 为 LDT 描述 符 ， 其 结构 如 图 11-1 所 示 。 






































































































































31~24 23 22 21 20 19~16 15 14~13 12 11~8 7~0 





























局 
段 基 址 G D L AVL 段 界限 S TYPE 段 基 址 32 
31~24 19~16 23~16 F 
0 | 0 0|10[ol110 位 
31~16 15~0 
低 
段 基 址 15~0 段 界 限 15~0 32 
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LDT 描 述 符 格 式 
A 图 11-1 LDT 描述 符 格 式 





























在 LDT 中 ， 描 述 符 的 D 位 和 L 位 固定 为 0。 








LDT 描述 符 属 于 系统 段 描述 符 ， 因 此 S 为 0。 在 S 为 0 的 前 提 下 ， 若 TYPE 的 值 为 0010， 这 表示 此 


















































述 符 是 LDT 描述 符 。 其 他 字段 意义 同 段 描述 符 相同 ， 不 再 装 述 。 

















现在 能 够 找到 LDT 了 ， 但 是 如 何 使 用 它 呢 ? 




















CPU 使 用 某 个 表 ， 肯 定 不 只 是 找到 一 个 描述 符 就 行 了 ， 描 述 符 的 目的 是 为 了 告诉 CPU 描述 符 所 对 应 








及 偏 移 量 大 小 ， 























区 域 的 起 始 地 址 及 偏 移 大 小 。 想 想 CPU 是 如 何 找 到 GDT 的 , 在 寄存 器 GDTR 中 的 内 容 便 是 GDT 的 起 始 地 址 




















只 要 GDT 被 Lgdt 指令 加 载 后 ，CPU 在 GDTR 中 便 能 找到 GDT。 








和 GDT 一 样 , CPU 专门 准备 了 个 寄存 器 来 存储 其 位 置 及 偏 移 量 ,想必 您 又 猜 到 了 , 对 , 这 就 是 LDTR。 
CPU 同样 也 准备 了 配套 的 指令 ， 就 是 lldt， 用 此 指令 能 够 将 ldt 加 载 到 LDTR 寄存 器 。lldt 的 指令 格式 为 : 






































lldt“16 位 通用 寄存 器 ”或 “16 位 内 存单 元 ” 





对 比 一 下 ， 


lgdt“16 位 内 存单 元 ”及 “32 位 内 存单 元 ” 














不 管 操 作 数 中 寄存 器 还 是 内 存 ， 其 值 必须 是 LDT 选择 子 。 








加 载 GDT 的 指令 是 lgdt， 其 格式 是 : 














前 16 位 表示 GDT 的 偏 移 大 小 ， 后 32 位 表示 GDT 的 起 始 地 址 。 区 别 是 ，lgdt 的 操作 数 是 GDT 表 的 偏 
移 量 及 起 始 地 址 ， 而 lldt 的 操作 数 是 ldt 在 GDT 中 的 选择 子 。 这 确实 让 人 感觉 很 乱 ， 毕 竟 LDT 和 GDT 一 
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样 都 是 描述 符 表 ， 为 了 定位 一 个 对 
操作 数 也 应 该 为 “16 位 内 存单 元 (大 小 偏 移 量 
这 是 CPU 进行 安全 检查 的 方式 ， 














引用 段 描述 符 时 的 特权 级 检查 。 

















LDTR 寄存 器 丝 11-2 所 示 。 
LDTR 分 为 两 个 ， 选 择 器 是 
子 , 描述 符 缓冲 器 中 是 是 LDT eh 











LDT 中 的 描述 符 全 部 用 于 指 














大 伙 儿 还 记得 选择 子 的 结构 吗 










































































，CPU 关心 的 是 表 的 起 始 位 置 及 偏 移 界限 〈 大 小 减 1 )， 按 理 说 lldt 的 
量 )” 信 “32 位 内 存单 元 (起 始 地 址 )”。 但 这 么 做 是 有 原因 的 ， 
用 选择 子 在 GDT 中 索引 LDT 描述 符 ， 这 样 可 以 套用 之 前 咱们 介绍 过 的 
















































































16 位 1dt 选择 子 32 位 线性 基 址 | 20 位 段 界限 | 属性 
选择 器 描述 符 冲 存 器 
4 图 11-2 LDTR 寄存 器 























H 16 位 的 LDT 选择 
局 移 大 小 等 属性 。 
9 己 的 内 存 段 ， 该 如 何 引用 它们 呢 ? 

站 16 位 的 , 其 高 13 位 是 索引 值 ， 用 来 在 GDT 或 LDT 中 索引 









































段 描述 符 ， 第 0 一 1] 位 RPL, 表示 i 
中 索引 段 描述 符 ， 还 是 在 LDT 中 索引 段 描述 符 。 
































中 检索 ， 反 之 当 此 位 为 0 时 ， 表 示 从 GDT 























第 2 位 是 TI 位 , 此 位 用 来 指定 选择 子 中 的 高 13 位 是 在 GDT 
TI 位 也 就 是 Table Indicator， 当 此 位 为 1 时 ， 表 示 从 LDT 
检索 选择 子 。 








补充 一 点 ， 当 TI 为 0 时 ，CPU 到 GDTR 中 找 GDT， 当 TI 为 1 时 ，CPU 到 LDTR 中 找 LDT。 


与 GDT 不 同 的 是 LDT 中 的 第 0 个 段 描述 各 
这 么 做 的 原因 很 简单 ， 是 担心 选择 子 未 初始 化 ， 这 种 未 初始 化 的 选择 子 其 值 为 0， 因 此 会 选择 到 GDT 中 的 第 
的 第 0 个 段 描述 符 ，CPU 便 知 道 这 是 选择 子 未 初始 化 造成 的 ， 于 是 通过 抛 异 
符 时 ， 选 择 子 的 TI 位 必须 为 1， 这 就 确保 了 只 有 经 过 显 式 地 初 
初始 化 的 情况 ， 因 此 LDT 中 的 第 0 个 段 描述 符 是 可 用 的 。 
的 13 次 方 等 于 8192， 也 就 是 说 一 个 任务 最 多 可 定义 8192 
0 | LDT 来 实现 的 话 ， 最 多 可 同时 创建 8192 个 任务 。 
9 地址， 这样 CPU 才能 从 中 拿 到 任务 运行 所 需要 的 资源 ( 指 
F 务 时 ， 需要 用 lldt 指令 重新 加 载 新 任务 的 LDT 到 LDTR。 





0 个 段 描述 符 ， 若 选择 到 GDT 中 上 
常 来 发 现 这 种 错误 。 要 是 从 LDT 中 选择 段 描述 
始 化 后 才能 从 LDT 中 检索 描述 符 ， 不 存在 忘 i 

选择 子 的 高 13 位 表示 可 索引 的 描述 符 范围 ，2 
个 内 存 段 。 由 于 LDT 描述 符 放 在 GDT 中 ， 

当前 运行 的 任务 , 其 LDT 位 于 
令 和 数据 )。 因 此 ， 每 切换 一 个 人 















































































































































的 。 想 想 看 ， 为 什么 GDT 中 第 0 个 段 描述 符 不 可 用 ? 















































































































































虽然 介绍 了 LDT， 但 咱们 3 











符 , 还 要 重新 加 载 LDTR， 比 较 麻烦 
有 关 LDT 的 部 分 就 点 到 为 止 ， 




















11.1.3 TSS 的 作用 


























] 为 每 加 入 一 个 任务 都 需要 在 GDT 中 添加 新 的 LDT 描述 
。 而 我 们 是 在 平坦 模型 下 编程 ,， 因此 任务 的 实现 已 经 用 不 着 这 么 麻烦 了 。 





















































单 核 CPU 要 想 实现 多 任务 , 唯 
务 间 轮转 ， 让 所 有 任务 轮流 使 用 


一 的 方案 就 是 多 个 任务 共享 同一 个 CPU, 也 就 是 只 能 让 CPU 在 多 个 任 
余 此 之 外 还 真 别 无 他 法 。 























3 们 下 节 继 续 说 TSS 。 
































大 家 已 经 知道 了 LDT 中 是 任务 自 i 
任务 时 ， 程 序 的 运行 资源 会 混乱 。 但 ， 这 还 不 够 。 

CPU 执行 任务 时 ， 需 要 把 任务 运行 所 需要 的 数据 
理 这 些 资 源 中 的 数据 ， 这 是 CPU 在 设计 之 初时 工程 师 们 决定 的 ,， 属于 “基因 ”里 的 内 容 ， 因 此 ,任务 ( 软 
件 ) 在 此 类 CPU 上 执行 时 ， 必 须 遵守 此 规定 。 于 是 问题 来 了 ， 任 务 的 数据 和 指令 是 CPU 的 处 理 对 象 ， 任 






































了 资源 ， 每 个 任务 都 有 自己 的 LDT， 因 此 我 们 不 需要 担心 多 
























































中 加 载 到 寄存 器 、 栈 和 内 存 中 ， 因 为 CPU 只 能 直接 处 


















































务 的 执行 要 占用 一 套 存 储 资源 ， 如 寄存 器 和 内 存 ， 这 些 存 储 资源 中 装 的 是 任务 的 数据 和 指令 ， 它 们 属于 




















CPU 的 大 和 餐 ， 但 CPU 0 不 方便 的 容器 就 餐 ， 它 最 喜欢 的 容器 是 寄存 器 ， 








因为 它 的 速度 和 CPU 很 般配 ,i 






















































































0 i CPU 





488 


状态 。 采 取 轮 流 使 用 CPU 的 方式 运行 多 外 








能 让 CPU 吃 得 更 爽 。 因 此 内 存 中 的 数据 往往 被 加 载 到 高 速 的 寄存 器 后 
处 理 ， 处 理 完成 后 ， Re 所 以 ， 任 何 时 候 ， ee 
FE 务 ， 当 前 任务 在 被 换 下 CPU 时 ,任务 的 最 新 状态 是 寄存 



































是 序 员 “ 提 供 ” 的 ， 由 CPU 来 “维护 ”%。 “提供 ”就 是 指 TSS 是 程 














器 中 的 内 呆 存 起 来 , 以 便 下 次 重新 将 此 任务 调度 到 CPU 上 时 可 以 4 忆 复 此 任务 
这 样 任务 才能 继续 执行 ， 否 则 就 出 错 了 。 

| 商 也 是 这 么 想 的 ，Intel 的 建议 是 给 每 个 任务 “关联 ”一 个 任务 状态 段 ， 这 
就 是 TSS 〈Task State Segment)， 用 它 来 表示 任务 。 

之 所 以 称 为 “关联 ” 是 因为 TSS 是 由 







































































序 员 为 任务 单独 定义 的 一 个 结构 体 变量 ,“ 维 护 ” 是 指 CPU 自动 用 此 结构 体 变 量 保存 任务 的 状态 〈 任 务 的 上 下 























文 环 境 ， 寄 存 器 组 的 值 ) 和 自动 从 此 结构 体 变 量 中 载 入 任务 的 状态 。 当 加 载 新 任务 时 ，CPU 自动 把 当前 任务 












































〈 旧 任务 ) 的 状态 存 入 当前 任务 的 TSS， 然 后 将 新 任务 TSS 中 的 数据 载 入 到 对 应 的 寄存 器 中 ， 这 就 实现 了 任务 
切换 。TSS 就 是 任务 的 代表 ，CPU 用 不 同 的 TSS 区 分 不 同 的 任务 , 因此 任务 切换 的 本 质 就 是 TSS 的 换 来 换 去 。 


CPU 如 何 知道 TSS 换 了 ? 在 此 先 




















TR 寄存 器 ， 它 始终 指向 当前 正在 运行 的 任务 


向 不 同 的 TSS， 后 面 会 介绍 这 方 男 


注意 ， 以 上 所 说 的 “在 























执行 不 同 任务 的 代码 段 中 的 指令 ， 说 和 白 








内容 。 


























剧 透 一 下 : 在 CPU 中 有 一 个 专门 存储 TSS 信息 的 寄存 器 ， 这 就 是 





























， 因 此 ,“ 在 CPU 眼 里 ”任务 切换 的 实质 就 是 TR 寄存 器 指 








CPU 眼 里 ”是 指 CPU 视角 中 任务 的 概念 ，CPU 原 计 划 为 每 个 任务 关联 一 个 
TSS， 因 此 每 个 任务 都 必须 有 单独 的 TSS， 所 以 TSS 就 是 任务 的 代表 。 而 人 类 理解 的 任务 切换 ， 就 是 让 CPU 



























































了 就 是 让 CPU 的 CS:[ejip 指向 不 同 任务 的 代码 ， 即 使 是 所 有 任务 共享 


























一 个 TSS 也 无 所 谓 ， 这 就 是 Linux 的 作法 。 好 啦 ， 这 是 后 话 ， 总 之 在 CPU 眼 里 任务 切换 就 是 TSS 换 来 换 去 ， 
而 这 只 是 CPU 的 美好 愿景 ， Linux 并 未 这 么 做 ， 我 们 也 是 。 
TSS 和 其 他 段 一 样 ， 本 质 上 是 一 片 存储 数据 的 内 存 区 域 ，Intel 打算 用 这 片 内 存 区 域 保存 任务 的 最 新 状 



























































态 〈 也 就 是 任务 运行 时 占用 的 寄存 器 组 等 ) 因此 它 也 像 其 他 段 那样 ， 需 要 用 某 个 描述 符 结构 来 “描述 ” 它 ， 









































这 就 是 TSS 描述 符 ，TSS 描述 符 也 要 在 GDT 中 注册 ， 这 样 才 能 “找到 它 ” TSS 描述 符 结构 如 图 11-3 所 示 。 
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4 图 11-3 TSS 描述 符 格式 





TSS 描述 符 属 于 系统 段 描述 符 ， 

















一 下 B 位 ，B 表示 busy 位 ，B 位 为 0 时 ， 表 





任务 繁忙 有 两 方面 的 含义 ， 一 方 








此 任务 继续 执行 , 所 以 此 任务 马 

















比如 任务 A 调用 了 任务 A.1， 任 务 A.1 又 调 
务 TSS 中 的 B 位 置 为 1， 并 且 在 新 任务 
































因此 S 为 0, 在 S 为 0 的 情况 下 ，TYPE 的 值 为 10B1。 我们 这 里 关注 























示 任 务 不 繁忙 ，B 位 为 1 时 ， 表 示 任 务 繁忙 。 


其 他 字段 的 意义 与 普通 数据 段 类 似 ， 不 再 袭 述 ， 这 里 解释 下 什么 是 任务 繁忙 。 
看 就 是 指 此 任务 是 否 为 当前 正在 CPU 上 运行 的 任务 。 另 一 方面 是 指 
此 任务 答 套 调用 了 新 的 任务 ，CPU 正在 执行 新 任务 ， 此 任务 暂时 挂 起 ， 等 新 任务 执行 完成 后 CPU 会 回 到 
上 就 会 被 调度 执行 了 。 这 种 有 髓 套 调 用 关系 的 任务 数 不 只 两 个 , 可 以 很 多 ， 




























































































了 任务 A.1.1 等 ， 为 维护 这 种 嵌 套 调用 的 关联 ，CPU 把 新 任 

















的 TSS 中 保存 了 上 一 级 旧 任务 的 TSS 指针 《还 要 把 新 任务 标志 寄存 


























器 eflags 中 NT 位 的 值 置 为 1 )， 新 老 任务 的 调用 关系 形成 了 调用 关系 链 。 这 里 是 为 了 解释 繁忙 的 意义 才 剧 透 


























了 任务 嵌 套 ， 有 关 这 方面 内 容 后 面 还 会 有 详 述 。 








当 任务 刚 被 创建 时 ， 此 
始 上 CPU 执行 时 ， 处 理 器 自 






































时 尚未 上 CPU 执行 ， 因 此 ， 此 时 的 B 位 为 0，TYPE 的 值 为 1001。 当 任务 开 
动 地 把 B 位 置 为 






































1， 此 时 TYPE 的 值 为 1011。 当 任务 被 换 下 CPU 时 ， 处 理 器 
































把 B 位 置 0。 注 意 ，B 位 是 由 CPU 来 维护 的 ， 不 需要 咱们 人 工 干 预 。 











B 位 存在 的 意义 可 不 是 
































hE 纯 为 了 表示 任务 忙 不 忙 ， 而 是 为 了 给 当前 任务 打 个 标记 ， 目 的 是 避免 当前 任 









































务 调用 自己 ,也 就 是 说 任务 是 不 可 重 入 的 。 不 可 重 入 的 意思 是 当前 任务 只 能 调用 其 他 任务 , 不 能 自己 调用 
































自己 。 原 因 是 如 果 任 务 可 以 
状态 保护 时 ， 在 同一 个 TSS 



































务 执行 完成 后 ， 为 了 能 够 回 到 旧 伯 






































自我 调用 的 话 就 混乱 了 ， 由 于 旧 任 务 和 新 任务 是 同一 个 ， 首 先 CPU 进行 任务 
中 保存 后 再 载 入 ， 这 将 导致 严重 错误 。 其 次 ， 旧 任务 在 调用 新 任务 时 ， 新 任 



























































E 务 ， 在 调 月 








新 任务 之 初 ，CPU 会 自动 把 老 任务 的 TSS 选择 子 写 入 到 新 
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任务 TSS 中 的 “上 一 个 任务 的 TSS 指针 ”字段 中 (后 面 在 任务 切换 时 会 讨论 )， 此 指针 形成 了 一 个 任务 髓 
套 调用 链 ，CPU 是 靠 此 指针 形成 的 链表 来 维护 任务 调用 链 的 。 如 果 任 务 重 入 的 话 ， 此 链 则 被 破坏 。 

为 避免 这 种 情况 的 发 生 ，CPU 利用 B 位 来 判断 被 调用 的 任务 是 否 是 当前 任务 ， 若 被 调用 任务 的 B 位 为 
1， 这 就 表示 当前 任务 自己 在 调用 自己 。 因 此 ，B 位 主要 是 用 来 给 CPU 做 重 入 判断 用 的 。 
注意 ， 并 不 是 只 有 当前 任务 的 B 位 才 为 1， 那些 被 当前 任务 通过 call 指令 舱 套 调用 的 新 任务 ， 除 了 其 
TSS 的 B 位 会 被 置 为 1 以 外 ， 老 任务 TSS 的 B 位 不 会 被 清 0， 而 是 继续 保持 为 1。 因 为 call 指令 是 “有 去 
有 回 ” 的 指令 ， 它 执行 新 任务 后 还 需要 再 回来 ， 新 任务 属于 当前 任务 〈 老 任务 ) 的 分 支 。 老 任务 由 于 未 执 
行 完 ， 相 当 于 被 自己 调用 的 新 任务 中 断 了 ， 因 此 原 任 务 TSS 中 的 B 位 依然 保持 为 1， 并 不 会 被 置 为 0。 

顺便 说 一 句 ， 髓 套 任 务 调用 的 情况 还 会 影响 eflags 寄存 器 中 的 NT 位 ， 这 表示 任务 敬 套 (Nest Tast)， 
后 面 在 介绍 任务 调度 时 会 细 说 。 

任务 是 单独 的 个 体 ， 因 此 每 个 任务 都 拥有 自己 的 TSS。 当 然 ， 这 只 是 Intel 这 么 设想 的 ， 现 代 操 作 系 
统 为 了 效率 问题 ， 一 般 并 不 这 么 做 ， 后 面 咱们 会 说 。 

TSS 描述 符 是 用 来 描述 TSS 的 ， 现 在 介绍 下 TSS。 

TSS 同 其 他 普通 段 一 样 ， 是 位 于 内 存 中 的 区 域 ， 因 此 可 以 把 TSS 理解 为 TSS 段 ， 只 不 过 TSS 中 的 数 
据 并 不 像 其 他 普通 段 那样 散乱 ，TSS 中 的 数据 是 按照 固定 格式 来 存储 的 ， 所 以 TSS 是 个 数据 结构 ， 此 结 
构 已 经 在 第 $ 章 图 5-47 中 展示 了 ， 为 方便 学 习 ， 再 次 把 该 图 贴 到 此 处 ， 如 图 11-4 所 示 。 






































































































































































































































































































































六 
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WO 位 图 在 TSS 中 的 偏 移 地 址 (保留) | 100 
(保留 ) ldt 选择 子 96 
(保留 ) gs 92 
(保留 ) fs 88 
(保留 ) ds 84 
(保留 ) ss 80 
(保留 ) CS 76 
(保留 ) es 72 

edi 68 
esi 64 
ebp 60 
esp 56 
ebx 52 
edx 48 
ecx 44 
ax 40 
eflags 36 
eip 32 
cr3(pdbr) 28 
(保留 ) | SS2 24 
esp2 20 
(保留 ) SS1 16 
esp1l 12 
(保留 ) SS0 8 
esp 0 4 
(保留) | 上 一 个 任务 的 TSS 指 针 | 0 











4 图 11-4 32 位 TSS 结构 


您 看 ，TSS 中 的 字段 基本 上 全 是 寄存 器 名 称 ， 这 些 寄存 器 就 是 任务 运行 中 的 最 新 状态 。 这 就 像 拍照 片 
一 样 ， 按 下 快门 的 一 瞬间 ， 胶 片上 记录 的 是 事物 当时 的 最 新 状态 ， 因 此 也 称 为 快照 。 可 见 TSS 的 主要 作 
用 就 是 保存 任务 的 快照 ， 也 就 是 CPU 执行 该 任务 时 ， 寄 存 器 当时 的 瞬时 值 。 

除了 一 般 的 寄存 器 外 ，TSS 中 还 有 “IO 位 图 ”和 “上 一 个 任务 的 TSS 指针” 分 别 位 于 TSS 结构 图 
的 左上 角 和 右 下 和 角 。LO 位 图 咱们 已 经 在 第 5 章 中 介绍 过 了 ,， 它 在 单个 端口 的 粒度 上 进行 IO 特权 控制 ， 那 
这 个 “上 一 个 任务 的 TSS 指针 ”是 干什么 的 呢 ? 我 知道 您 可 能 对 此 很 好 奇 ， 别 着 急 ， 现 在 还 不 到 介绍 它 
的 时 候 ， 咱 们 先 在 此 处 埋 下 伏笔 ， 到 下 一 节 中 为 您 揭晓 答案 。 

另外 要 说 的 就 是 TSS 中 有 三 组 栈 : SSO 和 esp0，SS1 和 esp1，SS2 和 esp2。 之 前 已 经 介绍 过 ， 除 了 从 
中 断 和 调用 门 返回 外 ，CPU 不 允许 从 高 特权 级 转向 低 特权 级 〈 为 了 助 记 ， 可 以 简单 理解 为 低 特 权 级 能 做 
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的 高 特权 级 也 能 做 ， 高 特权 级 不 需要 找 低 特权 级 帮忙 )。 另 外 ，CPU 在 不 同 特权 级 下 用 不 同 的 栈 ， 这 三 组 
栈 是 用 来 由 低 特 权 级 往 高 特权 级 跳 转 时 用 的 ， 最 低 的 特权 级 是 3， 没 有 更 低 的 特权 级 会 跳 入 3 特权 级 ， 
此 ，TSS 中 没有 SS3 和 esp3。 

需要 再 次 强调 的 是 这 三 组 栈 仅 仅 是 CPU 用 来 由 低 特权 级 进入 高 特权 级 时 用 的 ， 因 此 ，CPU 并 不 会 主动 在 
TSS 中 更 新 相应 特权 级 的 栈 指针 ， 不 管 进入 高 特权 级 后 进行 了 多 少 次 压 栈 操作 ， 下 次 重新 进入 该 特权 级 时 ， 该 特 
权 级 别 的 栈 指 针 依 然 是 TSS 中 最 初 的 值 ， 除 非 人 为 地 在 TSS 中 将 栈 指 针 改 写 ， 否 则 这 三 组 栈 指 针 将 一 成 不 变 。 

Linux 只 用 到 了 0 特权 级 和 3 特权 级 ， 用 户 进程 处 于 3 特权 级 ， 内 核 位 于 0 特权 级 ， 因 此 对 于 Linux 
来 说 只 需要 在 TSS 中 设置 SSO 和 esp0， 咱 们 也 效仿 它 ， 只 设置 SSO 和 esp0 的 值 就 够 了 。 

TSS 是 CPU 原生 支持 的 数据 结构 ， 因 此 CPU 能 够 直接 、 正 确 识别 其 中 的 所 有 字段 。 当 任务 被 换 下 
CPU 时 ，CPU 会 自动 将 当前 寄存 器 中 的 值 存储 到 TSS 中 的 对 应 位 置 ， 当 有 新 任务 上 CPU 运行 时 ，CPU 
会 自动 从 新 任务 的 TSS 中 找到 相应 的 寄存 器 值 加 载 到 对 应 的 寄存 器 中 。 

也 许 您 要 问 了 ， 每 个 任务 都 有 自己 的 TSS 结构 ， 而 TSS 是 个 内 存 区域 ，CPU 是 怎么 知道 它 在 哪里 的 呢 ? 

和 LDT 一 样 ,CPU 对 TSS 的 处 理 也 采取 了 类 似 的 方式 ,， 它 提供 了 一 个 寄存 器 来 存储 TSS 的 起 始 地 址 
及 偏 移 大 小 。 但 也 许 让 人 有 点 意外 ， 这 个 寄存 器 不 叫 TSSR， 而 是 称 为 TR (Task Resgister)， 也 许 是 称 为 TR， 













































































































































































































































































































































































































































































































































































其 名 称 意义 也 很 清晰 ， 而 且 更 为 简单 吧 ， 当 然 这 是 我 狂 [天 从 tsS 通 择 子 |] [32 位 线性 基 赴 20 位 段 看 限 | 属性 
的 , 至 于 具体 原因 是 什么 不 重要 , 咱们 会 用 就 行 了 。TR 寄 
存 器 的 结构 如 图 11-5 所 示 。 选择 器 描述 符 缓冲 器 
TSS 和 LDT 一 样 ， 必 须要 在 GDT 中 注册 才 行 ， 这 4 图 11-5 TR 寄 和 器 
也 是 为 了 在 引用 描述 符 的 阶段 做 安全 检查 。 因 此 TSS 是 通过 选择 子 来 访问 的 ， 将 tss 加 载 到 寄存 器 TR 的 








指令 是 ltr， 其 指令 格式 为 : 
‖ 1tz “16 位 通用 寄存 器 ”或 “16 位 内 存单 元 ” 

不 管 操 作 数 是 寄存 器 ， 还 是 内 存 ， 其 值 必须 是 描述 符 在 GDT 中 的 选择 子 。 
有 了 TSS 后 ， 任 务 在 被 换 下 CPU 时 ， 由 CPU 自动 地 把 当前 任务 的 资源 状态 〈 所 有 寄存 器 、 必 要 的 内 存 结 
构 ， 如 栈 等 ) 保存 到 该 任务 对 应 的 TSS 中 (由 寄存 器 TR 指定 )。CPU 通过 新 任务 的 TSS 选择 子 加 载 新 任务 时 ， 
会 把 该 TSS 中 的 数据 载 入 到 CPU 的 寄存 器 中 ， 同 时 用 此 TSS 描述 符 更 新 寄存 器 TR。 注 意 啦 ， 以 上 动作 是 CPU 
自动 完成 的 ， 不 需要 人 工 干预 ， 这 就 是 前 面 所 说 的 硬件 一 级 的 原生 支持 。 不 过 话 又 说 回来 了 ， 第 一 个 任务 的 TSS 
是 需要 手工 加 载 的 ， 否 则 第 一 个 任务 的 状态 该 没有 地 方 保 存 了 。 

总 结 一 下 。 

TSS 由 用 户 提供 ， 由 CPU 自动 维护 。 
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| TSS 描述 符 ， 用 它 来 描述 一 个 TSS 的 信息 ， 此 描述 符 
| 需要 定义 在 GDT 中 ,寄存 器 TR 始终 指向 当前 任务 的 
ee 高 “TSS。 任 务 切换 就 是 改变 TR 的 指向 ，CPU 自动 将 当 
ed | Oe- “GDT| 内 存 段 前 寄存 器 组 的 值 〈 快 照 ) 写 入 TR 指向 的 TSS， 同 时 
er | 将 新 任务 TSS 中 的 各 寄存 器 的 值 载 入 CPU 中 对 应 的 

GDTR | -及 仿 移 中 恨 | 一 一 一 | | 址 ”寄存 器 ， 从 而 实现 了 任务 切换 。 
CPU EE TSS 和 LDT 都 只 能 且 必 须 在 GDT 中 注册 描述 符 ， 

段 描述 符 LDT | : ”内 存 段 
| 二 四 TR 寄存 器 中 存储 的 是 TSS 的 选择 子 , LDTR 寄存 器 中 
| 内 看 训 存储 的 是 LDT 的 选择 子 ，GDTR 寄存 器 中 存储 的 是 
二 Wy GDT 的 起 始 地 址 及 界限 偏 移 ( 大 小 减 1), 下 面 把 TSS 
子 





和 LDT 的 全 景 图 给 大 伙 儿 呈 上 ， 如 图 11-6 所 示 。 
好 ， 本 节 到 此 结束 ， 下 节 咱 们 聊 聊 CPU 原生 支 




















4 图 11-6 TSS、LDT、6DT 全 景 图 


持 的 任务 切换 方式 。 
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11.1.4 CPU 原生 支持 的 任务 切换 方式 


本 节 要 介绍 的 内 容 是 CPU 厂商 原本 计划 的 一 种 任务 切换 方法 ， 并 不 是 咱们 项 目 中 任务 切换 的 方法 ， 未 
采用 的 原因 是 此 方法 效率 不 高 ， 现 代 操 作 系 统 很 少 用 这 种 方法 切换 任务 。 故 本 节 依 然 属于 知识 扩展 ， 所 以 
您 懂 的 ， 可 以 略 过 不 看 。 

进入 正题 ， 为 了 支持 多 任务 ，CPU 厂商 提供 了 LDT 及 TSS 这 两 种 原生 支持 ， 他 们 要 求 为 每 一 个 任务 分 
别 配 一 个 LDT 及 TSS( 这 由 咱们 程序 员 来 构建 )，LDT 中 保存 的 是 任务 自己 的 实体 资源 ， 也 就 是 数据 和 代码 ， 
TSS 中 保存 的 是 任务 的 上 下 文 状 态 及 三 种 特权 级 的 栈 指针 、LIO 位 图 等 信息 。 既 然 LDT 和 TSS 用 来 表示 一 个 
任务 ， 那 么 任务 切换 就 是 换 这 两 个 结构 : 将 新 任务 对 应 的 LDT 信息 加 载 到 LDTR 寄存 器 ， 对 应 的 TSS 信息 加 
载 到 TR 寄存 器 。 下 面 我 们 看 看 CPU 是 怎样 进行 任务 切换 的 。 

TSS 被 CPU 用 于 保存 任务 的 状态 及 任务 状态 的 恢复 , 而 LDT 是 任务 的 实体 资源 ，CPU 厂商 只 是 建议 
这 样 做 ， 其 实 没 有 LDT 的 话 也 是 可 以 的 。 比 如 我 们 可 以 把 任务 自己 的 段 描述 符 放 在 GDT 中 ， 或 者 干脆 采 
用 平坦 模型 直接 用 那个 4GB 大 小 的 全 局 描述 符 。 任务 的 段 放 在 GDT, 还 是 LDT 中 , 无 非 就 是 在 用 选择 子 
选择 它们 时 有 区 别 ， 区 别 您 懂 的 ， 就 是 选择 子 中 TI 位 的 取 值 ，0 是 从 GDT 中 选择 段 描述 符 ，1 是 从 LDT 
中 选择 段 描述 符 。 描 述 符 及 描述 符 表 只 是 逻辑 上 对 内 存 区 域 的 划分 〈 当 然 这 也 包括 其 他 各 种 属性 ， 但 对 此 
来 说 并 不 重要 )， 任 务 要 想 执 行 ， 归 根 结 底 都 是 用 CS:[E]ip 指向 这 个 任务 的 代码 段 内 存 区 域 以 及 DS 指向 
其 数据 段 内 存 区 域 ， 所 以 任务 私有 的 实体 资源 不 是 必须 放 在 它 自己 的 LDT 中 。 

综 上 所 述 ，LDT 是 可 有 可 无 的 ， 真 正 用 于 区 分 一 个 任务 的 标志 是 TSS， 所 以 用 于 任务 切换 的 根本 方 
法 必然 是 和 任务 的 TSS 选择 子 相 关 。 

进行 任务 切换 的 方式 有 “中 断 + 任务 门 ”“call 或 jmp+ 任 务 门 ” 和 iretd， 下 面 分 别 介 绍 。 

1. 通过 “中 断 + 任 务 门 ”进行 任务 切换 
其 实 咱们 对 采用 中 断 这 种 方式 进行 任务 切换 早已 熟悉 了 ， 目 前 的 线程 切换 中 用 的 就 是 时 钟 中 断 。 中 断 
是 定时 发 生 的 ， 因 此 用 中 断 进行 任务 切换 的 好 处 是 明显 的 。 

。 实现 简单 。 

。 抢占 式 多 任务 调度 ， 所 有 任务 都 有 运行 的 机 会 。 

大 伙 儿 回忆 一 下 ， 在 8259A 中 ， 咀 们 把 时 钟 的 中 断 向 量 号 设置 为 0x20， 因 此 在 中 断 描 述 符 表 IDT 的 
第 0x20 个 中 断 描述 符 中 注册 了 时 钟 的 中 断 处 理 程序 。 随 着 时 钟 中 断 的 定期 发 生 ， 满 足 一 定 条 件 后 ， 该 中 断 
处 理 程 序 又 调用 schedule() 进 行 线程 调度 。 
前 面 说 过 了 ， 和 任务 相关 的 是 TSS 选择 子 ， 咱 们 这 个 时 钟 中 断 的 描述 符 是 中 断 门 描述 符 ， 中 断 门 中 
存储 的 不 是 TSS 选择 子 ， 而 是 目标 中 断 处 理 例 程 的 代码 段 选择 子 及 偏 移 地 址 ， 因 此 处 理 器 并 没有 把 此 中 
断 门 描述 符 中 的 中 断 处 理 程序 当成 新 的 任务 。 

大 伙 儿 知道 ， 中 断 发 生 时 ， 处 理 器 一 定 会 通过 中 断 向 量 号 检索 IDT 中 的 描述 符 ， 所 以 ， 若 想 通 过 中 
断 的 方式 进行 任务 切换 ， 该 中 断 对 应 的 描述 符 中 必须 要 包含 TSS 选择 子 ， 唯 一 包含 TSS 选择 子 的 描述 符 
便 是 任务 门 描述 符 。 
CPU 为 原生 支持 多 任务 做 了 很 多 努力 ， 最 直接 实现 任务 切换 的 方式 是 任务 门 。 第 5 章 的 图 5-49 已 经 展 
示 了 任务 门 描 述 符 ， 为 方便 大 家 学 习 ， 这 里 再 将 其 贴 出 来 ， 如 图 11-7 所 示 。 































































































































































































































































































































































































































































































































































































































































































































































































































































































31 161514 131211 87 0 主 















































同 

未 使 用 P| DPL 7 未 使 用 32 
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4 图 11-7 任务 门 描述 符 格 式 
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您 看 ， 任 务 门 描述 符 中 的 内 容 是 TSS 选择 子 ， 任 务 门 描述 符 也 是 系统 段 ， 因 此 $ 的 值 为 0, 在 S$ 为 0 
的 情况 下 ，TYPE 的 值 为 0101 时 ， 就 表示 此 描述 符 是 任务 门 描述 符 。 
中 断 是 任何 时 候 都 会 发 生 的 ,任务 在 执行 时 都 会 被 中 断 信 号 打 断 , 在 中 断 描述 符 表 中 的 描述 符 可 以 是 
中 断 门 、 陷 阱 门 、 任 务 门 , 所 以 ， 当 前 任务 被 中 断后 ， 要 么 是 去 执行 中 断 处 理 程序 ， 要 么 是 进行 任务 切换 。 

当中 断 发 生 时 , 处 理 器 通过 中 断 向 量 号 在 IDT 中 找到 描述 符 后 , 通过 分 析 描 述 符 中 字段 S 和 字段 TYPE 
的 组 合 ， 判 断 描述 符 的 类 型 。 

若 发 现 此 中 断 对 应 的 描述 符 是 中 断 门 描述 符 ， 则 转 而 去 执行 此 中 断 门 描述 符 中 指定 的 中 断 处 理 例 程 。 
在 中 断 处 理 程序 的 最 后 ， 通 过 iretd 指令 返回 到 被 中 断 任 务 的 中 断 前 的 代码 处 。 

若 发 现 中 断 对 应 的 是 门 描述 符 ， 此 时 便 进 行 任务 切换 ， 在 进一步 讨论 之 前 ， 咱 们 有 必要 复习 一 下 。 

之 前 咱们 讨论 过 , 一 个 完整 的 任务 包括 用 户 空间 代码 及 内 核 空间 代码 , 这 两 种 代码 加 起 来 才 是 任务 的 
全 局 空间 。 另 外 ， 在 CPU 眼 里 ,一 个 TSS 就 代表 一 个 任务 ，TSS 才 是 任务 的 标志 ，CPU 区 分 任务 就 是 靠 
TSS， 因 此 ， 只 要 TR 寄存 器 中 的 TSS 信息 不 换 ， 无 论 执 行 的 是 哪里 的 指令 ， 也 无 论 指令 是 否 跨越 特权 级 
(从 用 户 态 到 内 核 态 )，CPU 都 认为 还 是 在 同一 个 任务 中 。 
咱们 平时 所 写 的 程序 代码 都 只 是 用 户 态 代码 ,对 于 完整 的 任务 来 说 它 属于 半成品 。 用 户 代 码 和 内 核 代 
码 只 是 同一 个 任务 的 不 同 部 分 而 已 。 中断 处 理 例 程 属于 内 核 代码 ， 因 此 它 也 属于 当前 的 任务 ， 当 在 中 断 处 
理 例 程 中 执行 iretd 指令 从 中 断 返 回 后 ， 是 返回 到 当前 任务 在 中 断 前 的 代码 处 ， 依 然 属于 当前 任务 ， 只 是 
返回 到 了 当前 任务 的 不 同 部 分 。 

之 前 咱们 接触 中 断 时 ， 我 们 已 了 解 iretd 指令 用 于 从 中 断 处 理 例 程 中 返回 ， 其 实 这 只 是 它 的 一 个 功能 ， 
它 一 共有 两 个 功能 。 

(1) 从 中 断 返 回 到 当前 任务 的 中 断 前 代码 处 。 

(2) 当前 任务 是 被 伦 套 调用 时 ， 它 会 调用 自己 TSS 中 “上 一 个 任务 的 TSS 指针 ”的 任务 ， 也 就 是 返 
回 到 上 一 个 任务 。 
第 2 个 功能 是 咱们 现在 关注 的 重点 : iretd 可 以 调用 一 个 任务 。 

一 个 指令 在 不 同 环境 下 有 具备 不 同 的 功能 , 有 了 时候 这 很 容易 引起 混淆 , 现在 模拟 一 下 这 个 情况 就 知道 了 ， 
当中 断 发 生 时 ， 假 设 当前 任务 A 被 中 断 ，CPU 进入 中 断后 ， 它 有 可 能 的 动作 是 : 

。 假设 是 中 断 门 或 陷阱 门 ， 执 行 完 中 断 处 理 例 程 后 是 用 iretd 指令 返回 到 任务 A 中 断 前 的 指令 部 分 。 

。 假设 是 任务 门 ， 进 行 任务 切换 ， 此 时 是 远 套 调用 任务 B， 任 务 B 在 执行 期 间 又 发 生 了 中 断 ， 进 入 
了 对 应 的 中 断 门 ， 当 执行 完 对 应 的 中 断 处 理 程序 后 ， 用 iretd 指令 返回 。 

。 同样 假设 是 任务 门 , 任务 A 调用 任务 B 执行 , 任务 B 执行 完成 后 要 通过 iretd 指令 返回 到 任务 A， 
使 任务 A 继续 完成 后 续 的 指令 。 

以 上 几 种 情况 的 最 后 都 是 执行 iretd 指令 ， 那么 ，CPU 在 执行 iretd 时 ， 是 回 到 任务 A 中 断 前 的 代码 部 
分 ， 还 是 回 到 任务 B 中 断 前 的 代码 部 分 ?” 还 是 调用 任务 A 呢 ? 必 须要 分 清楚 这 几 种 情况 ， 因 为 这 涉及 的 
底层 操作 不 同 。 

怎么 区 分 这 几 种 情况 呢 ? 

看 来 必须 在 调用 新 任务 之 初 就 给 自己 留 好 “后 路 ”， 这 时 候 标志 寄存 器 eflags 中 的 NT 位 和 TSS 中 的 
“上 一 个 任务 的 TSS 指针 ”字段 便 起 作用 了 。 

NT 位 是 eflags 中 的 第 14 位 ，1bit 的 宽度 ， 它 表示 Nest Task Flag， 任 务 嵌 套 。 任 务 骨 套 是 指 当前 任务 
是 被 前 一 个 任务 调用 后 才 执 行 的 ， 也 就 是 当前 任务 杉 套 于 另 一 个 任务 中 ， 相 当 于 男 一 个 任务 的 子 任务 , 在 
此 任务 执行 完成 后 还 要 回 到 前 一 个 任务 ， 使 其 继续 执行 。 这 一 点 类 似 于 我 们 在 函数 A 中 调用 一 个 子 函 数 
Ac， 子 函数 Ac 执行 完成 后 还 是 要 回 到 函数 A 中 。 

TSS 的 字段 “< 上 一 个 任务 的 TSS 指针 ”用 于 记录 是 哪个 任务 调用 了 当前 任务 , 有 些 类 似 于 “ 父 任务 ”， 
此 字段 中 的 值 是 TSS 的 地 址 , 因此 它 就 形成 了 任务 舱 套 关系 的 单 向 链表 , 每 个 TSS 属于 链表 中 的 结 点 , CPU 
用 此 链表 来 记录 任务 的 髓 套 调用 关系 ， 如 图 11-8 所 示 。 

当 调 用 一 个 新 任务 时 ， 处 理 器 做 了 两 件 准 备 工作 。 
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e 自动 将 新 任务 eflags 中 的 NT 位 置 为 1， 这 就 TSSA TSSA.1 TSSA.1.1 
表示 新 任务 能 够 执行 的 原因 是 被 别 的 任务 调用 , 也 就 
是 嵌 套 调用 。 
。 随后 处 理 器 将 旧 任务 的 TSS 选择 子 写 入 新 任 [ 2 
务 TSS 的 “上 一 个 任务 的 TSS 指针 ”字段 中 。 . 
一 起 回忆 一 下 ， 中 断 发 生 时 ， 处 理 器 要 把 NT 位 | 
和 TF 位 置 为 0, 如 果 对 应 的 描述 符 是 中 断 门 描述 符 ， 4 图 11-8 TSS 链表 
还 要 再 将 标志 寄存 器 eflags 中 的 正 位 清 0， 这 是 为 了 避免 中 断 舱 套 ,防止 正在 处 理 的 中 断 尚 未 完成 时 相同 

















的 中 断 源 又 发 出 中 断 信号 ， 避 免 引 发 GP 异常 

不 管 处 理 器 把 标志 寄存 器 eflags 中 的 值 修 改 成 什么 样 ， 这 都 是 任务 进入 中 断后 的 事 ， 任 务 eflags 中 原 
本 的 值 早已 经 在 进入 中 断 前 压 入 栈 保存 了 ，iretd 退出 中 断 时 这 些 值 会 被 恢复 。 
有 了 上 面 的 准备 工作 后 ， 当 CPU 执行 iretd 指令 时 ， 始 终 要 判断 NT 位 的 值 。 如 果 NT 等 于 1， 这 表 
示 是 从 新 任务 返回 到 旧 任务 ， 于 是 CPU 到 当前 任务 〈 新 任务 ) TSS 的 “上 一 个 任务 的 TSS 指针 ”字段 中 
获取 旧 任 务 的 TSS， 转 而 去 执行 旧 任务 。 如 果 NT 等 于 0， 这 表示 要 回 到 当前 任务 中 断 前 的 指令 部 分 。 

强调 一 下 ， 只 有 NT 为 1 时 ，iretd 的 功能 才 是 任务 调用 (返回 到 旧 任 务 )。 

综 上 所 述 ， 中 断 发 生 时 ， 通 过 任务 门 进行 任务 切换 的 过 程 如 下 。 

《1) 从 该 任务 门 描述 符 中 取出 任务 的 TSS 选择 子 。 

(2) 用 新 任务 的 TSS 选择 子 在 GDT 中 索引 TSS 描述 符 

(3) 判断 该 TSS 描述 符 的 P 位 是 否 为 1， 为 1 表示 该 TSS 描述 符 对 应 的 TSS 已 经 位 于 内 存 中 TSS 描 
述 符 指定 的 位 置 ， 可 以 访问 。 否 则 P 不 为 1 表示 该 TSS 描述 符 对 应 的 TSS 不 在 内 存 中 ， 这 会 导致 异常 。 

(4) 从 寄存 器 TR 中 获取 旧 任务 的 TSS 位 置 ， 保 存 旧 任务 〈 当 前 任务 ) 的 状态 到 旧 TSS 中 。 其 中 ， 
任务 状态 是 指 CPU 中 寄存 器 的 值 ， 这 仅 包 括 TSS 结构 中 列 出 的 寄存 器 : 8 个 通用 寄存 器 ，6 个 段 寄存 器 ， 
间 令 指针 eip， 栈 指针 寄存 器 esp， 页 表 寄 存 器 cr3 和 标志 寄存 器 eflags 等 。 

(5) 把 新 任务 的 TSS 中 的 值 加 载 到 相应 的 寄存 器 中 。 

(6) 使 寄存 器 TR 指向 新 任务 的 TSS。 

(7) 将 新 任务 〈 当 前 任务 ) 的 TSS 描述 符 中 的 B 位 置 1。 

(8) 将 新 任务 标志 寄存 器 中 eflags 的 NT 位 置 1。 

(9) 将 旧 任务 的 TSS 选择 子 写 入 新 任务 TSS 中 “上 一 个 任务 的 TSS 指针 ”字段 中 。 

(10) 开始 执行 新 任务 。 
在 执行 新 任务 之 前 ， 旧 任务 是 当前 的 任务 ， 因 此 旧 任务 TSS 描述 符 中 的 B 位 为 1， 在 调用 新 任务 后 
也 不 会 修改 ， 因 为 它 尚 未 执行 完 ， 属 于 嵌 套 调用 别 的 任务 ， 并 不 是 单独 的 任务 。 

当 新 任务 执行 完成 后 ， 调 用 iretd 指令 返回 到 旧 任务 ， 此 时 处 理 器 检查 NT 位 ， 若 其 值 为 1， 便 进行 返 




















































































































































































































































































































































































































































































































































































































































































































前 任务 i) 标志 寄存 器 中 eflags 的 NT 位置 0。 
F 务 TSS 描述 符 中 的 B 位 置 为 0。 
Re TR 指向 的 TSS。 

当前 任务 TSS 中 “上 一 个 任务 的 TSS 指针 ”字段 的 值 ， 将 其 加 载 到 TR 中 ， 恢 复 上 一 个 任 



























































(5) 执行 上 一 个 任务 〈 当 前 任务 )， 从 而 恢复 到 旧 任务 。 
2. call、jmp 切换 任务 

开门 见 山 : 
(1) 首先 ， 任 务 门 描述 符 除 了 可 以 在 IDT 中 注册 ， 还 可 以 在 GDT 和 LDT 中 注册 。 

(2) 其 次 ， 任 务 以 TSS 为 代表 ， 只 要 包括 TSS 选择 子 的 对 象 都 可 以 作为 任务 切换 的 操作 数 。 
因此 另 一 种 切换 任务 的 方式 是 用 call 和 jmp 指令 +TSS 选择 子 或 任务 门 选 择 子 。 
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所 以 它 和 所 有 的 门 描述 符 一 样 ， 使 用 TSS 和 牺 
CPU 只 用 选择 子 部 分 就 够 了 ， 会 忽略 
假设 任务 门 选择 子 定 义 在 GDT 中 第 2 个 描述 符 位 置 : 
| call 0x0010:0x1234 
假设 TSS 选择 子 定义 在 GDT 中 第 3 个 描述 答 
‖ call 0x0018:0x1234 
上 述 两 个 指令 中 的 偏 移 量 0x1234 都 会 被 处 理 
call 是 有 去 有 回 的 指令 ，jmp 是 一 去 不 


上 县 
里 ， 





例 》 

















TSS 中 已 经 包含 了 任务 的 详细 信息 , 人 

















































































































call 指令 以 任务 符 套 的 方式 调用 新 人 有 
















































































， 当 以 call 指令 调 





比如 “call 0x0018:0x1234” 任务 切换 














人 S$， 它们 在 调 

































































(1) CPU 忽略 偏 移 量 0x1234， 拿 选择 子 0x0018 在 GDT 中 索引 到 第 3 个 描述 符 。 










































































(2) 检查 描述 符 中 的 P 位 ， 若 P 为 0， 表 示 该 描述 符 对 应 的 段 不 存在 ， 这 将 引发 异常 。 


FP 又 包含 了 TSS 选择 子 (似乎 看 来 任务 门 很 多 余 )， 
E 务 门 作为 call 和 jmp 指令 操作 数 时 ， 操 作 数 中 包含 了 偏 移 
移 量 部 分 。 





] 新 任务 时 的 区 别 也 在 于 此 。 


新 任务 时 ， 我 们 以 操作 数 为 TSS 选择 子 为 








同时 检查 该 描 




















述 符 的 S 与 TYPE 的 值 ， 判 断 其 类 型 ， 如 果 是 TSS 描述 符 ， 检 查 该 描述 符 的 B 位 ，B 位 若 为 1 将 抛 出 GP 
异常 ， 即 表示 调用 不 可 重 入 。 

















(3) 进行 特权 级 检查 ， 数 值 上 “CPL 和 TSS 选择 子 中 的 RPL” 都 要 小 于 等 了 











则 抛 出 GP 异常 。 
(4) 特权 检查 完成 后 ， 将 当前 任务 的 状态 保存 到 寄存 器 TR 指向 的 TSS 中 。 
(5) 加 载 新 任务 TSS 选择 子 到 TR 寄存 器 的 选择 器 部 分 ， 























和 A 后 
本 /加 











盟 性 加 载 到 TR 寄存 器 中 的 描述 符 缓冲 器 中 。 

































































(6) 将 新 任务 TSS 中 的 寄存 器 数据 载 入 到 相应 的 寄存 器 中 ， 同 时 进 


则 抛 出 GP 异常 。 
(7) CPU 会 把 新 任务 的 标志 寄存 器 eflags 中 的 NT 位 置 为 1。 





旧 任 务 调 用 才 执 行 的 。 
(9) 然后 将 新 任务 TSS 描述 符 中 的 B 位 置 为 1 以 表示 从 
然 保 持 为 1，| 








(8) 将 旧 任务 TSS 选择 子 写 入 新 任务 TSS 中 的 字段 “J 









































































































































任务 的 标志 寄存 器 eflags 中 的 NT 位 的 值 保 持 不 变 ， 之 前 是 多 少 训 
(10) 开始 执行 新 任务 ， 完 成 任务 切换 。 


























E 务 忙 。 旧 任务 TSS 描述 符 : 





TSS 描述 符 的 DPL， 














同时 把 TSS 描述 符 中 的 起 始 地 址 和 偏 移 量 


苹 


























行 特 权 级 检查 ， 如 果 检 查 未 通过 ， 




















一 个 任务 的 TSS 指针 ”中 ， 这 表示 新 任务 是 被 





















































的 B 位 不 变 ， 依 


是 多 少 。 






































jmp 指令 以 非 符 套 的 方式 调用 新 任务 ， 新 人 F 务 之 间 不 会 形成 链 式 关 系 。 当 以 jmp 指令 调用 新 任务 
时 , 新 任务 TSS 描述 符 中 的 了 B 位 会 被 CPU 务 忙 ， 旧 任务 TSS 描述 符 中 的 B 位 会 被 CPU 清 0。 
当 通 过 iretd 指令 任务 返回 时 ， 新 任务 eflags 寄存 器 的 NT 位 必须 为 1， 所 以 iretd 仅 适 用 于 call。 当 调用 iretd 




















到 旧 任务 时 ，CPU 会 将 当前 任务 〈 新 人 有 











好 啦 , 以 上 介绍 的 是 CPU 原生 支持 的 任务 切换 方式 ， 



































站 也 未 采用 它们 ， 所 以 相关 内 容 就 介绍 到 这 上 

















.1.5 “现代 操作 系统 采用 的 任务 切换 方式 


TSS 是 x86 CPU 的 特定 结构 ,被 用 来 定义 “ 折 
节 中 ， 我 们 介绍 了 CPU 提供 的 多 任务 支持 ， 每 个 牺 









































， 大 伙 儿 有 兴趣 的 话 还 是 















































F 务 ”， 它 是 内 置 到 处 理 器 原生 支持 的 多 作 











F 务 拥有 自己 的 TSS， 每 个 人 














LDT， 看 样子 还 是 很 简洁 的 ， 但 为 什么 Linux 未 采用 此 方式 呢 ? 


任务 切换 的 过 程 。 您 看 ， 此 过 程 大 概 分 成 10 步 ， 这 还 是 直接 
非常 繁琐 了 ， 在 每 一 次 人 
位 ， 以 及 设置 标志 寄存 器 eflags 的 NT 位 诸多 方 国 



































首先 ， 在 上 一 节 中 ， 我 们 用 “call 0x0018:0x1234” 举 例 说 






















































































F 务 ) TSS 描述 符 中 B 位 清 0， 同 时 将 其 eflags 寄存 器 的 NT 位 清 0。 
为 效率 问题 , 现代 操作 系统 如 Linux 未 采用 此 方式 ， 
自行 查阅 介绍 Intel 的 三 卷 手册 吧 。 























EF 务 的 一 种 形式 。 
E 务 也 可 以 有 自己 的 











明了 通过 call 指令 +TSS 选择 子 的 形式 进行 








切换 方式 效 








j TSS 选择 子 进行 任务 切换 的 步骤 ， 这 已 经 
E 务 切换 过 程 中 ，CPU 除了 做 特权 级 检查 外 ， 还 要 在 TSS 的 加 载 、 保 存 、 设 置 B 
4 耗 很 多 精力 ， 这 导致 此 利 

















能 很 低 。 
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其 次 , 常见 的 指令 集 有 两 大 派系 , 复杂 指令 集 CISC 和 精简 指令 集 RISC。x86 使 用 的 指令 集 属于 CISC， 
在 此 指令 集 的 发 展 过 程 中 ， 工 程 师 为 了 让 程序 员 少 写 代 码 ， 把 指令 的 功能 做 得 越发 强大 ， 因 此 在 RISC 中 
多 条 指令 才能 完成 的 工作 ， 在 CISC 中 只 用 一 条 指令 就 完成 了 。 看 上 去 感觉 很 惕 的 样子 ， 但 这 只 是 开发 效 
率 上 的 提升 ， 执 行 效率 却 下 降 了 ， 原 因 是 : 表面 强大 的 功能 是 用 内 部 复杂 、 数 量 更 多 的 微 操 作 换 来 的 ， 也 
就 是 说 ，CISC 的 强大 需要 更 多 的 时 钟 周 期 作为 代价 。 虽 然 Intel 提供 了 call 和 jmp 指令 实现 任务 切换 ， 但 
这 两 个 指令 所 消耗 的 时 钟 周 期 也 是 可 观 的 ， 都 是 以 百 为 单位 的 〈 据 说 已 经 达到 300+， 我 没 测试 过 )。 

最 后 ， 一 个 任务 需要 单独 关联 一 个 TSS，TSS 需要 在 GDT 中 注册 ，GDT 中 最 多 支持 8192 个 描述 符 ， 
为 了 支持 更 多 的 任务 ， 随 着 任务 的 增 减 ， 要 及 时 修改 GDT， 在 其 中 增 减 TSS 描述 符 ， 修 改过 后 还 要 重新 
加 载 GDT。 这 种 频繁 修改 描述 符 表 的 操作 还 是 很 消耗 CPU 资源 的 。 

以 上 是 效率 方面 的 原因 ， 除 了 效率 以 外 ， 还 有 便携 性 和 灵活 性 等 原因 ， 不仅 Linux 未 采用 这 种 原生 的 
任务 切换 方法 ， 而 且 几 乎 所 有 x86 操作 系统 都 未 采用 。 

不 幸 的 是 ， 我 们 是 在 CPU 制定 的 规则 上 编写 程序 的 ， 因 此 始终 脱离 不 了 大 规则 的 束缚 ， 还 有 一 件 工 
作 必 须 且 只 能 用 TSS 来 完成 , 这 就 是 CPU 向 更 高 特权 级 转移 时 所 使 用 的 栈 地 址 , 需要 提前 在 TSS 中 写 入 。 

导致 转移 到 更 高 特权 级 的 一 种 情况 是 在 用 户 模 式 下 发 生 中 断 ，CPU 会 由 低 特权 级 进入 高 特权 级 ， 这 
会 发 生 堆栈 的 切换 。 当 一 个 中 断 发 生 在 用 户 模式 〈 特 权 级 3)， 处 理 器 从 当前 TSS 的 SSO 和 esp0 成 员 中 获 
取 用 于 处 理 中 断 的 堆栈 。 因 此 ， 我 们 必须 创建 一 个 TSS， 并 且 至 少 初始 化 TSS 中 的 这 些 字段 。 

尽管 CPU 提供 了 0、1、2、3 共 4 个 特权 级 ， 但 我 们 效仿 Linux 只 用 其 中 的 2 个 ， 内 核 处 理 特权 级 0， 
用 户 进程 处 于 特权 级 3。 
结论 : 我 们 使 用 TSS 唯一 的 理由 是 为 0 特权 级 的 任务 提供 栈 。 

咱们 是 效仿 Linux 的 任务 切换 方法 的 ， 那 有 必要 看 看 Linux 是 怎样 做 的 。 

硬件 是 软件 的 舞台 ， 软 件 再 强大 也 要 向 硬件 CPU 低头 ，CPU 要 求 用 TSS 这 是 硬指标 ，Linux 也 得 遵 
守 。 不 过 为 了 “应 付 ” 这 一 指标 ，Linux 为 每 个 CPU 创建 一 个 TSS， 在 各 个 CPU 上 的 所 有 任务 共享 同一 
个 TSS,， 各 CPU 的 TR 寄存 器 保存 各 CPU 上 的 TSS， 在 用 ltr 指令 加 载 TSS 后 , 该 TR 寄存 器 永远 指向 同 
一 个 TSS， 之 后 再 也 不 会 重新 加 载 TSS。 在 进程 切换 时 ， 只 需要 把 TSS 中 的 SS0 及 esp0 更 新 为 新 任务 的 
内 核 栈 的 段 地 址 及 栈 指针 。 

您 看 ， 实 际 上 Linux 对 TSS 的 操作 是 一 次 性 加 载 TSS 到 TR， 之 后 不 断 修 改 同 一 个 TSS 的 内 容 , 不 
进行 重复 加 载 操作 。 

Linux 在 TSS 中 只 初始 化 了 SS0、esp0 和 JIO 位 图 字段 ， 除 此 之 外 TSS 便 没 用 了 ， 就 是 个 空 架 子 , 不 
再 做 保存 任务 状态 之 用 。 

那 任务 的 状态 信息 保存 在 哪里 呢 ? 

是 这 样 的 ， 当 CPU 由 低 特权 级 进入 高 特权 级 时 ，CPU 会 “自动 ”从 TSS 中 获取 对 应 高 特权 级 的 栈 指 
针 (TSS 是 CPU 内 部 框架 原生 支持 的 嘛 ， 当 然 是 自动 从 中 获取 新 的 栈 指针 )。 我 们 具体 说 一 下 ，Linux 只 
用 到 了 特权 3 级 和 特权 0 级 ， 因 此 CPU 从 3 特权 级 的 用 户 态 进入 0 特权 级 的 内 核 态 时 《比如 从 用 户 进程 
进入 中 断 )，CPU 自动 从 当前 任务 的 TSS 中 获取 SS0O 和 esp0 字段 的 值 作为 0 特权 级 的 栈 ， 然 后 Linux“ 手 
动 ”执行 一 系列 的 push 指令 将 任务 的 状态 的 保存 在 0 特权 级 栈 中 ， 也 就 是 TSS 中 SSO 和 esp0 所 指向 的 栈 。 

要 知道 ， 人 家 Intel 当初 是 打算 让 TR 寄存 器 指向 不 同 任务 的 TSS 以 实现 任务 切换 的 ，Linux 这 里 只 换 
了 TSS 中 的 部 分 内 容 ， 而 TR 本 身 没 换 ， 还 是 指向 同一 个 TSS， 这 种 “自欺欺人 ”的 好 处 是 任务 切换 的 开 
销 更 小 了 ， 因 为 和 修改 TSS 中 的 内 容 所 带 来 的 开销 相 比 ， 在 TR 中 加 载 TSS 的 开销 要 大 得 多 。 您 想 ， 每 
次 切换 任务 都 要 用 ltr 指令 重新 加 载 新 任务 的 TSS 到 寄存 器 TR，TSS 是 位 于 内 存 中 的 ， 而 内 存 很 慢 的 ， 随 
着 任务 数量 一 多 ， 这 种 频繁 重复 加 载 的 开销 就 更 为 “可 观 ”。 

另外 ，Linux 中 任务 切换 不 使 用 call 和 jmp 指令 ， 这 也 避免 了 任务 切换 的 低 效 〈 想 想 在 上 一 节 中 通过 
“call+TSS 选择 子 ” 任 务 切换 的 10 个 步骤 ， 又 是 来 回 做 特权 检查 ， 又 是 更 新 TSS 中 的 B 位 及 上 一 个 任务 
TSS 的 指针 ， 还 要 设置 eflags 标志 位 ， 是 不 是 很 繁琐 )。 

综 上 所 述 ，Linux 的 任务 切换 效率 比 CPU 原生 方案 大 大 提升 ， 咱们 也 参照 Linux 的 做 法 实现 咱们 的 任 
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务 切换 。 
本 节 到 此 结束 ， 在 下 一 节 中 咱们 将 定义 TSS 并 将 其 初始 化 ， 为 实现 用 户 做 好 基础 工作 ， 好 啦 ， 兄 弟 
们 下 节 咱 们 再 叙 。 


攻 。 定义 并 初始 化 Xek 


怎么 感觉 好 久 没 写 代码 了 昵 ， 哈 哈 ， 终 于 到 了 这 一 节 ， 本 节 咱 们 准备 迈 向 用 户 进程 的 第 一 步 ， 创 建 TSS。 
该 说 的 前 面 都 已 经 说 不 少 了 ， 直 接 上 菜 ， 代码 11-1 是 我 们 本 节 在 global.h 中 增加 的 属性 ， 它 们 会 在 代 
码 11-2 中 用 到 ， 大 伙 儿 先 粗 略 过 一 下 。 


代码 11-1 (project/ci1/a/kernel/global.h ) 

























































































0 De 指 述 答 属 性 > 

7 

8 #define DESC G 4K 

9 #define DESC D 32 | 

10 #define DESC L 0 // 64 位 代码 标记 ， 此 处 标记 为 0 便 可 
11 #define DESC AVL 0 // cpu 不 用 此 位 ， 暂 置 为 0 




















12 #define DESC P 





13 #define DESC DPL 0 
14 #define DESC DPL 1 L 
15 #define DESC DPL 2 2 





16 #define DESC DPL 3 3 
了 7 /汪汪 业 炎 火炎 火炎 火炎 火炎 火炎 炎炎 次 炎炎 炊 次 次 交 次 次 次 交 次 次 次 次 次 次 次 次 次 次 次 次 次 次 类 次 次 次 类 类 类 类 类 交 炎 类 炎炎 炎炎 类 炎 炎炎 炎炎 
18 ”代码 段 和 数据 段 属于 存储 段 ，tss 和 各 种 门 描述 符 属 于 系统 段 

19 ”s 为 1 时 表示 存储 段 ， 为 0 时 表示 系统 段 


0 大 类 类 大 火炎 炎炎 类 六 大 类 大 大 火炎 大 火炎 类 类 类 六 大 类 类 大 火炎 类 大 关头 大 类 大大 类 大 大 类 类 大 大 大 大大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 了/ 




















21 #define DESC S_ CODE 1 
22 #define DESC S DATA DESC_S_CODE 
23 #define DESC_S_SYS 0 


24 #define DESC TYPE CODE 8 
// x=1, c=0,r=0,a=0 代码 段 是 可 执行 的 、 非 依从 的 、 不 可 读 的 ， 已 访问 位 a 清 0 








25 #define DESC TYPE DATA 2 
// x=0,e=0,w=1,a=0 数据 段 是 不 可 执行 的 、 向 上 扩展 的 、 可 写 的 ， 已 访问 位 a 清 0 
































26 #define DESC TYPE TSS 9 // B 位 为 0, 不 忙 

.… 上 略 

37 #define SELECTOR K CODE ((1 << 3) + (TI_GDT << 2) + RPL0O) 

38 #define SELECTOR K DATA ((2 << 3) + (TI_GDT << 2) + RPL0) 

39 #define SELECTOR K STACK SELECTOR K DATA 

40 #define SELECTOR K GS ((3 << 3) + (TI_GDT << 2) + RPLO) 
/* 第 3 个 段 描述 符 是 显存 ， 第 4 个 是 tss */ 
#define SELECTOR U CODE ((5 << 3) + (TI_GDT << 2) + RPL3) 
#define SELECTOR U DATA ((6 << 3) + (TI_GDT << 2) + RPL3) 








#define GDT ATTR HIGH bb 


41 
42 
43 
44 #define SELECTOR U STACK SELECTOR U_DATA 
45 
46 
((DESC G 4K << 7) + (DESC D 32 << 6) + (DESC L << 5) + (DESC AVL << 4)) 





47 #define GDT CODE ATTR LOW DPL3 \ 
((BDESC PB. < 7) TF 

(DESC DPL 3 << 5) + \ 

(DESC S CODE << 4) + 

DESC_TYPE CODE) 

48 #define GDT DATA ATTR LOW DPL3 \ 
((DESC P << 7) + \ 

(DESC DPL 3 << 5) + \ 

(DESC S DATA << 4) + 

DESC_TYPE DATA) 








49 

50 

ee TS8 措 述 符 属性 ~~== 一 -= 
52 #define TSS DESC D 0 

53 


54 #define TSS ATTR HIGH \ 
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((DESC G 4K << 7) + \ 
(TSS DESC D << 6) + \ 
(DESC L << 5) + \ 

(DESC AVL << 4) + 0x0) 


55 #define TSS ATTR LOW \ 
((DESC P << 7) + \ 
(DESC DPL 0 << 5) +\ 

(DESC _S_SYS << 4) + \ 
DESC_TYPE TSS) 


56 #define SELECTOR TSS ((4 << 3) + (TI_GDT << 2 ) + RPLO) 


58 /* 定义 GDT 中 描述 符 的 结构 */ 
59 struct gdt desc { 





60 uint16 t limit low word; 

61 uint16 t base low word; 

62 uint8 t base mid byte; 

63 uint8 七 attr low byte; 

64 uint8 t limit high attr high; 
65 uint8 t base high pyte; 

66 }; 












































好 啦 ， 匆 匆 略 过 后 ， 咱 们 要 看 看 今天 的 主题 一 tss.c， 我 们 新 建 一 个 目录 userprog， 今 后 有 关 用 户 进 
程 的 代码 文件 都 将 存放 在 此 目录 中 。 下 面 请 看 代码 11-2。 


代码 11-2 (project/c11/a/userprog/tss.c ) 





IT 




















略 
7 /* 任务 状态 段 tss 结构 */ 
8 struct tss { 








9 Unta32 七 ack1LInK7 
41 必 uint32 t* esp0; 
十 主 uint32 七 ss0; 
12 uint32 t* espl; 
13 Tint tt SSL; 
14 uint32 t* esp2; 
15 Uint32 tC SS27 
16 nt Cr 
学 uint32 七 (*eip) (void) ; 
18 uint32 七 eflags; 
.9 uint32 t eax; 
20 uint32 t ecx; 
2 于 uint32 t edx; 
22 uint32 t ebx; 
23 uint32 t esp; 
24 uint32 七 ebp; 
25 Linta2 tress 
26 uint32 七 edi; 
2 uint32 t es; 
28 aint32 tt Cay 
29 Tint32. 二 > 
30 uint32 七 ds; 
31 Uint32 Tt fos 
32 忆 二 E32: 江 33 
Ce: nlnt32 tt Ldt; 
34 uint32 t trace; 
35 uint32 七 io base; 
3.6° -3 
37 Static Struct tss tsss 
38 








39 /* 更 新 tss 中 esp0 字段 的 值 为 pthread 的 0 级 线 */ 

40 void update tss espl(struct task struct* pthread) { 
41 tss.esp0 = (uint32 t*) ((uint32 t)pthread + PG SIZE); 
42 } 

43 

44 /* 创建 gqt 描述 符 */ 

45 static struct gqt desc make gdt qdqesc(\ 

uint32 tx desc addr, \ 

uint32 七 limit, AN 

uint8 t attr low, \ 

Uinte tt attr nigh) 疼 
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46 uint32 t desc base = (uint32 t)desc addr; 
47 struct gdt desc desc; 
48 desc.limit low word = limit & 0x0000ffff，; 
49 desc.base low word = desc base & Ox0000ffff; 
50 desc.base mid byte = ((desc base & 0x00ff0000) >> 16); 
S| desc.attr low byte = (uint8 七 ) (attr low); 
52 desc.limit high attr high = \ 
(((Limit & 0x000f0000) >> 16) + (uint8 七 ) (attr high)); 
53 desc.base high byte = desc base >> 24; 
54 return desc; 
S53 村 
56 





























57 /* 在 gqt 中 创建 tss 并 重新 加 载 gqt */ 
58 void tss init() { 

















59 Put str ("tses -init start\n"); 

60 uint32 t tss size = sizeof (tss);} 

61 memset (&tss, 0, tss size); 

62 tss.ss0 = SELECTOR K STACK; 

63 tss.io base = tss size; 

64 

65 /* gdt 段 基 址 为 0x900， 把 tss 放 到 第 4 个 位 置 ， 也 就 是 0x900+0x20 的 位 置 */ 
66 


67 /* 在 gqt 中 添加 dpl 为 0 的 TSss 描述 符 */ 

68 *((struct gdt qdqescx)0xc0000920) = make gqt _ qdqesc(\ 
(uint32 t*)&tss, \ 
tss size - 1, \ 
TSS_ATTR LOW, 








TSS _ ATTR HIGH\ 
); 


70  /* 在 gqt 中 添加 gdpl 为 3 的 数据 段 和 代码 段 描述 符 */ 

71 *((struct gqt desc*) 0xc0000928) = make gdt desc(\ 
(uint32 t*)0,\ 
Oxfffff, \ 
GDT_ CODE ATTR LOW DPL3, \ 








GDT_ATTR HIGH\ 
); 


72 *((struct gdt desc*)0xc0000930) = make gdt desc(\ 
(uint32. tC*)0rN 
Oxfffff, \ 
GDT_DATA ATTR LOW DPL3, \ 
GDT ATTR HIGH\ 
); 





3 
74 /* gqt 16 位 的 1imit 32 位 的 段 基 址 */ 
75 uint64 t gdt operand = \ 
((8 * 7 一 1) | ((uint64 t) (uint32 t)0xc0000900 << 16)); // 7 个 描述 符 大 小 
76 asm volatile ("lgdt %0" : : "m" (gdt operand)); 
汪汪 asm volatile ("ltr S%Sw0O" : : "r" (SELECTOR TSS) ) ; 
78 put_str("tss_init anq ltr done\n"); 
水 3 











在 tss.c 的 开头 第 8 一 36 行 定义 了 TSS 的 结构 体 struct tss， 这 是 按照 前 面 所 介绍 的 TSS 结构 来 定义 的 ， 
还 记得 之 前 说 过 的 吗 ? TSS 是 程序 员 提 供 ， 由 CPU 来 维护 的 ， 咱 们 定义 好 后 ， 在 第 37 行 实例 化 一 个 tss， 
一 会 儿 就 将 此 实例 交 给 CPU。 

第 40 行 定 义 的 函数 update_tss_esp 用 来 更 新 TSS 中 的 esp0， 这 是 学 习 Linux 任务 切换 的 方式 ， 只 修改 
TSS 中 的 特权 级 0 对 应 的 栈 。 此 函数 将 TSS 中 esp0 修改 为 参数 pthread 的 0 级 栈 地 址 ， 也 就 是 线程 pthread 
的 PCB 所 在 页 的 最 顶端 一 一 (uint32_t)pthread + PG_SIZE。 此 栈 地 址 是 用 户 进程 由 用 户 态 进入 内 核 态 时 所 
用 的 栈 ， 这 和 之 前 咱们 的 内 核 线 程 地 址 是 一 样 的 ， 也 许 您 猜 到 了 ，,， 用户 进程 进入 内 核 态 后 ， 除 了 拥有 单独 
的 地 址 空间 外 ， 其 他 方面 和 内 核 线程 是 一 样 的 。 这 一 点 在 进一步 实现 用 户 进程 时 会 更 有 体会 。 
我 们 的 GDT 是 在 loader.S 中 进入 保护 模式 时 实现 的 ， 那 时 候 我 们 还 是 以 小 米 加 步枪 的 方式 ， 用 汇编 
语言 直接 生成 的 GDT。 进入 内 核 后 , 我 们 已 经 用 C 语言 编程 了 , 现在 我 们 还 需要 GDT 中 增加 新 的 描述 符 ， 
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因此 在 第 45 行 创 建 了 函数 make_gdt_desc， 专 门生 成 描述 符 结构 ， 注 意 此 函数 并 不 是 直接 在 GDT 中 安装 
好 描述 符 ， 只 是 返回 生成 的 描述 符 。 此 函数 的 实现 是 按照 段 描述 符 的 格式 来 拼 数 据 ,， 在 内 部 生成 一 局 部 描 
述 符 结构 体 变量 struct gdt_desc desc， 后 面 把 此 结构 体 变 量 中 的 属性 填充 好 后 通过 return 返回 其 值 。 

第 58 行 是 函数 tss_init， 此 函数 除了 用 来 初始 化 tss 并 将 其 安装 到 GDT 中 外 ， 还 另外 在 GDT 中 安装 
两 个 供用 户 进程 使 用 的 描述 符 ， 一 个 是 DPL 为 3 的 数据 段 ， 另 一 个 是 DPL 为 3 的 代码 段 。 
第 61 行将 全 局 变量 tss 清 0 后 ,在 第 62 行为 其 ss0 字段 赋 0 级 栈 段 的 选择 子 SELECTOR_、K_STACK。 
第 63 行 代 码 “tss.io_base =tss_size” 将 tss 的 io_base 字段 置 为 tss 的 大 小 tss_size， 这 表示 此 TSS : 
并 没有 IO 位 图 。 有 关 IO 位 图 的 内 容 咱 们 已 经 在 第 5 章 的 IO 特权 级 中 介绍 过 了 ， 当 IO 位 图 的 偏 移 地 址 
大 于 等 于 TSS 大 小 减 1 时， 就 表示 没有 IO 位 图 。 
在 第 68 行 ， 我 们 在 GDT 中 安装 TSS 描述 符 。 在 调用 make_gdt_desc 后 ， 其 返回 的 描述 符 是 安装 在 
0xc0000920 的 地 址 ， 即 *((struct gdt_desc*)0xc0000920)， 其 实 此 处 用 0x920 也 是 可 以 的 ， 还 记得 吗 ? 我 们 
把 低 端 1MB 空间 的 页 表 映 射 为 同 物理 地 址 相同 , 并 且 把 内 核 开始 使 用 的 第 768 个 页 表 指 向 了 同 低 端 IMB 
空间 相同 的 物理 页 ， 因 此 此 时 的 0xc0000920 可 以 用 0x920 代 蔡 。 

为 什么 把 TSS 描述 符 放 在 0xc0000920 的 地 址 呢 ? 

复习 一 下 ，32 位 保护 模式 下 的 描述 符 大 小 都 是 8 字 节 ,在 GDT 中 第 0 个 段 描述 符 不 可 用 ， 第 1 个 为 代码 
段 ， 第 2 个 为 数据 段 和 栈 ， 第 3 个 为 显存 段 ， 因 此 把 tss 放 到 第 4 个 位 置 ， 也 就 是 0xc0000900+0x20 的 位 置 。 

接 下 来 在 第 71 行 和 第 72 行 安装 了 两 个 DPL 为 3 的 段 描述 符 ， 分 别 是 代码 段 和 数据 段 ， 这 是 为 用 户 
进程 提前 做 的 准备 ， 它 们 在 GDT 中 的 位 置 基于 TSS 描述 符 顺延 ， 分 别 是 偏 移 GDTOx28 和 0x30 的 位 置 。 

万 事 俱 备 之 后 ， 由 于 已 经 变更 了 GDT， 故 需要 用 lgdt 指令 重新 加 载 GDT。 
在 第 75 行 , 定义 了 变量 gdt_operand 作为 lgdt 指令 的 操作 数 。 回 想 一 下 lgdt 的 指令 格式 ， 其 操作 数 是 
“16 位 表 界 限 &32 位 表 的 起 始 地址 ” 这 里 要 求 表 界 限 要 放 在 前 面 ， 也 就 是 操作 数 中 前 2 字 节 的 低地 址 处 。 
到 目前 为 止 ， 在 原 有 描述 符 的 基础 上 我 们 又 新 增 了 3 个 描述 符 ， 加 上 第 0 个 不 可 用 的 哑 描 述 符 ，GDT 中 
现在 一 共 是 7 个 描述 符 ， 因 此 表 界 限 值 为 8* 7 - 1。 操 作 数 中 的 高 32 位 是 GDT 起 始 地 址 ， 在 这 里 我 们 把 
GDT 线性 地 址 0xc0000900 先 转换 成 uint32_t 后 , 再 将 其 转换 成 uint64_t 位 〈 不 可 一 步 到 位 转 为 uint64_t)， 
最 后 通过 按 位 或 运算 符 | 拼 合 在 一 起 。 
通过 内 联 汇编 ， 第 76 行将 新 的 GDT 慎 
已 经 生效 ， 本 节目 标 已 经 完成 。 

将 tss_init 加 入 init_all 后 ， 编 译 运 行 ， 结 果 如 图 11-9 所 示 。 



























































































































































































































































































































































































































































































































































































































































































































































































































































































































































IN 


RT 





新 加 载 ， 第 77 行将 tss 加 载 到 TR。 至 此 ， 新 的 GDT 和 TSS 









































00 kernel_ pool_phy_addr start :200000 
USer_pool_phu_addr_start:11600009 


tart 


nit done 
start 
ss_init and ltr done 





CTRL + 3rd button enables mouse | | 区 
4 图 11-9 tss 加 载 成 功 

之 前 说 过 ，tss 是 交 给 CPU 来 维护 的 ， 在 tss 加 载 成 功 后 ， 我 们 看 下 CPU 对 tss 都 “做 了 些 什 么 ” 如 
图 11-10 所 示 。 
您 看 , 在 GDT 中 第 4 个 描述 符 是 刚 安装 的 TSS， 其 显示 为 32-BitTSS (Busy)， 这 说 明 TSS 的 B 被 CPU 
置 为 1 了，TSS 已 经 生效 。 
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work@localhost:~/my_workspace/bochs 


] using log file bochs.out 


at t=0 
(9) [9x9090o0fffffff9] f000:fff9 (unk. ctxt): jmp far f000:e05b 
f9 


<bochs :1> c 

^CNext at t=108222702 

(9) [0x90000006151f] 9008:c900151f (unk. ctxt): jmp .-2 (OQxc000151f) 

<bochs:2> info gdt 

Global Descriptor Table (base=Qxc0000900, limit=55): 

GDT[Ox00]=??? descriptor hi=Qx00000000, lo=0x00000000 

GDT[Ox01]=Code segment, base=Qx00000000, limit=Qxffffffff, Execute-Only, Non-Con 
forming, Accessed, 32-bit 
[| 
GDT[Ox03]=Data segment, base=Qxc00b8000, limit=0x0Q0007fff, Read/Write, Accessed 
GDT[Ox04]=32-Bit TSS (Busy) at Oxc0005320, length Ox0006b 

GDT[Ox05]=Code segment, base=Qx00000000, limit=Qxffffffff, Execute-Only, Non-Con 
forming，32-bit 

GDT[OQx06]=Data segment, base=0Qx00000000, limit=Qxffffffff, Read/Write 

You can List individual entries with 'info gdt [NUM]' or groups with 'info gdt [ 目 
NUM] [NUM]' 

<bochs:3> < 

^CNext at t=143881290 

(9) [OQx00000000151f] 699008:c990151f (unk. ctxt): jmp .-2 (9xc990151f) 

<bochs:4> | 

















4 图 11-10 TSS busy 


好 啦 ， 本 节 为 下 一 步 实现 用 户 进 程 打 下 了 基础 ， 下 一 节 中 我 们 尝试 实现 用 户 进程 。 


实现 用 户 进程 


在 很 久 以 前 我 们 已 经 实现 了 内 核 线程 ,本 节 我 们 将 在 线程 的 基础 上 实现 进程 ,因此 额外 的 工作 量 并 不 
大 。 通 过 本 节 的 介绍 ， 您 将 会 对 进程 的 本 质 有 所 了 解 。 
为 了 实现 进程 ， 我 们 还 要 提前 准备 一 些 功 能 ， 下 面 先 在 局 部 上 入 手 ， 最 后 再 给 大 家 从 整体 上 梳理 。 
局 部 讲解 虽然 使 大 家 不 易 掌握 整个 来 龙 去 脉 , 但 这 是 了 解 细 节 必 然 的 过 程 ， 除 非 您 只 想 了 解 个 框架 , 但 
这 并 不 是 本 书 的 初 袁 。 因 此 ， 在 下 面 的 局 部 功能 介绍 时 ， 如 果 您 感到 迷茫 ， 先 不 要 急 ， 等 到 我 介绍 完整 个 
用 户 进程 的 部 分 ， 您 会 在 整体 上 贯穿 整个 过 程 ， 到 时 候 自 然 能 在 全 局 上 
一 目 了 然 。 
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thread_start(...,function,...) 

















11.3.1 实现 用 户 进程 的 原理 


我 们 的 目标 是 在 现 有 线程 的 基础 上 实现 进程 ， 先 回忆 下 ， 我 们 创建 
线程 是 通过 thread_start 进行 的 ， 其 内 部 实现 的 流程 如 图 11-11 所 示 。 

在 thread_start〔...,function,...〉 的 调用 中 ，function 是 我 们 最 终 在 
线程 中 执行 的 函数 。 在 thread_start 内 部 ， 先 是 通过 get_kernel_pages(1) 
在 内 核 内 存 池 中 获取 1 个 物理 页 做 线程 的 pcb， 即 thread， 接 着 调 


| thread = get_kernel_pages(1) | 




































































v 
| init_thread(thread,...) | 
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init_thread 初始 化 该 线程 pcb 中 的 信息 , 然后 再 用 thread_create 创建 线 ee 
程 运行 的 栈 , 实际 上 是 将 栈 中 的 返回 地 址 指向 了 kernel_thread 函数 ， 
此 相当 于 调用 了 kernel_thread， 在 kernel_thread 中 通过 调用 function 的 v 
方式 使 funetion 得 到 执行 和 kernel_ thread 
经 过 以 上 的 分 析 ， 如 果 要 基于 线程 实现 进程 ， 我 们 把 function 蔡 换 







































































为 创建 进程 的 新 函数 就 可 以 吵 ， 先 把 控制 权 拿 到 手 再 说 ， 进 程 相关 的 具 
体 工作 再 由 新 函数 完成 。 
11.3.2 ”用 户 进程 的 虚拟 地 址 空间 4 图 11-11 线程 创建 流程 
进程 与 内 核 线程 最 大 的 区 别 是 进程 有 单独 的 4GB 空间 ， 这 指 的 是 虚拟 地 址 ， 物 理 地 址 空间 可 未 必 
有 那么 大 ， 看 似 无 限 的 虚拟 地 址 经 过 分 页 机 制 之 后 ， 最 终 要 落 到 有 限 的 物理 页 中 。 
每 个 进程 都 拥有 4GB 的 虚拟 地 址 空间 ， 虚 拟 地 址 连续 而 物理 地 址 可 以 不 连续 ， 这 就 是 保护 模式 下 分 
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页 机 制 的 优势 。 为 演示 此 特性 ， 我 们 需要 单独 为 每 个 进程 维护 一 个 虚拟 地 址 池 ， 用 此 地 址 池 来 记录 该 进程 

的 虚拟 中 ， 哪 些 已 被 分 配 ， 哪 些 可 以 分 配 。 
与 各 个 进程 相关 的 数据 ， 如 果 数 据 量 不 大 的 话 ， 最 好 是 存储 在 该 进程 的 PCB 中 ， 这 样 便 于 管理 。 在 

上 一 节 中 您 已 经 知道 , 进程 是 基于 线程 实现 的 , 因此 它 和 线程 一 样 使 用 相同 的 pcb 结构 , 即 struct task_struct， 

我 们 要 做 的 就 是 在 此 结构 中 增加 一 个 成 员 ， 用 它 来 跟踪 用 户 空 间 虚 拟 地 址 的 分 配 情况 。 

人 体 新 增 的 成 员 名 是 在 thread.h 中 增加 的 ， 如 代码 11-3 所 示 。 


代码 11-3 (project/c11/b/thread/thread.h ) 




































































































































































































































































3 #include "stdint .hn 

4 #include "list.h" 

5 #include "bitmap.h" 

6 #include "memory.h" 
上 
75 /* 进程 或 线程 的 pcb， 程 序 控制 块 */ 
76 struct task struct { 









































































































































































































































27 洒 uint32 t* self kstack; // 各 内 核 线程 都 用 自己 的 内 核 栈 
78 enum task status status; 

79 char name[16]; 

80 uint8 七 priority; 

… 略 

87 /* general tag 的 作用 是 线程 在 一 般 的 队列 中 的 结 点 */ 

88 struct list elem general tag; 

89 

90 /* all 1ist tag 的 作用 是 用 于 线程 队列 threaqd all 1ist 中 的 结 点 */ 
91 struct list elem all list tag; 

92 

93 uint32 t* pgdir; // 进程 自己 页 表 的 虚拟 地 址 

94 struct virtual addr userprog vaddr; // 进程 的 虚拟 地 址 
95 uint32 七 stack magic; 

// 用 这 串 数字 做 栈 的 边界 标记 ， 仿 测 栈 的 溢出 

67 














其 中 第 95 行 的 struct virtual_addr userprog_vaddr 便 是 每 个 用 户 进 程 的 虚拟 地 址 池 。 
顺便 说 一 下 ,第 93 行 的 pgdir 用 于 存放 进程 页 目录 表 的 虚拟 地 址 ， 这 将 在 为 进程 创建 页 表 时 为 其 

































































赋值 
















































































也许 您 感到 迷惑 ， 按 理 说 页 表 寄 存 器 cr3 中 的 应 该 是 页 目录 表 的 物理 地 址 ,但 成 员 pgdir 是 虚拟 地 址 ， 
这 是 什么 原因 ? 
原因 是 页 目录 表 本 身 也 要 占用 内 存 来 存储 ,我 们 在 为 进程 创建 页 目录 表 时 ， 必 然 要 为 其 申请 内 存 , 但 
内 存 管 理 系 统 返 回 的 地 址 肯定 都 是 虚拟 地 址 ， 不 可 能 返回 物理 地 址 ， 因 为 返回 物理 地 址 也 没 用 ， 在 分 页 机 
制 下 ， 引 用 的 任何 地 址 都 被 当 作 虚 拟 地 址 ， 该 “物理 地 址 ”也 要 再 次 被 转换 成 别 的 物理 地 址 ， 这 就 错 了 。 
因此 在 往 寄存 器 cr3 中 加 载 页 目录 地 址 时 ， 我 们 会 将 pgdir 转换 成 物理 地 址 ， 这 部 分 将 在 下 节 介 绍 。 


11.3.3 ”为 进程 创建 页 表 和 3 特权 级 栈 


进程 与 线程 的 区 别 是 进程 拥有 独立 的 地 址 空间 , 不 同 的 地 址 空间 就 是 不 同 的 页 表 ， 因此 我 们 在 创建 进 
程 的 过 程 中 需要 为 每 个 进程 单独 创建 一 个 页 表 。 我 们 这 里 所 说 的 页 表 是 “页 目录 表 + 页 表 ”， 页 目录 表 用 来 
存放 页 目录 项 PDE， 每 个 PDE 又 指向 不 同 的 页 表 。 
页 表 虽 然 用 于 管理 内 存 , 但 它 本 身 也 要 用 内 存 来 存储 ， 所 以 要 为 每 个 进程 单独 申请 存储 页 目录 项 及 页 
表 项 的 虚拟 内 存 页 。 

除 此 之 外 ， 虽 们 之 前 创建 的 线程 属于 内 核 的 线程 ， 它 们 运行 在 特权 级 0。 和 它们 相 比 ， 用 户 进程 还 多 
了 个 特权 级 3， 大 多 数 情况 下 ， 用 户 进程 在 特权 级 3 下 工作 ， 因 此 ， 我 们 还 要 为 用 户 进程 创建 在 3 特权 级 
的 栈 。 栈 也 是 内 存 区 域 ， 所 以 ， 咱 们 还 得 为 进程 分 配 内 存 〈 虚 拟 内 存 ) 作为 3 级 栈 空间 。 
鉴于 以 上 两 点 原因 ， 这 必然 涉及 到 内 存 分 配 的 工作 ， 咱 们 的 内 存 管理 是 在 memory.c 中 ， 代 码 11-4 
是 新 增 的 相关 功能 。 




















































































































Yt 














































































































































































































































































































































































































502 


202 
203 
204 
205 


207 
208 


210 
211 
212 
213 


了 
iO 


代码 11-4 (project/c11/b/kernel/memory.c ) 


struct Pool { 
. 略 


struct lock lock; // 申请 内 存 时 互 

















I 





} 

















/* 在 pf 表示 的 虚拟 内 存 池 中 申请 pg_cnt 个 虚拟 页 ， 

* 成 功 则 返回 虚拟 页 的 起 始 地 址 ， 失 败 则 返回 NULL */ 

static void* vaddr get (enum Pool flags pf, uint32 七 pg_cnt) { 
int vaddr start = 0, bit idx start = -1;} 
uint32 t cnt = 0); 
if (pf == PF KERNEL) // 内 核 内 存 池 


.LO 
























































} else { // 内 存 池 
struct task struct* cur = running thread(); 
bit idx start = bitmap scan(&cur->userprog vaddr.vaddr bitmap, pg_cnt); 
if (bit idx start == -1) { 
return NULL; 
} 


whilel(cnt < pg cnt) { 

bitmap set (&cur->userprog vaddr.vaddr bitmap, bit idx start + cnt++ 1); 
} 
vaddr start = cur->userprog vaddr.vaddr start + bit idx start * PG SIZE; 























/* (0xc0000000 - PG_SIZE) 作 为 1 3 级 栈 已 经 在 start_process 被 分 配 */ 
ASSERT( (uint32 t)vaddr start < (0xc0000000 - PG SIZE)); 





} 


return (void*)vaddr start; 












































… 略 

/* 在 用 户 空间 中 申请 4k 内 存 ， 并 返回 其 虚拟 地 址 */ 
Void* get user pages (uint32 t pg cnt) { 

lock acquire(&user pool.lock); 

void* vaddr = malloc page (PF USER, pg_cnt); 
memset (vaddr, 0, pg _ cnt * PG SIZE); 

lock release(&user pool.lock); 

return vaddr; 














} 


/* 将 地 址 vagddr 与 pf 池 中 的 物理 地 址 关联 ， 仅 支持 一 页 空间 分 配 */ 
void* get a page (enum Pool flags pf, uint32 t vaddr) { 





















































































































































struct pool* mem Pool = pf & PF KERNEL ? &kernel pool : &user pool; 
lock acquire(&mem pool->lock); 
/* 先 将 虚拟 地 址 对 应 的 位 图 置 1 */ 
struct task struct* cur = running thread(); 
At32.t Dit Ldz es 
/* 若 当前 是 用 户 进程 申请 用 户 内 存 ， 就 修改 用 户 进程 自己 的 虚拟 地 址 位 图 */ 
if (cur->pgdir != NULL && pf == PF _ USER) { 





bit idx = (vaddr - cur->userprog vaddr.vaddr start) / PG SIZE; 
ASSERT (bit idx > 0); 
bitmap set (&cur->userprog vaddr.vaddr bitmap, bit idx, 1); 





} else if (cur->pgdir == NULL && pf == PF KERNEL) { 
/* 如 果 是 内 核 线 程 申 请 内 核 内 存 ， 就 修改 kernel vaddr */ 

bit idx = (vaddr - kernel vaddr.vaddr start) / PG SIZE; 
ASSERT (bit idx > 0); 
bitmap set (&kernel vaddr.vaddr bitmap, bit idx, 1); 

} else { 
PANIC ("get a page:not allow kernel alloc userspace or 
user alloc kernelspace by get a page"); 


























void* page phyaddr = palloc (mem pool); 
if (page phyaddr == NULL) { 
return NULL; 
} 
page table add( (void*)vaddr, page phyaddr); 
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214 lock _ release (&mem pool->lock); 
215 return (void*)vaddr; 

216° 

217 


218 /* 得 到 虚拟 地 址 映射 到 的 物理 地 址 */ 

219 uint32 t addr v2p(uint32 七 vaddr) { 

220 uint32 tx pte = pte ptr(vaddr); 

221 /* (*pte) 的 值 是 页 表 所 在 的 物理 页 框 地 址 ， 

222 * 去 掉 其 低 12 位 的 页 表 项 属性 + 虚拟 地 址 vaddr 的 低 12 位 */ 

223 return ((*pte & Oxfffff000) + (vaddr & Ox00000fff)); 
224 } 






































226 /* 初始 化 内 存 池 */ 


227 static void mem pool init (uint32 t all mem) { 


228 put_str(" mem pool init start\n"); 
279 lock init (&kernel pool.lock); 
280 lock init (&user pool.lock); 

… 略 

















代码 11-4 还 是 蛮 长 的 ， 这 只 是 列 出 了 新 增 的 部 分 ， 不 过 新 函数 都 是 用 旧 函 数 来 重新 组 合 实现 的 ， 
此 需要 介绍 的 不 是 很 多 ， 下 面 给 大 伙 儿 说 说 。 
代码 最 前 部 ， 我 们 在 内 存 池 struct pool 中 新 增 了 锁 struct lock lock， 用 它 来 在 内 存 申请 时 做 互 斥 ， 避 
免 公 共 资 源 的 竞争 。 
在 接 下 来 的 vaddr_get 函数 中 ， 我 们 新 增 了 在 用 户 内 存 池 分 配 内 存 的 功能 ， 即 代码 第 48 一 62 行 。 此 部 
分 的 处 理 逻 辑 同 在 内 核 内 存 池 中 分 配 内 存 一 样 ， 大 伙 儿 一 看 便 知 。 

下 一 个 新 增 的 函数 是 get_user_pages， 它 用 来 在 用 户 内 存 池 中 以 整 页 为 单位 分 配 内 存 ， 返 回 分 配 的 虚 
拟 地 址 ， 实 现 较 简单 ， 用 的 都 是 之 前 介绍 过 的 函数 ， 无 需 多 余 的 解释 。 

另 一 个 新 增 的 函数 是 get_a_page， 它 用 来 在 某 个 内 存 池 中 获取 一 个 页 ， 但 与 get_user_pages 和 get_ 
kernel pages 不 同 的 是 此 函数 原型 是 : 

“get_a_page(enum pool_flags pf, uint32_t vaddr)” 

多 了 个 参数 vaddr，vaddr 用 来 指定 绑 定 的 虚拟 地 址 ， 所 以 此 函数 的 功能 是 申请 一 页 内 存 ， 并 用 vaddr 
映射 到 该 页 ， 也 就 是 说 我 们 可 以 指定 虚拟 地 址 。 而 get_user_pages 和 get_ kernel _pages 不 能 指定 虚拟 地 址 ， 
只 能 由 内 存 管理 模块 自动 分 配 虚 拟 地 址 , 分 配 什么 咱们 就 用 什么 。 此 函数 内 部 实现 就 是 把 之 前 介绍 过 的 方 
法 重新 拼合 了 ， 都 是 熟悉 的 函数 ， 较 容易 理解 。 

最 后 一 个 要 介绍 的 新 函数 是 addr_v2p， 此 函数 返回 虚拟 地 址 vaddr 所 映射 的 物理 地 址 。 

addr_v2p 的 原理 是 根据 页 表 映 射 原理 ， 先 得 到 虚拟 地 址 vaddr 最 终 所 映射 到 的 物理 页 框 起 始 地 址 ， 也 就 是 
在 页 表 中 vaddr 所 在 的 pte 中 记录 的 那个 物理 页 地 址 ， 然 后 再 将 vaddr 的 低 12 位 与 此 值 相 加 ， 所 得 的 地 址 和 便 
是 vaddr 映射 的 物理 地 址 。 这 里 多 说 两 句 ， 该 函数 实现 中 的 “uint32_t*pte = pte_ptr(vaddr)” 在 指针 变量 pte 
中 得 到 vaddr 的 所 在 pte 的 地 址 ， 此 时 *pte 的 内 容 是 vaddr 所 在 pte 的 内 容 ， 也 就 是 vaddr 最 终 所 映射 到 的 
物理 页 框 的 32 位 地 址 中 的 高 20 位 和 12 位 的 页 表 项 属性 ， 因 为 页 框 都 是 自然 页 ， 低 12 位 地 址 是 0， 所 以 
页 表 项 pte( 和 页 目录 项 pde) 中 只 需要 记录 页 框 的 高 20 位 地 址 即 可 。 为 了 获取 pte 中 的 地 址 部 分 ， 在 此 
要 把 低 12 位 的 属性 值 去 掉 ， 也 就 是 return 语句 中 的 代码 “(*pte & Oxfffff000)” 的 目的 , 另外 的 代码 “(vaddr 
们 0x00000ffp) ”就 是 获取 原 虚 拟 地 址 vaddr 的 低 12 位 。 

最 后 要 说 明 的 是 由 于 我 们 在 内 存 池 struct pool 中 增加 了 锁 ， 在 内 存 池 初始 化 函数 mem_pooL init 中 ， 我 们 
增加 了 锁 的 初始 化 :“lock_init(&kernel_poolloclo;” 和 “jlock init(&user_poollock);”。 

好 啦 ， 本 节 中 有 关 memory.c 的 修改 就 到 这 我 隐约 听 到 ;:“ 什 么 ， 以 后 还 要 改 ?”)， 说 实话 ， 本 节 虽 
然 增 加 了 不 少 新 东西 ， 但 并 不 是 所 有 介绍 的 函数 在 本 次 中 都 用 到 ， 我 还 顺便 增加 了 今后 要 用 的 一 些 功能 ， 
因为 我 们 还 有 好 多 功能 没 加 进去 呢 , 小 弟 我 又 不 想 那么 频繁 地 修改 同一 文件 , 若 每 次 只 涉及 一 点 点 新 功能 ， 
我 是 介绍 ， 还 是 不 介绍 昵 ， 容 易 纠 结 ， 所 以 我 尽量 每 次 塞 进 去 一 些 较 容 易 的 函数 。 在 不 和 久 的 将 来 咱们 还 要 
实现 更 多 的 功能 ， 到 时 候 那 才 叫 “大 修 ” 呢 。 
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11.3.4 


前 为 1 








进入 特权 级 3 
在 有 了 前 面 的 基础 后 ， 终 于 我 们 来 至 
上 :我们 都 工作 在 0 特权 级 下 ， 如 何 从 特权 级 0 迈 




















从 特权 级 0 进 








入 特权 级 3 有 



































上 了 这 里 ， 用 





户 进 程 工作 在 最 








向 特权 级 3 呢 ? 


氏 的 特权 级 一 一 特权 级 3， 可 是 到 目 














几 个 关键 点 ， 这 主要 是 涉及 特权 级 方面 





同学 赶紧 翻 回去 复习 下 )， 下 面 咱们 通过 讨论 的 方式 逐步 得 出 结论 。 








一 直 以 来 我 们 都 在 0 特权 级 下 了 

















下 ，CPU 不 允许 从 高 特权 级 转向 低 特 权 级 ， 


用 调用 门 ， 因 此 ， 虽 们 进 
更 谈 不 上 从 中 断 返 回 
我 们 在 中 上 断 处 理 环 境 中 ， 这 档 
如 何 假装 呢 ? 从 大 体 j 



























































[ 作 ， 即 使 是 在 创建 用 户 进程 
除非 是 从 中 断 和 调用 门 返回 的 ! 























[的 内 容 (忘记 特权 级 是 怎么 回 事 的 














的 过 程 中 也 是 。 可 是 我 们 知道 ， 一 般 情况 









































青 况 下 。 咱 们 系统 中 不 打算 使 


























入 特权 级 3 只 能 借助 从 中 断 返 回 的 方式 ， 但 用 户 进 程 还 没有 运行 ， 何 谈 被 中 断 ? 


















































看 咱们 说 得 具体 点 。 





也 还 
































从 中 断 返回 肯定 要 / 
值 到 eflags 寄存 器 ， 如 果 栈 ， 








CS 寄存 器 ， 栈 ， 






































Cr 
ml 


AAA 








存 到 栈 中 ， 通 过 


退出 中 断 彻底 地 “ 假 克 
“勤俭 节约 ”， 我 们 可 以 复 
定义 在 kernel.S 中 的 ， 此 函数 用 来 恢复 中 断 发 生 时 、 被 
由 此 我 们 得 出 关键 点 1: 从 中 断 返 回 ， 必 须要 经 过 intr_exit， 即 使 是 “ 
在 中 断 发 生 时 ， 我 们 在 中 断 入 口 函 数 “intr%lentry” 中 通过 一 系列 的 push 操作 来 保存 任务 的 上 下 文 ， 基 
上 下 文 要 通过 一 系列 的 pop 操作 ， 这 属 了 
保存 在 人 有 
王 务 」 





此 在 intr_exit 





定 的 位 置 ， 它 只 是 一 种 保存 
以 下 为 叙述 方便 ， 将 struct intr_stack 称 为 栈 。 
在 汇编 函数 intr_exit 里 本 
这 样 才能 “假装 ” y 
此 我 们 得 出 关键 点 2: 必须 提前 准备 好 用 
4 栈 的 机 会 ， 将 用 户 进 程 的 上 下 文人 
当 执 行 完 intr_exit 中 的 iretd 指令 后 ，CPU 便 恢 复 了 从 
哪个 特权 级 。 
CPU 是 如 何 知 道 从 中 断 退 出 后 要 进入 哪个 特权 级 呢 ? 这 是 由 栈 中 
我 们 知道 ，CS.RPL 就 是 CPU 的 CPL， 当 执行 iretd 时 ， 在 栈 中 保存 的 CS 选择 子 要 被 加 载 到 代码 段 寄 存 
器 CS 中 ， 因 此 栈 中 CS 选择 子 中 的 RPL 便 是 从 中 断 返 回 后 CPU 的 新 
我 们 进入 (假装 返 
必须 为 3。 
大 伙 知 道 ，RPL 是 
免 低 特权 级 任务 作 浆 使 用 
F 级 的 方案 ,但 























硬 人 


划一 系列 pop 上 
































iretd 指令 使 用 。 
系列 的 pop 操作 
。 现 在 完全 可 以 再 习 
































到 iretd 指令 ，iretd 指令 会 















































ss 载 入 SS 寄存 器 ， 随 后 处 到 






































Fa, 




















到 栈 中 的 数据 作为 返 
cs.Ipl 若 为 更 低 的 特权 级 ， 处 理 器 的 特权 级 检查 通过 后 ， 会 将 栈 中 cs 载 入 
器 进入 低 特权 级 。 因 此 我 们 必然 要 在 栈 中 提前 准备 好 数 















































j 之 前 的 成 果 ， 回 忆 一 下 ， 退 出 中 断 的 出 



































恢复 任务 
任务 的 上 下 文 信息 被 
















































































的 一 系列 


















































) 到 3 特权 级 ， 





择 子 中 的 低 2 位 ， 











的 给 


E 护 权 交 给 了 操作 系统 ， 





个 假 的 选择 子 (通常 是 指向 4 
CPL 和 RPL 在 数值 上 同日 











的 pop 操 



















































































此 我 们 得 出 关 














指向 高 特权 级 内 存 段 的 选择 子 而 提 作 





























CPU 只 负责 接收 选择 J ， 















































操作 系统 去 保 订 




















上 小 于 等 于 选择 子 所 





指向 的 内 存 段 的 DPL 


您 看 ， 既 然 已 经 涉及 到 栈 操作 了 ， 不 如 进行 得 更 彻底 





但 是 CPU 比较 呆 头 呆 脑 ， 我 们 可 以 骗 过 CPU， 在 用 户 进程 运行 之 前 ， 使 其 以 为 
f 便 “假装 ”从 | 


上 来 看 ， 首 先 得 在 特权 级 0 的 环境 中 ， 其 次 是 执行 iretd 指令 。 这 么 说 太 笼 统 了 ， 








可 地 址 ， 还 会 加 载 栈 中 eflags 









































些 ， 咱 们 将 进程 的 上 下 文 都 

















巴 用 户 进程 的 数据 装载 到 寄存 器 ， 最 后 
EE 复写 一 套 退 


























通过 iretd 指令 退出 中 断 ， 把 





























上 中断 的 代码 ， 虽 然 仅 为 短 短 几 行 ， 但 依然 




















语言 函数 intr_exit， 这 是 我 们 




















断 的 任务 的 




















作 是 为 了 恢复 任务 的 上 下 文 ， 从 它 退 出 中 断 是 不 可 避免 的 ， 











FF “intr%1lentry” 的 逆 过 程 。 
E 务 pcb 中 的 struct intr_stack 中 ， 注 意 啦 ，struct intr_stack 并 不 要 求 有 
F 下 文 的 格式 结构 。 








上 下 文 状 态 ， 并 且 退 出 中 断 。 














段 2 




















El 
















































































户 进程 所 用 的 栈 结构 , 在 





























里 面 填 装 好 用 户 进程 的 上 下 文 信息 ， 
恩 载 入 CPU 的 寄存 器 ， 为 用 户 进程 的 运行 准备 好 环境 。 










































































FE 务 中 肠 前 上 











的 状态 : 中断 前 是 哪个 特权 级 就 进入 





呆 存 的 CS 选择 子 中 的 RPL 决定 的 ， 








的 CPL。 
建 点 3: 我 们 要 在 栈 中 存储 的 CS 选择 子 , 其 RPL 








以 表示 (或 者 叫 “ 揭 露 ”) 访问 者 特权 级 ， 因 此 RPL 是 为 了 避 
的 一 种 检测 手段 。 虽 然 RPL 是 CPU 提供 的 、 
9 己 可 不 知道 所 提交 的 选择 子 是 否 是 造假 的 。 因 此 它 把 RPL 
E 所 有 提交 的 选择 子 都 是 “ 真 货 ”。 所 以 ， 为 了 避免 任务 提交 一 
竺 权 级 更 高 的 内 存 段 )， 操 作 系 统 会 将 选择 子 的 RPL 置 为 用 户 进 程 的 CPL， 只 有 
时 , CPU 的 安全 检测 才 通 过 , 从 而 避免 了 
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既然 
RPL 都 置 为 3， 














大 | 














寄存 器 的 选择 子 必须 





由 3 
段 、 栈 段 。 我 们 前 面 的 工作 中 已 经 + 











在 RPL=CPL=3 的 情况 下 ， 用 




















住 备 好 了 DPL 为 3 和 
指向 DPL 为 3 的 内 存 段 。 






































的 代码 段 及 数 

















对 于 可 屏蔽 中 断 来 说 , 任务 之 所 以 能 进入 中 断 , 是 























还 得 保持 正 位 为 1， 
由 此 我 们 
用 户 进程 





























得 出 关键 点 5: 必须 使 栈 
属于 最 低 的 特权 级 ， 对 了 


继续 响应 新 的 中 断 。 




















F IO 操作 ， 不 允许 用 户 进程 直 


FP eflags 的 下 位 为 1。 


局 段 ， 











j 户 进程 的 特权 级 为 3， 操 作 系 统 不 能 辜负 CPU 的 委托 ， 它 有 责任 把 
户 进程 












































接 访 问 硬件 





硬件 控制 。 这 是 由 标志 寄存 器 eflags 中 IOPL 位 决定 的 ， 必 须 使 其 值 为 0。 








































































































































































































































































































由 此 我 们 得 出 关键 点 6: 必须 使 栈 中 eflags 的 IOPL 位 为 0。 
好 啦 ， 关 键 点 说 完了 ， 下 节 我 们 将 围绕 这 6 点 来 实现 用 户 进程 。 
11.3.5 ”用 户 进程 创建 的 流程 
我 们 即将 介绍 用 户 进程 实现 的 细节 。 但 是 如 果 不 从 全 局 上 先 让 大 伙 儿 对 整个 进程 创建 的 脉络 有 所 党 3 
的 话 , 今后 在 介绍 局 部 细节 时 难免 会 让 大 家 有 摸 不 着 
头脑 的 感觉 ， 最 好 是 先 给 大 伙 儿 一 张 “ 地 图 ” 每 走 
一 步 您 都 知道 所 介绍 的 代码 细节 身 居 何 处 。 为 此 ， 为 本 
了 帮助 大 伙 儿 容易 地 理解 进程 创建 的 原理 , 本 节 先 从 ee 
全 局 上 做 个 介绍 ， 进 程 创 建 的 流程 如 图 11-12 所 示 。 ” 创 
对 于 图 11-12 中 那些 未 知 的 函数 ， 此 处 暂且 将 疑 。 建 ey 依 
惑 忽略 ,我 们 会 在 本 节 后 介绍 , 现在 的 目的 是 让 大 伙 ”过 create_user_vaddr_bitmap(thread) 
儿 对 进程 创建 的 过 程 有 个 大 致 把 握 。 程 ee en re po tr bro | 1 
进程 从 创建 到 运行 在 总 体 上 分 为 两 步 ， 进 程 创 
建 的 工作 是 由 函数 process_execute 完成 的 进程 的 thread->pgdir = create_page_dir() 
执行 是 由 时 钟 中 断 调用 schedule, schedule 从 就 绪 队 Pn et) 
列 中 调度 进程 完成 的 ， 毫 无 疑问 的 是 进程 必然 是 创 

















建 在 先 ， 执 行 在 后 。 
意 说 明 这 个 顺序 只 是 
上 到 下 。 

process_execute 


的 用 户 进程 ， 千 流 程 












































11-12 的 阅读 顺序 是 从 


哈哈 ， 这 不 是 废话 吗 ， 
想 强 调 图 











的 参数 是 user_prog, 这 是 待 执行 
图 中 它 出 现 了 5 次 , 为 了 让 您 了 














解 它 是 如 何 被 安装 的 
画 线 。 由 于 进程 的 实 
我 们 
























































中 , 先 调 用 函数 get_ kernel _pages 
程 的 pcb， 这 里 的 pcb 就 是 thread， 接 下 来 调用 函数 


, 我 在 每 次 它 出 现 的 地 方 加 了 下 
现 基 于 线程 ， 故 进程 创建 过 程 ! 























到 了 很 多 创建 线程 的 函数 。 在 process_execute 














! 请 1 页 内 存 创 建 进 























init_thread 对 thread 进行 初始 化 。 
user_vaddr_bitmap 为 用 户 进程 创建 管理 




















间 的 位 图 
的 作 








。 接 着 调 




















j thread_create 
是 将 函数 start_process 和 用 户 进程 











随后 调用 函数 create_ 
虚拟 地 址 空 
建 线程 ， 此 函数 
user_prog 作 












































| 




















1 此 我 人 














j 户 进 








站 得 


为 标志 寄存 器 eflags 中 的 正 位 为 1, 退 昌 











程 所 有 段 选择 子 的 
只 能 访问 DPL 为 3 的 内 存 段 ， 即 代码 段 、 数 据 











8 关键 点 4,， 栈 ! 











































































































中 断后 ， 


只 允许 操作 系统 有 直接 的 





HT 





时 钟 中 
从 就 绪 队 列 thread_r 


中 断 发 生 ， 调 度 器 Schedule 


eady_list 中 获取 下 一 个 任务 thread 















































A 



































schedule 
process_activate(thread) 次 
4 
执 
switch_to(cur, thread) 行 
| 调用 
kernel_thread(start_process, user_prog) 
| 调用 
start_process(user_prog) 
调用 (jmp) 
intr_exit 
调用 
user_prog 


用 户 进程 user_prog 得 到 执行 





[ 受 ] 











11-12 











受 | 








口 
王 











程 创 建 流 





为 kernel_thread 的 参数 , 以 使 kernel_thread 能 够 调用 start_proces(user_prog)。 接 下 来 是 调用 函数 create_page_dir 








为 进程 创建 页 表 ， 随 


























后 通过 函数 list_append 将 进程 




















户 进程 的 创建 部 分 完成 ， 现 在 就 等 着 进程 运行 了 。 
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pcb， 也 就 是 thread 加 入 就 绪 队 列 和 全 部 队列 ， 








至 此 用 


进程 会 在 何 时 运行 呢 ? 前 面 说 过 了 ， 进 程 的 运行 是 由 时 钟 中 断 调用 schedule， 由 调用 器 schedule 调度 
实现 的 。 当 schedule 从 就 绪 队 列 中 获取 的 pcb 恰好 是 新 创建 的 进程 pcb 一 一 thread 时 ， 该 进程 马上 就 要 被 执 
行 了 。 在 schedule 中 , 调用 了 process_activate 来 激活 进程 或 线程 的 相关 资源 (页 表 等 ), 随后 通过 switch_to 
函数 调度 进程 ， 根 据 先前 进程 创建 时 函数 thread_create 的 工作 ， 已 经 将 kernel_thread 作为 函数 switch_to 
的 返回 地 址 ， 即 在 switch to 中 退出 后 ， 处 理 器 会 执行 kernel _ thread 函数 ,“ 相 当 于 ”switch to 调用 
kernel_ thread。 同 样 在 之 前 的 thread_create 中 ， 已 经 将 start_process 和 user_prog 作为 了 kernel thread 的 参 
数 ， 故 在 kernel_ thread 中 可 以 以 此 形式 调用 start_process(user_prog)。 函 数 start_process 主要 用 来 构建 用 户 
进程 的 上 下 文 ， 它 会 将 user_prog 作为 进程 “从 中 断 返 回 ” 的 地 址 ， 您 懂 的 ， 这 里 的 “从 中 断 返 回 ” 是 假装 
的 ， 目 的 是 让 用 户 进程 顺利 进入 3 特权 级 。 由 于 是 从 0 特权 级 的 中 断 返 回 ， 故 返回 地 址 user_prog 被 iretd 指 
令 使 用 ， 为 了 复 用 中 断 退 出 的 代码 ， 现 在 需要 跳 转 到 中 断 出 口 intr_exit (kernel.S 中 汇编 代码 完成 的 函数 ) 
处 ， 利 用 那里 的 iretd 指令 使 返回 地 址 user_prog 作为 EIP 寄存 器 的 值 以 使 user_prog 得 到 执行 ， 故 相当 于 
周 用 intr_exit，intr_exit 调用 user_prog， 最 终 用 户 进程 user_prog 在 3 特权 级 下 执行 。 
下 面 咱们 开始 介绍 细节 ， 如 果 在 介绍 细节 过 程 中 





























































































































































































































































































































a 




































































































































































start_process 调 
好 啦 ， 以 上 简单 地 介绍 了 进程 从 创建 到 执行 的 原理 
“迷失 ”了 ， 可 以 再 回来 看 看 图 11-12。 



































































































































11.3.6 ”实现 用 户 进程 一 一 上 


本 节 我 们 开始 正式 接触 进程 创建 的 工作 。 
构造 用 户 进 程 的 上 下 文 环境 ， 免 不 了 标志 寄存 器 eflags 的 属性 位 ， 这 里 我 们 在 global.h 中 提前 定义 了 
它 ， 大 家 先 看 下 代码 11-5 大 概 了 解 一 下 。 


代码 11-5 (project/c11/b/kernel/global.h ) 






































































































































… 略 
113 #define EFLAGS MBS (1 << 1) // 此 项 必须 要 设置 
114 #define EFLAGS IF_ (1 << 9) // if 为 1， 开 中 
115 #define EFLAGS IF 0 0 // if 为 0， 关 中 断 
116 #define EFLAGS IOPL 3 (3 << 12) 

// IOPL3, 测试 用 户 程序 在 非 系统 调用 下 进行 IO 
117 #define EFLAGS IOPL 0 (0 << 12) // IOPLO 
118 
119 #define NULL ((void*)0) 





120 #define DIV ROUND UP (xX, STEP) ((X + STEP - 1) / (STEP)) 
121 #define bool int 

122 #define true 1 

123 #define false 0 


125 #define PG SIZE 4096 

好 ， 定 义 的 属性 位 不 多 ， 大 概 看 下 就 行 了 ， 咱 们 说 正题 。 

和 用 户 进程 相关 的 文件 我 们 都 放 在 userprog 目录 下 ， 现 在 创建 文件 process.c 来 实现 用 户 进 程 。 
直接 上 菜 ， 请 看 代码 11-6-1， 咱 们 边 看 代码 边 介绍 。 


代码 11-6-1 (project/c11/b/userprog/process.c ) 














































































































… 略 
12 extern void intr exit (void) ; 
入 
14 /* 构建 用 户 进程 初始 上 下 文 信息 */ 


15 void start process(void* filename ) { 
































下 6 void* function = filename ; 
汪汪 struct task struct* cur = running thread(); 
18 cur->self kstack += sizeof (struct thread stack); 
19 struct intr stack* proc stack = (struct intr stack*)cur->self kstack; 
20 proc stack->edi = proc stack->esi =\ 
proc stack->ebp =proc stack->esp dummy = 0; 
21 proc stack->ebx roc stack->edx 


= = \ 
proc stack->ecx = proc stack->eax = 0; 
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用 户 进程 

proc stack->gs = 0; V6 态 用 不 上 ， 直 接 初 始 为 0 

proc stack->ds = proc stack->es = proc stack->fs = SELECTOR U DATA; 
proc stack->eip = function;  // 待 执 行 的 用 户 程序 地 址 

proc stack->cs = SELECTOR U CODE; 

Proc_stack->eflags = (EFLAGS IOPL 0 | EFLAGS MBS | EFLAGS IF 1); 


30 } 


大 
党 


} 





代码 11-6-1 的 


/* 若 为 内 核 线程 ， 需 
默认 为 内 核 的 页 


/* 激活 线程 或 进程 的 页 表 ， 更 新 tss 
Vvoid process 


proc stack->esp = 
USER STACK3 VADDR) + PG SIZE) ， 
proc stack->ss = SELECTOR U DATA; 
asm volatile ("movl %0, 
: "g" (proc stack) : "memory"); 


/* 激活 页 表 */ 
Void page dir activate(struct task struct* p thread) 
/太太 大大 炎炎 炎炎 类 类 炎炎 类 类 类 炎炎 类 类 类 类 类 炎炎 六 类 类 类 类 类 类 类 关头 六 六 类 类 关头 关头 六 六 大大 大大 大 类 大大 大大 大大 


* 执行 此 函数 时 ， 当 前 任务 可 能 是 线程 。 
































ssesp; jmp intr exit" \ 
































之 所 以 对 线程 也 要 重新 安装 页 表 ， 原 因 是 上 
否则 不 恢复 页 表 的 话 ， 线 程 就 会 使 用 进程 的 页 表 了 。 


























重新 填充 页 表 为 0x100000 */ 
uint32 t pagedir phy addr = 0x100000; 
































录 物 理 地 址 ， 也 就 是 内 核 线程 所 
if (p thread->pgdir != NULL) { 











的 














3 
水 工 





内 








(voidqx) ((uint32 t)get a page (PF USER,\ 


{ 


次 被 调度 的 可 能 是 进程 ， 


类 火炎 大 类 大 大 大 炎炎 类 类 大 大 大 大 大 大 类 大 类 类 大 大 大 类 大 大 大 大 大 大 大 大 大 大 大 大 





























// 





自己 








' 态 进程 有 


的 页 








= 
水 工 








pagedir phy addr = addr v2p((uint32 t)p thread->pgdir); 


} 


























录 寄 存 器 cr 3， 使 新 页 表 生 
ile ("movl %0, %%cr3" : 


/* 更 新 页 


asm volat 




















_activate(struct 
ASSERT (p thread != NULL); 
/* 激活 该 进程 或 线程 的 页 表 */ 
page dir activate(p thread); 

















效 */ 
: "r" (pagedir phy addr) 














Pp 的 esp0 为 进程 的 条 








task struct* P thread) { 














/* 内 核 线程 特权 级 本 身 就 是 0， 处 理 器 进入 9 


Pp 断 时 











从 tss 中 获取 0 特权 级 栈 地 址 ， 故 不 需要 更 新 
if (P thread->pgdir) { 
/* 更 新 该 进程 的 esp0， 
update tss esp (P thread); 






























































此 进程 被 中 断 时 





不 会 


esp0*/ 





保留 上 下 文 */ 














权 级 0 的 栈 */ 











函数 start_process 接收 一 个 参数 flename_， 此 参数 表示 用 户 程序 的 名 称 ， 


上 加 载 到 内 存 的 ， 因 此 进程 名 是 进程 的 文件 














用 户 进程 的 struct intr_stack， 通 过 假装 从 中 断 返 
] 说 过 用 户 进程 是 基于 线程 来 实现 的 ， 


我 人 











于 最 下 面 的 fanction， 





了 











bam 


FE 这 一 点 。 
下 面 看 下 start_process 的 实现 ， 


























名 。 此 函数 








也 









































大 





此 在 





入 | 




















也 就 是 说 ， 我 人 











前 国 











的 东西 有 点 多 ，ready? go! 
函数 体 中 第 














程序 最 终 的 
系统 的 程序 加 载 器 将 用 户 程序 从 文件 系统 读 到 内 存 , 甩 
记录 程序 的 入 口 
两 个 寄存 器 , 但 函数 调 
和 银 调 用 函数 那样 调用 执行 用 户 得 
尚未 实现 文件 系统 ， 前 期 





是 个 和 
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开 到 相应 的 内 
C 语言 中 虽然 不 能 直接 控 币 
的 操作 系统 可 
站 令 区 域 。 由 于 目前 我 们 








一 句 是 “void* function = filename_ ;”， 了 














创建 流程 


开头 声明 了 外 部 函数 intr_exit， 这 是 用 户 进程 进入 3 特权 级 的 关键 。 


: "memory" ) ; 




















] 户 程 请 


来 创建 用 户 进 程 flename_ 的 J 
的 方式 ， 间 接 使 filename_ 运 行 。 
11-9 中 的 线程 


] 创 建 进程 的 第 一 步 是 在 线程 中 运行 函数 start_process， 后 再 














FET， 


EE 中， 函数 start_process 相当 
i 我 们 会 验 














Pg 








[的 6 个 关键 点 就 是 在 此 函数 中 体现 的 ， 实 现 部 分 不 








~ 














大 人 台 是 壬 内 存 中 ， CPU 只 能 























存 地 址 。 程 序 格 式 中 会 








EE 直接 执行 位 于 内 存 中 的 指令 。 
有 根据 程序 文件 的 格式 解析 其 内 容 , 将 程序 中 



































也 址 ，CPU 把 CS:[E 





其 实 它 不 重要 ， 但 还 是 解释 
用 户 进 程 在 执行 月 


E]IP 指向 ' 


























但 


信 ， 


下 吧 。 


肯定 是 从 文件 
也 就 是 填充 











三 
AE 


J ， 











的 段 展 


系统 





要 说 明 


操作 











它 ， 该 程序 


就 被 

















| 这 


其 实 训 
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Ny 


了 。 














对 此 ， 

















户 进程 被 加 载 对 












































我 们 用 普通 函 





是 改变 这 两 个 寄存 器 的 指 














内存 中 后 


同 函 数 一 档 


>» 

















数 代 蔡 | 


户 程 / 订 ， 























执行 了 。 
， 故 C 语言 编写 


仅仅 


function 代 








替 了 filename_ ， 待 后 面 文件 系统 完成 时 就 可 以 不 用 



































用 





户 进程 上 下 文保 存在 struct intr_stack 栈 中 ， 





大 伙 儿 一 块 回 





(uint32_t*)((uint32_t)pthread + PG_SIZE);”, 
intr_stack” 和 “struct thread_stack” 的 布 


1 








区 


下 创建 线程 的 过 程 ， 在 函数 init thread 中 有 这 档 











这 个 鉴 脚 的 名 称 了 。 





























虽然 此 栈 的 位 置 不 



































目 





























thread_create 中 完成 的 ， 相 关 代 码 是 : 


| 
和 
| 














“pthread->self kstack -= 


“pthread->self kstack -= 


struct intr_stack 栈 用 来 存储 进入 中 断 时 任务 的 上 下 文 ， 
任务 切换 (switch_to〉 前 后 的 上 下 文 。 这 两 个 栈 的 布局 情况 如 


栈 的 结构 体 代码 


sizeof (struct intr stack);” 


sizeof (struct thread stack);” 


国定， 但 我 们 还 得 为 它 安排 个 合适 的 位 置 。 
一 名 代码 :“pthread->self_kstack = 
的 是 初始 化 线程 所 用 的 栈 的 基 址 ， 后 面 的 两 个 栈 “struct 
局 及 所 占 的 空间 以 此 基地 址 往 下 顺延 ， 这 个 布 





局 操作 是 在 函数 


























struct thread_stack 
图 11-13 所 示 。 









































PCB 中 楼 的 布局 ” pCB 上 顶端 


2 1 1(self_kstack 初 始 地 址 ) | 





void* esp 





uint32 teflags 
vint32tcs 

void (“eip) (void) 

| vint32 terr_code 
uint32 tds 
vint32_tes 
vint32tfs 

vint32 tgs 

uint32 teax 
uint32_tecx 
uint32_tedx 
vint32_t ebx 

uint32 tesp_dummy 
uint32 tebp 

| uint32_t esi 

| uint32 tedi | 
uint32 tvec_no / 
Ba | void* func arg 

thread_func* function 

| void (“unused retaddr) | 
国 | void (“eip) (thread func" func void" func_arg) | 

| uint32_tesi 

int32_tedi 

| vint32_t ebx 

vint32t ebp 








地 - 
址 











intr_stack 








低 


' 




















thread_stack 








Self_kstack 





来 存储 在 中 断 处 理 和 























(thread) 




















往 下 越 高 。 而 右边 








4 图 11-13 PCB 中 的 栈 布 局 _a 
在 图 11-13 中 ,左边 黑色 背景 的 结构 体 是 实际 定义 的 栈 代 码 ， 值 得 注意 的 是 结构 体 





























贷 格 是 栈 ， 其 中 的 内 容 是 结构 体 中 的 成 员 ， 地 址 是 越 往 下 越 











成 员 的 地 址 是 越 
氏 。 


self_kstack 在 init_thread 中 被 赋予 指向 PCB 上 顶端 ， 经 过 上 面 引号 中 的 两 行 代码 后 ，self_kstack 指 PCB 


中 struct thread_stack 栈 的 最 底 端 ， 如 











图 11-13 中 横 





向 箭头 的 位 置 所 示 。 











在 线程 创建 过 程 中 ， 我 们 把 线程 的 上 下 文保 存在 了 struct thread_stack 栈 中 ， 实 际 





加 


栈 的 代码 如 











struct thread_stack 栈 是 由 


执行 的 函数 )，function 


11-14 所 示 。 


thread_create( task_struct* pthread, thread_func function, * func_arg) { 


pthread->self_kstack -= ( intr_stack); 


pthread->self_kstack -= thread_stack); 


thread_stack*)pthread->self_kstack; 


thread_stack* kthread_stack = ( 
kthread_stack->eip = kernel_thread; 
kthread_stack->function = function; 
kthread_stack->func_arg = func_arg; 
kthread_stack->ebp = kthread_stack->ebx = kthread_stack->esi = kthread_stack->edi = 0; 








及 











A 





11-14 ”线程 创建 过 程 


























函数 kernel_thread 使 用 的 ， 之 后 kernel_thread 调用 




















忆 此 得 以 执行 。 











操作 struct thread_stack 


function 〈 最 终 在 线程 中 











509 






















































































目前 栈 struct intr_stack 还 是 空 的 ,此 栈 有 两 个 作用 ,一 方面 是 任务 被 中 断 
另 一 方面 这 是 为 了 给 进程 预 留 的 ， 用 来 填充 用 户 进程 的 上 下 文 ， 也 就 是 寄存 器 环境 。 
现在 回来 看 代码 11-6-1， 














sizeof(struct thread_stack);” 


时 PCB 中 栈 的 情况 如 








低 处 ， 此 


栈 的 结 
intr_stack { 





接 下 来 的 第 19 行 , 声明 struct intr_stack* 指针 proc_stack, 使 其 指 
向 箭头 指向 的 位 置 所 示 。 这 么 做 的 原因 
吉 构 体 成 员 访 问 


栈 的 最 低 处 ， 如 图 











第 20~21 站 
都 无 实际 值 ， 把 它 介 











11-15 中 横 
的 最 低 处 ， 对 结构 体 成 员 的 访问 是 由 低 向 高 处 做 偏 移 ， 
是 对 栈 中 8 个 通用 寄存 器 初始 化 ， 在 程序 开始 运 
] 初 始 化 为 0 即 可 。 








构 体 代码 











地 
址 





[int32.t ebp 





受 | 














11-15 PCB 中 的 栈 布 


A 






































接 下 来 是 对 栈 ' 














级 (用 
因此 只 要 

















AR 


在 描述 符 





显存 段 寄存 器 
说 明 一 下 ， 此 处 不 允许 用 





gs 初始 化 ， 操 





这 样 符合 























直接 控 和 


| 显存 是 操作 系统 











户 进程 














PCB 中 栈 的 布局 。 pCB 上 顶端 


1 1(self_kstack 初 始 地 址 ) \ 


|) intr_stack 


; self kstack 











云 行 之 初 ， 尚 











芷 系统 不 允许 用 户 进 程 访问 显存 ， 





| thread _stack ECB 























的 管理 方法 。 








户 进程 ) 的 任务 直接 访问 显存 的 ， 
中 把 它 的 DPL 设置 成 











不 过 话 又 说 


口 





级 即 可 。 
返回 时 ， 























应 段 寄 存 器 的 选择 子 置 为 


问 GDT 中 第 0 个 不 可 访问 的 哑 描 述 符 ， 


CPU 会 进行 特权 级 检查 ， 
上 大 于 ) CPU 中 段 寄 存 器 (如 DS、ES、FS、GS) ! 








0。 这 相 





一 来 ， 如 果 低 特权 级 程序 月 


因为 显存 毕竟 是 块 内 存 
氏 特权 就 
































区 











域 , 访问 内 存 
好 ， 也 就 是 显存 段 的 DPL 数值 ] 


时 , 用 来 保存 任务 的 上 下 文 ， 


为 了 引用 struct intr_stack 栈 , 我 们 在 第 18 行 , 通过 代码 “cur->self_ kstack += 
使 指针 self_kstack 路 过 struct thread_stack 栈 ， 最 终 指向 struct intr_stack 栈 的 最 
图 11-15 所 示 。 


问 self_ kstack, 也 就 是 struct intr_stack 
是 结构 体 指针 proc_stack 指向 结构 体 
的 方式 。 


未 进行 任何 计算 ， 因 此 它们 





所 以 将 其 初始 化 为 0。 
其 实 CPU 是 允许 低 特权 
区 域 就 要 通过 描述 符 ， 


























上 大 于 等 于 











j 户 特权 














来 了 ， 即 使 此 处 的 gs 不 置 为 0，CPU 也 会 将 其 置 0， 原 




















大 






























































的 用 户 环 境 下 gs 选择 子 





不 上 ， 














干脆 这 里 直接 置 为 0。 
代码 第 23 行 是 将 栈 中 
码 11-1 的 global.h 中 定义 。 























段 寄 存 器 ds、 






































程序 能 上 CPU 运行 ， 原因 就 是 CS:[E 

第 24 行 通过 “proc_stack->eip = function;”， 
filename_ 的 值 。 

第 25 行 ; 























GDT 中 安装 好 的 用 户 级 代码 段 。 


510 














成 其 他 值 ， 
































导致 CPU 抛 异 常 ， 从 而 阻止 了 越权 访问 。 
即使 赋值 





是 执行 iretd 从 





大 























断 


如 果 发 现 未 来 的 CPL (也 就 是 内 核 栈 中 CS.RPL) 权限 低 于 (数值 
选择 子 指向 的 内 存 段 的 DPL，CPU 会 
此 0 值 选择 子 访问 GDT， 必 然 会 导致 访 





自动 将 相 














此 ， 在 特权 为 3 


于 cpl 为 3， 特权 检查 时 CPU 就 将 gs 置 0 了， 


es 和 fs 的 值 设 置 为 选择 子 SELECTOR_U_DAIA， 此 选择 子 在 代 


EJIP 指向 了 程序 入 








口 地 址 。 











先 对 栈 中 eip 赋 人 





通过 “proc_stack->cs = SELECTOR_U_CODE” 将 栈 中 代码 段 寄存 器 cs 赋值 为 先前 我 们 已 在 








直 为 function， 这 是 start_process 的 参数 











接 下 来 对 栈 中 eflags 赋值 ，EFLAGS_IOPL 0 表示 IOPL 位 为 0，EFLAGS_IF_1 表示 正 位 为 1， 
11-16 所 示 。 


Intel 8086 Eflags Register 





EFLAGS_MBS 固定 为 1， 它们 在 eflags 中 的 位 置 如 图 

接 下 来 第 27 行 要 为 用 户 进程 分 配 3 特权 级 下 的 
栈 ， 也 就 是 栈 中 proc_stack->esp 需要 指向 从 用 户 内 存 
池 中 分 配 的 地 址 。 

继续 之 前 先 介绍 下 C 程序 的 内 存 分 布 , 如 图 11-17 
所 示 。 

用 户 程序 内 存 空间 的 最 顶端 用 来 存储 命令 行 参数 
及 环境 变量 ， 这 些 内 容 是 由 某 操作 系统 下 的 C 运行 库 
写 进去 的 ， 将 来 实现 从 文件 系统 加 载 用 户 进程 并 为 其 
传递 参数 时 会 介绍 这 部 分 。 紧 接着 是 栈 空间 和 堆 空 间 ， 
栈 向 下 扩展 ， 堆 向 上 扩展 ， 栈 与 扒 在 空间 上 是 相 接 的 ， 
这 两 个 空间 由 操作 系统 管理 分 配 ， 由 于 栈 与 堆 是 相向 
扩展 的 ， 操 作 系 统 需要 检测 栈 与 堆 的 碰撞 。 最 下 面 的 
未 初始 化 数据 段 bss、 初 始 化 数据 段 data 及 代码 段 text 
由 链接 器 和 编译 器 负责 。 












































































































































151141131121111101FIEID CIBIAI91817161514131211181 
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ID..ID Flag 





受 ] 





全 


























11-16 ”eflags 中 





VCory Flog 


- 1MBS 
'--- PF...Parity Flag 


--- 0 
--- AF...Auxiliary Flag 


'--- ZF...Zero Flag 

-- SF..Sign Flag 

'--- TF..Trap Flag 

-- IF..Interrupt Flag 

-- DF..Direction Flag 

-- OF...O0verflow flag 

-- IOPL...I/0 Privilege Level 
NT...Nested Task Flag 

0 

RF...Resume Flag 


WM..Virtual Mode Flag 
AC...Alignment Check 

VIF...Virtual Interrupt Flag 
VIP.Virtuat Interrupt Pending 





属性 位 





司 。 














































































































户 空间 的 最 高 处 即 0xc0000000- 
j 户 进程 的 命令 行 参数 , 之 下 的 空间 再 作 


1 ， 











这 了 人 作 


时 日 J 


绍 加 载 

















然 命令 行 参数 位 于 用 户 空间 的 最 高 处 ， 但 它 
































E 模 块 返回 的 地 址 是 内 存 空间 的 下 边界 ， 所 以 




















j 户 栈 空 间 


在 4GB 的 虚拟 地 址 空间 中 ，(Oxc0000000-D 是 用 户 空 间 的 最 高 地 址 ，0xc0000000~Oxffffffff 是 内 核 空 | 
高 地 址 我 们 也 效仿 这 种 内 存 结构 布局 ， 把 
命令 行 参数 和 环境 变量 及 以 下 的 部 分 内 存 空间 用 于 存储 | 
和 为 用 户 的 栈 和 堆 。 命 令 行 参数 也 是 被 压 入 用 户 栈 的 (在 后 面 
用 户 进程 时 会 了 解 )， 因 此 虽 
Le 们 相当 于 位 于 栈 的 最 高 地 址 处 ， 所 以 用 户 栈 的 栈 底 地 址 为 0xc0000000。 
未 初始 化 数据 (bss) 由 于 在 申请 内 存 时 ， 内 存 管 到 
a 低地 址 我 们 为 栈 申 请 的 地 址 应 该 是 (0xc0000000-0x1000)， 此 地 址 是 
栈 顶 的 下 边界 。 这 里 我 们 用 宏 来 定义 此 地 址 ， 即 USER_STACK3_VADDR， 
和 图 11-17 0C 程序 内 存 布局 




















它 定义 在 userprog.h 中 。 


“#define USER_STACK3_VADDR (0xc0000000 - Ox1000)”, 











具体 代码 是 用 第 27 行 的 “get_a_page(PF_USER, USER_STACK3_VADDR)” 先 获取 特权 级 3 的 栈 的 下 


边界 地 址 , 将 此 地 址 再 加 上 PG_SIZE, 所 得 的 和 就 是 栈 的 上 边界 , 即 栈 底 , 将 此 栈 底 赋值 给 proc_stack->esp。 

















处 为 上 





也 许 您 会 有 疑问 ,出 
是 安装 
必然 要 建立 在 用 户 进程 自 
在 进程 创建 部 分 ， 有 一 
分 ， 
线程 ) 自己 的 页 表 生 效 。 我 们 是 在 函数 start_process 上 




















己 的 页 表 中 。 您 可 以 回 





















































FP 为 

















页 表 了 ， 所 以 3 特权 级 栈 是 安装 在 用 户 进程 























糊 ， 建 议 把 此 部 分 了 解 后 ， 再 把 代码 通读 一 次 就 明白 了 。 











栈 段 可 以 用 普通 
第 29 行 通过 内 联 汇编 ， 将 栈 esp 
流程 跳 转 到 中 断 出 口 地 址 intr_exit， 通 过 寻 
CPU 的 寄存 器 ， 从 而 使 程序 “假装 ”退出 




























































































intr_stack， 虽 然 








的 数据 段 ， 第 28 行为 栈 中 SS 赋值 为 | 




















j 户 进程 创建 的 3 特权 级 栈 ， 它 是 在 讲 











] 户 进程 创 




















在 谁 的 页 表 中 了 ? 不 会 是 安装 到 内 核 线 程 使 用 的 页 表 中 了 吧 ? 当然 不 是 ， 
顾 一 下 图 11-12， 有 两 项 工作 确 
项 工作 是 create_page_dir， 这 是 提前 为 用 户 进 入 创建 了 页 目录 表 ， 在 进程 执行 音 
有 一 项 工作 是 process_activate， 这 是 使 任务 〈 无 论 任务 是 否 为 新 创建 的 进程 或 线程 ， 或 是 老 进程 、 
E 了 3 特权 级 栈 ，start_process 
执行 任务 页 表 激 活 之 后 执行 的 ， 也 就 是 在 process_activate) 之 后 运行 ， 那 时 已 经 把 页 表 更 新 为 用 户 进 
自己 的 页 表 上 


的 内 存 空 间 中 申请 的 ? 换 句 话说 ， 








j 户 进程 使 用 的 3 级 栈 
事 的 正确 性 ， 


尝 








x 


保 了 这 件 



































老 
是 在 
程 的 





























FP 的 。 好 啦 ， 和 暂时 解释 这 么 多 ， 如 果 还 是 感觉 到 模 





] 户 数据 段 选择 子 SELECTOR_U_DATA。 

寺 换 为 我 们 刚刚 填充 好 的 proc_stack， 然 后 通过 jmp intr_exit 使 程序 
里 的 一 系列 pop 指令 和 iretd 指令 ， 将 proc_stack 中 的 数 
中 断 ， 进 入 特权 级 3。 
终于 把 start_process 说 完了 ， 但 心里 还 有 点 小 事 儿 要 和 大 家 说 下 : proc_stack 的 数据 类 型 是 struct 











居 载 入 

















3 们 把 它 定义 在 PCB 中 ,位 于 PCB 中 最 顶端 ， 但 它 完全 可 以 用 局 部 变量 代 玲 ， 因 为 它 只 用 这 








511 






































一 次 , 之 后 不 需要 再 次 访问 。 故 可 以 在 函数 start_process 中 这 样 声明 proc_stack: “struct intr_stack proc_stack”， 

















后 面 的 填充 操作 完全 一 样 ， 而 且 也 用 不 着 执行 第 17 一 18 行 的 代码 了 。 不 过 ， 既 然 此 时 PCB 顶端 的 struct 




















intr_stack 空间 还 空 着 ， 不 用 就 浪费 了 ， 哈 哈 ， 那 咱们 就 用 了 它 吧 。 




















start_process 函数 的 介绍 到 此 为 止 ， 在 介绍 下 一 个 函数 之 前 ， 咱 们 还 要 “ 跑 偏 ”一 次 。 


我 们 知道 ， 每 个 进程 都 拥有 独立 的 虚拟 地 址 空间 ， 本 质 上 就 是 各 个 进程 都 有 单独 的 页 表 ， 页 表 是 存储 
在 页 表 寄 存 器 CR3 中 的 ，CR3 寄存 器 只 有 1 个 ， 因 此 ， 不 同 的 进程 在 执行 前 ， 我 们 要 在 CR3 寄存 器 中 为 


























































































































其 换 上 与 之 配套 的 页 表 ， 从 而 实现 了 虚拟 地 址 空间 的 隔离 。 


好 啦 ， 回 到 正题 。 





下 面 要 介绍 的 函数 是 page_dir_activate, 它 接受 一 个 参数 p_thread, 用 来 激活 p_thread 的 页 表 , p_thread 


可 能 是 进程 ， 


也 可 能 是 线程 。 









































也 许 您 会 有 疑问 ,进程 才 有 独立 的 地 址 空间 ， 才 有 自己 的 页 表 ， 按理 说 激活 页 表 这 类 工作 应 该 针对 的 














是 进程 啊 ， 为 什么 线程 也 需要 呢 ? 
在 第 34 一 38 行 的 注释 解释 了 这 一 点 ,目前 咱们 的 线程 并 不 是 为 用 户 进程 服务 的 , 它 是 为 内 核 服 务 的 ， 


















































































































































因此 与 内 核 共 享 同 一 地 址 空间 ， 也 就 是 和 内 核 用 的 是 同一 套 页 表 。 当 进程 A 切换 到 进程 B 时 ， 页 表 也 要 




















随 之 切换 到 进程 B 所 用 的 页 表 ， 这 样 才 保证 了 地 址 空间 的 独立 性 。 当 进程 B 又 切换 到 线程 C 时 ， 由 于 目 









































前 在 页 表 寄 存 器 CR3 中 的 还 是 进程 B 的 页 表 ， 因 此 ， 必 须要 将 页 表 更 换 为 内 核 所 使 用 的 页 表 。 所 以 ,无 
论 是 针对 进程 ， 还 是 线程 ， 都 要 考虑 页 表 切 换 。 









































第 41 行 ， 将 pagedir_phy_addr 初始 化 为 0x100000， 这 是 内 核 所 使 用 的 页 表 的 物理 地 址 ， 也 是 所 有 内 
核 线程 的 页 表 。 
如 何 判断 当前 任务 是 线程 ， 还 是 进程 呢 ? 老 办 法 ， 还 是 判断 pcb 中 的 pgdir 是 否 等 于 NULL，pcb->pgdir 









































用 来 指向 页 表 的 虚拟 地 址 。 线 程 pcb 中 是 没有 页 表 的 ， 所 以 pgdir 等 于 NULL， 如 果 是 进程 ， 其 pgdir 


不 为 NULL。 




















按照 这 个 思路 ， 在 第 和 2 行 ， 通 过 代码 “if (p_thread->pgdir !/= NULD)” 判 断 是 否 为 进程 ， 若 为 进程 ， 




















则 将 进程 的 页 表 地 址 加 载 到 CR3 寄存 器 。 





让 
注 忆 ， Pp 









































gdir 中 的 是 页 表 的 虚拟 地 址 ， 因 为 页 表 需 要 单独 的 内 存 空间 ， 创 建 页 表 ( 由 代码 11-6-2 中 的 函 












































数 create_page_dir 完成 ) 时 必然 要 为 页 表 申 请 内 存 ， 内 存 管理 模块 返回 的 地 址 是 虚拟 地 址 ， 因 此 页 表 地 址 


也 是 虚拟 地 址 ， 所 以 在 把 页 表 加 载 到 CR3 之 前 ， 咱 们 要 将 其 转换 成 物理 地 址 。 


立 晶 和 

































































这 是 第 43 行 的 “pagedir_phy_addr = addr_v2p((uint32_t)p_thread->pgdir)” 完 成 的 ， 通 过 函数 addr_v2p 





























将 虚拟 地 址 p_thread->pgdir 转换 为 物理 地 址 ， 重 新 为 变量 pagedir_phy_addr 赋值 。 
































接着 在 第 47 行 ， 通 过 内 联 汇编 ， 将 pagedir_phy_addr 的 值 通过 mov 指令 写 入 到 寄存 器 CR3 中 ， 由 此 
实现 了 页 表 切 换 。 
本 节 最 后 要 介绍 的 函数 是 process_activate， 它 的 功能 有 两 个 ， 一 是 激活 线程 或 进程 的 页 表 ， 二 是 更 新 





tss 中 的 esp0 












































为 进程 的 特权 级 0 的 栈 。 大 伙 儿 知道 ， 进 程 与 线程 都 是 独立 的 执行 流 ， 它 们 有 各 自 的 栈 和 页 















































表 ， 只 不 过 线程 的 页 表 是 和 其 他 线程 共用 的 ， 而 进程 的 页 表 是 单独 的 。 进 程 或 线程 在 被 中 断 信 号 打 断 时 ， 
处 理 器 会 进入 0 特权 级 ,并 会 在 0 特权 级 栈 中 保存 进程 或 线程 的 上 下 文 环境 。 如 果 当 前 被 中 断 的 是 3 特权 




















































































































级 的 用 户 进 和 









































呈 ， 处 理 器 会 自动 到 tss 中 获取 esp0 的 值 作为 用 户 进程 在 内 核 态 〈0 特权 级 ) 的 栈 地 址 ， 如 果 




































































被 中 断 的 是 0 特权 级 的 内 核 线程 ， 由 于 内 核 线程 已 经 是 0 特权 级 ， 进 入 中 断后 不 涉及 特权 级 的 改变 ， 所 以 
处 理 器 并 不 会 到 tss 中 获取 esp0， 言 外 之 意 是 即使 咱们 更 新 了 线程 tss 中 的 esp0， 处 理 器 也 不 会 使 用 它 ， 
咱们 就 白费 劲 了 。 所 以 ， 在 代码 11-6-1 的 第 57 行 用 这 人 句 代码 “if (p_thread->pgdir)” 来 判断 : 如 果 是 用 户 






















































































进程 的 话 才 去 更 新 tss 中 的 esp0。 这 两 个 功能 的 实现 ， 就 是 调用 tss.c 中 定义 的 update_tss_esp 和 上 面 刚 介 


绍 的 page_d 
process_activ 












































ir_activate 完成 的 。 顺 便 说 一 下 ， 只 有 在 任务 调度 时 才 会 切换 页 表 及 更 新 0 级 栈 ， 因 此 
ate 是 被 Schedule 调用 的 ， 后 面 咱们 会 梳理 用 户 进 程 创建 的 流程 。 
















































































由 于 和 














j 户 进程 相关 的 内 容 有 点 多 ， 本 节 就 先 到 这 啦 ， 前 面 还 有 一 段 路 要 
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麟 
8 














11.3.7 
我 们 
下 一 步 之 


bss 简介 
要 实现 


本 
1 


1T， 咱 





























用 户 





进程 的 








儿 再 回顾 
和 链接 器 
位 于 堆 的 




















j 户 进程 的 堆 内 存 管理 























竺 就 要 着 手 规划 





11.3 ”实现 用 户 进程 

















j 户 进程 内 


存 空 间 布 





和” 现 7 








门 要 先 介 绍 点 bss 的 内 容 ， 
内 存 空间 布局 我 们 也 参照 着 Linux 下 C 程序 的 布 








它 涉及 到 咀 们 堆 内 存 管 理 





的 基础 工作 了 。 在 继续 

















的 实现 。 























攻 | 





局 方案 来 做 ， 也 就 是 图 11-15， 麻 烦 大 伙 




















下 该 ， 在 C 程 











序 的 内 存 空 间 ， 
规划 地 址 空间 ， 在 程序 被 





， 他 


于 低 处 的 三 个 段 是 





尺码 段 、 数 据 段 和 bss 段 ， 它 们 由 编译 器 


























它们 











CC 有 0 ， 





用 空 








分 配 内 存 。 堆 向 上 扩展 , 栈 向 下 扩展 ， 
， 堆 的 起 始 


在 Linux : 








除了 代码 段 、 数 








操作 系统 加 载 之 前 它们 地 址 就 国 
k 享 4GB 空间 中 














定 了 。 而 堆 是 位 于 bss 段 的 上 面 ， 栈 是 

















中 段 及 顶端 命令 行 参数 和 环境 变量 等 以 外 的 其 余 可 

















间 ， 它 们 的 地 址 由 操作 系统 来 管理 









































床 地 








址 并 不 固 








地 址 是 





定 ， 这 取决 于 

















我 


是 要 安排 


门 不 需要 这 么 麻烦 ， 有 更 


在 bss 以 








上 的 ， 按 理 








中 

















固定 
内 存 的 分 配 情况 ， 堆 








对 此 在 程序 












































口 




















大 伙 
编 阶段 将 
来 逻辑 地 








儿 知 
汇编 程序 源码 中 




















划分 程序 区 域 ， 虽 
所 说 的 segment 和 section 是 指 汇 
编译 、 链 接 中 的 section 和 segment) 























简单 4 








道 ，C 程序 大 体 上 分 为 预 处 理 、 
的 关键 字 section 或 segment (3 
中 都 称 此 程序 区 域 为 段 ， 但 实际 上 它们 就 是 节 section。 注 
语法 中 的 关键 字 ， 仅 指 它 们 在 汇编 
译 成 节 ， 也 就 是 之 前 介绍 的 section， 此 时 只 是 生成 了 





然 很 多 书 











说 我 们 
事 的 做 法 ， 


编 


/~ 

















为 












































， 在 程序 加 载 时 为 用 


编译 、 汇 编 和 














户 进程 分 配 栈 空间 ， 运 行 过 程 
的 加 载 之 初 , 操作 系统 必须 为 堆 和 栈 分 别 
由 struct mm_struct 结构 中 的 start_brk 来 指定 的 ， 堆 的 结 




















为 进程 从 堆 ! 
肯定 起 始 地 址 。 




















的 上 边界 是 
要 找到 bss 的 结束 半 








址 就 可 以 自由 规划 堆 的 起 始 地 址 了 。 但 
解释 清楚 这 个 问题 ， 这 里 对 bss 多 说 两 句 。 

[链接 四 个 阶段 。 根 据 语法 规则 ， 编 译 器 会 在 汇 
L 编 源码 








1 同 结构 中 的 brk 来 标记 的 。 























5 
头 






































， 通 常用 语法 关键 字 section 或 segment 



































忆 啦 》 这 里 









































标 文件 


链接 器 将 这 些 有 
我 们 平时 所 说 的 C 程序 内 存 空 | 
合并 成 


为 什 


大 伙 


的 访问 属 





























的 这 些 节 还 不 是 程序 空 





间 ， 


























代码 














的 语法 意义 相同 ， 并 不 是 指 
标 文件 ， 目 















































的 独立 的 代码 段 或 数据 段 ， 或 者 说 仅仅 是 代码 段 或 数据 段 的 一 部 分 。 














么 要 将 section 合 3 





1 











如 果 程 序 对 茶 片 内 存 的 访问 方式 不 
限 ， 比 如 对 代码 这 种 具备 只 读 属性 的 
才能 执行 ， 





设置 的 权 
GP 异常 。 
适 的 段 

















程序 必须 要 加 载 





述 符 指 向 的 内 存 中 。 比 妇 
读 、 可 执行 属性 的 段 描述 符 来 访问 ,否则 若 通 过 








标 文 件 中 属性 相 











目 中 的 数 提 
segment? 这 么 做 的 原因 也 很 简 自 
为 了 操作 系统 在 加 载 程序 时 省 事 。 





司 的 节 (section) 合并 成 段 (segment)， 
居 段 、 代 码 段 就 是 指 合 3 











导 此 一 个 段 是 由 多 个 节 组 成 的 ， 
ff 后 的 segment。 



































L 已 经 知道 ,在 保护 模式 下 对 内 存 的 访问 必须 
h 权 限 忆 
该 内 存 所 对 应 的 段 描 述 
内 存 区 域 执行 了 写 操 


生 , 其 中 的 S$ 位 和 TYPE 位 可 组 合成 多 利 


符合 





是 为 了 保护 模式 下 的 安全 检查 ， 二 是 








六》 














要 经 过 


段 





i 述 符 ， 上段 描述 符 用 来 描述 一 段 内 存 区 域 

































































内 存 ! 





到 








为 了 











Ar 八 下 27 


付 写 女 








0 为 程序 中 








有 








/ 

















能 会 将 自己 的 指令 部 分 改写 ， 从 而 


AT 





引 




















有 可 




















起 破坏 。 处 理 器 对 内 存 访问 的 安全 检查 主要 体现 在 使 用 的 











三 





段 描述 条 








综 





A 


由 选择 子 决定 的 ， 而 


选择 














二 
= 

















得 知道 用 哪个 段 描述 符 来 匹配 程 ) 
运行 时 各 种 段 寄 存 器 (如 cs、ds) : 
上 所 述 ， 在 操作 系统 的 视角 中 ,， 它 只 关心 程序 中 这 些 节 的 属性 是 什么 ， 以 便 加 载 程序 时 为 其 分 配 不 同 





的 段 选择 子 ， 从 而 使 程序 内 存 # 
相同 的 节 合 并 到 
(1) 可 读 写 的 数据 ， 如 数 





属 改 

















二 | 























起 , 这 村 





的 选择 子 。 


























| 操作 系统 提供 


性 , 处 理 器 


At 


们 


j 这 些 属 性 来 限制 程序 对 内 存 的 使 用 
1 访问 内 存 时 所 使 用 的 选择 子 决定 ) : 
乍 ， 处 理 器 会 检查 到 这 种 情况 并 抛 出 






































( 



























































全 检查 ， 程 序 中 不 同属 性 的 节 必须 要 放置 到 合 
只 读 可 执行 的 指令 部 分 所 分 
与 属性 的 段 描述 符 















































只 











配 的 内 存 ， 最 好 是 通过 具有 
来 访问 指令 区 域 的 话 ， 程 序 有 可 












































旨 向 不 同 的 段 描述 符 ， 起 到 保护 内 存 的 作用 。 因 此 最 好 是 链接 器 把 


的 ， 所 以 针对 程序 
这 些 不 同属 性 的 区 域 片段 , 也 就 是 要 在 程序 








EL 二 HE、 广 季 
段 描述 符 ， 


生 的 区 域 ， 操 作 系统 
前 提前 设置 程序 在 















































不 同属 1 


Ce 


运行 之 


















































标 文 件 中 

















操作 系统 便 可 统一 为 其 分 配 内 存 了 。 按照 
居 节 .data 和 未 初始 化 节 .bss。 








属性 来 划分 节 , 大 致 上 有 三 种 类 型 。 





(2) 只 读 可 执行 的 代码 ， 如 代码 节 .text 和 初始 化 代码 节 .init。 


(3) 
经 过 


ei 


这 样 的 划分 ， 














只 读数 据 ， 如 只 


读数 和 


居 节 .rodata， 




















所 有 











链接 器 把 


也 就 是 C 程序 运行 时 内 存 空间 中 分 布 日 

















标 文 件 中 相同 属性 的 节 归 


节 都 可 归 




















般 情 况 下 字符 串 就 存储 在 此 节 。 














并 到 以 上 三 种 
并 之 后 的 节 




















， 这 相 





和 方便 了 操作 系统 加 载 程序 时 的 内 存 分 配 。 由 
的 集合 ， 便 称 为 segment, 它 存在 于 二 进 
的 代码 段 、 数 据 段 等 段 。 












































制 可 执行 文件 中 ， 
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现在 可 以 正式 说 说 bss 了 ， 我 们 已 经 知道 ，text 段 是 代码 段 ， 里 面 存放 的 是 程序 的 指令 ，data 段 是 数据 
段 ， 里 面 存 放 的 是 程序 运行 时 的 数据 ,它们 的 共同 点 是 都 存在 于 程序 文件 中 ， 也 就 是 在 文件 系统 中 存在 ， 原 
很 简单 ， 它 们 是 程序 运行 必 备 的 “材料 ” 必须 提前 准备 好 ， 基 本 上 是 固定 好 的 内 容 。 而 bss 并 不 存在 于 
程序 文件 中 ， 它 仅 存 在 于 内 存 中 ， 其 实际 内 容 是 在 程序 运行 过 程 中 才 产 生 的 ， 起 初 并 无 意义 ， 换 句 话 说 ， 程 
序 在 运行 时 的 那 一 瞬间 并 不 需要 bss， 因 此 完全 不 需要 事先 在 程序 文件 中 存在 ， 程 序 文件 中 仅 在 elf 头 中 有 
bss 节 的 虚拟 地 址 、 大 小 等 相关 记录 ， 这 通常 是 由 链接 器 来 处 理 的 ， 对 程序 运行 并 不 重要 ， 因 此 程序 文件 中 
并 不 存在 bss 实体 。bss 中 的 数据 是 未 初始 化 的 全 局 变量 和 局 部 静态 变量 ， 程 序 运 行 后 才 会 为 它们 赋值 ， 因 此 
在 程序 运行 之 初 ， 里 面 的 数据 没 意 义 ， 由 操作 系统 的 程序 加 载 器 将 其 置 为 0 就 可 以 了 ， 虽 然 这 些 未 初始 化 的 全 
局 变量 及 局 部 静态 变量 起 初 是 用 不 上 的 ， 但 它们 毕竟 也 是 变量 ， 即 使 是 短暂 的 生存 周期 也 要 占用 内 存 ， 必 须 
提前 为 它们 在 内 存 中 “ 占 好 座 ”， bss 区 域 的 目的 也 正在 于 此 ， 就 是 提前 为 这 些 未 初始 化 数据 预 留 内 存 空间 。 
EE 未 运行 之 前 或 运行 之 初 ， 程 序 中 bss 中 的 内 容 都 是 未 初始 化 的 数据 ， 它 们 也 是 变量 ， 只 
这 些 变量 的 值 在 最 初时 是 多 少 都 无 所 谓 , 它们 的 意义 是 在 运行 过 程 中 才 产 生 的 ， 故 程序 文件 中 无 需 存 
ee i ee 义 的 值 ， 
那 时 bss 开始 变 得 有 意义 ， 故 bss 仅 存在 于 内 存 中 。 您 看 ， 既 然 bss 中 的 数据 也 是 变量 ， 就 肯定 要 占用 内 
存 空 间 , 需要 把 空间 预 留 出 来 , 但 它们 并 不 在 文件 中 存在 , 对 于 这 种 只 占 内 存 又 不 占 文件 系统 空间 的 数据 ， 
链接 器 采取 了 合理 的 做 法 : 由 于 bss 中 的 内 容 是 变量 ， 其 属性 为 可 读 写 ， 这 和 数据 段 属性 一 致 ， 故 链接 器 
将 bss 占用 的 内 存 空间 大 小 合并 到 数据 段 占 用 的 内 存 中 ， 这 样 便 在 数据 段 中 预 留 出 bss 的 空间 以 供 程 
将 来 运行 时 使 用 。 注 意 ， 这 里 所 说 的 是 bss 的 尺寸 会 被 合并 到 数据 段 ， 并 不 是 bss 中 的 实际 内 容 也 会 被 合 
并 到 数据 段 中 ， 上 毕竟 起 初 bss 中 的 内 容 无 意义 ， 将 它 的 内 容 合并 到 其 他 段 中 真 的 是 “ 毫 无 意义 ”。 当 
文件 被 操作 系统 加 载 器 加 载 时 ， 加 载 器 会 为 程序 的 各 个 段 分 配 内 存 , 由 于 bss 已 被 归并 到 数据 段 中 ,， 故 bss 
仅 存 在 于 数据 段 所 在 的 内 存 中 。 因 此 ，bss 的 作用 就 是 为 程序 运行 过 程 中 使 用 的 未 初始 化 数据 变量 提前 预 
留 了 内 存 空间 。 程 序 的 bss 段 (数据 段 的 一 部 分 ) 会 由 该 加 载 器 填充 为 0。 由 此 可 见 ， 为 生成 在 某 操作 系 
统 下 运行 的 用 户 程序 ， 编 译 器 和 操作 系统 需要 相互 配合 。 
下 面 看 下 bss 在 实际 可 执行 文件 中 合并 的 情况 ， 我 们 拿 find 命令 来 举例 ， 如 图 11-18 所 示 。 


[work@localhost ~]$ readelf -e /bin/find 
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Section Headers: 
[Nr] Name Type Addr Off Size ES Filg Lk Inf AL 


[26] .data PROGBITS 0806f320 028320 000314 00 WA 


[27] .dynbss PROGBITS 0806f640 028640 000044 00 WA 
[28] .bss NOBITS 0806f684 028684|[000dc0]00 WA 


Program Headers: 
Type [| 
PHDR 0x000034 0x08047034 0x08047034 0x00100 0x00100 R E 0x4 
INTERP 0x000134 0x08047134 0x08047134 0x00013 0x00013 R ”0x1 
Requesting program interpreter: /lib/ld-linux.so.2] 
0x000000 0x08047000 0x08047000 0x27d24 0x27d24 R E 0x1000 
0x028000 0x0806f000 0x0806f000[0x00684 0x01444] RW 0x1000 
DYNAMIC 0x0928014 Ox0806f014 0x09806f014 0x000e0 0x000e0 RW 0x4 
NOTE 0x000148 0x08047148 0x08047148 0x00044 0x00044 R 0x4 
GNU_EH_FRAME ”0x09227f8 0x080697f8 0x0980697f8 0x00d24 0x00d24 R 0x4 
GNU_STACK 0x000000 0x00000000 0x00000000 0x00000 0x00000 RW 0x4 


Section to Segment mapping: 
Segment Sections... 


.interp 

.interp .note,ABI-tag .note.gnu.build-id .dynstr .gnu,liblist ,gnu.conflict 
.gnu.hash .dynsym .gnu.version .gnu.version_r .rel.dyn .rel.plt .init .ptLt [text] .fini 
.rodata .eh_frame_hdr .eh_frame 
.Ctors .dtors .jcr .dynamic .got .got.plt [data |.dynbss[.bss | 

.dynamic 

.note.ABI-tag .note,.gnu.build-id 

.eh_frame_hdr 


[work@localhost ~]$ sh ~/tool/calculator.sh OxdcO+0x00684 x 





和 图 11-18 find 命令 的 elf 头 
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这 里 用 readelf -e /bin/find 查看 find 程序 的 elf 头 ， 下 面 的 是 readelf 的 输出 。 在 “Section Headers” 中 是 find 





















































程序 全 部 节 的 信息 ， 索 引 为 28 的 节 是 .bss， 我 们 在 图 中 已 经 用 下 画 线 标 出 来 了 ， 它 的 Size 为 0x000dc0， 表 示 
bss 节 占 用 的 大 小 。 在 “Program Headers” 中 是 find 程序 全 部 段 的 信息 ， 第 0 个 段 是 PHDR 段 ， 它 的 类 型 





















































是 程序 头 表 ， 表 示 程 请 


指向 ELF 解析 器 的 路 径 ， 咱 们 要 关注 




















头 表 在 文件 或 内 存 中 的 位 置 及 大 小 ， 第 1 个 段 是 INTERP 段 ， 它 是 个 字符 串 ， 用 来 






























































下 面 的 两 个 类 型 为 LOAD 的 段 ， 它 表示 这 是 一 个 可 装载 的 段 ， 操 作 
































系统 的 程序 加 载 器 负责 把 此 类 型 的 段 找 贝 到 此 段 规定 的 内 存 地 址 处 , 也 就 是 VirtAddr 中 记录 的 地 址 , 用 户 





程序 的 装载 本 质 上 就 是 将 用 户 程序 





















































类 型 为 LOAD 的 段 拷贝 到 指定 的 内 存 地 址 。 





在 图 中 下 半 部 分 是 “Section to Segment mapping:” 这 是 链接 器 将 节 合 并 为 段 的 结果 展示 ， 也 就 是 哪 


























些 节 合 并 到 哪个 段 中 。 我 们 看 索引 为 02 的 段 ， 右 边 有 三 行 的 节 合并 到 此 段 中 ， 其 中 包括 了 .text 节 ， 这 是 














标准 的 代码 节 ， 这 在 一 定 程度 





















































上 说 明 此 段 很 可 能 是 代码 段 ， 为 了 验证 ， 我 们 可 以 用 此 索引 02 在 “Program 




















Headers” 中 查看 第 02 个 段 ， 该 段 是 类 型 为 LOAD 的 段 ， 其 Flg 标志 中 是 “RE”， 这 表示 可 读 可 执行 ， 充 
分 说 明了 代码 节 .text 确实 被 合并 成 了 代码 段 ， 这 里 已 经 用 线 把 它们 的 对 应 关系 连接 起 来 了 。“Section to 








Segment mapping: 


2 [ 





















































索引 为 03 的 段 ， 其 包括 一 行 的 节 ， 里 面 有 数据 节 .data， 这 说 明 03 段 很 可 能 是 数据 段 ， 

















此 段 中 还 包括 了 .bss 节 ， 这 说 明 链接 器 将 .bss 节 、.data 节 等 合并 到 了 同一 个 段 中 ， 该 段 很 可 能 是 数据 段 ， 为 











了 验证 是 否 为 数 提 





中 段 ， 同 样 用 此 索引 





03 到 “Program Headers” 中 查看 第 03 个 段 ， 该 段 是 第 二 个 LOAD 段 ， 


























其 Flg 为 “RW” 即 “可 读 写 ”， 充分 说 明 此 段 是 数据 段 ，.text 和 .data 等 节 的 合并 关系 也 用 线 标 出 了 。 

















通常 情况 下 ， 段 在 文件 中 的 大 小 FileSiz 和 在 内 存 中 的 大 小 MemSiz 应 该 是 一 致 的 ， 而 且 在 任何 情况 下 ， 


二 还 
3 
















































































语言 中 ， 函 数 malloc 
竺 程序 加 载 时 由 操作 系统 加 载 器 为 程序 段 分 配 的 “固定 、 静 态 ” 内 存 ， 这 种 动态 






































的 MemSiz 都 不 会 比 FileSiz 小 。 如 果 在 某 段 中 合并 了 bss 节 ， 该 段 的 MemSiz 应 该 大 于 FileSiz， 原 因 是 bss 
占用 文件 系统 空间 ， 只 占用 内 存 空 间 。 根据 此 思路 ， 我们 顺便 在 数值 上 也 验证 下 .bss 节 是 否 被 合并 到 了 数据 
段 中 ， 您 看 ， 数 据 段 的 FileSiz 和 MemsSiz 不 一 致 ， 分 别 是 0x00684 和 0x01444。 这 两 个 数值 的 差 恰好 是 .bss 节 的 












































大 小 , 在 图 中 的 最 下 行 ， 这 里 是 用 .bss 节 内 存 大 小 0xdc0+ 数 据 段 的 文件 大 小 0x00684 来 验证 的 ， 其 和 为 数据 段 的 
内 存 大 小 0x1444， 与 我 们 的 预想 吻合 ， 











分 证 明 bss 合并 到 数据 段 中 了 。 好 啦 ， 有 关 bss 的 内 容 就 到 此 为 止 。 














说 了 这 么 多 bss 的 内 容 ， 您 不 禁 要 问 了 ， 我 这 是 要 干吗 ? 咳 咳 ， 还 不 是 为 了 要 介绍 堆 的 实现 嘛 。 在 C 









































] 来 动态 申 i 




















从 申请 者 自己 的 堆 中 分 配 的 。 











我 们 在 不 久 的 将 来 也 要 实现 malloc， 因 此 也 必须 支持 堆 内 存 管 
































内 存 ， 所 谓 的 动态 内 存 申请 ， 是 指 程 序 在 运行 中 申请 的 内 存 ， 并 不 是 
的 内 存 就 是 操作 系统 
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HH 


里 ， 前 面 说 过 了 ， 堆 的 起 始 地 址 应 该 在 

















bss 之 上 ， 现 在 我 们 知道 bss 已 经 被 归并 到 数据 段 了 ， 数 据 段 的 类 型 是 可 加 载 的 LOAD 型 ， 程 序 将 来 加 载 
运行 时 , 操作 系统 的 程序 加 载 器 会 为 该 程序 的 数据 段 分 配 内 存 , 也 就 是 bss 段 的 内 存 区 域 也 会 顺便 被 分 配 ， 


因此 我 们 不 需要 单独 知道 bss 的 结 
























































束 地 址 ， 只 要 知道 数据 段 的 起 始 地 址 及 大 小 ， 便 可 以 确定 堆 的 起 始 地 址 





























了 。 有 关 程 序 加 载 的 内 容 ， 将 来 我 们 实现 了 从 文件 系统 中 加 载运 行 用 户 程 序 时 大 伙 儿 就 清楚 了 ， 目 前 我 们 








只 要 了 解 虽然 








的 起 始 地 址 应 该 在 bss 之 上 












































但 由 于 bss 已 融合 到 数据 段 中 ， 要 实现 用 户 进程 的 堆 ， 已 不 















































需要 知道 bss 的 结束 地 址 ， 将 来 咀 们 加 载 程序 时 会 获取 程序 段 的 起 始 地 址 及 大 小 ， 因 此 只 要 堆 的 起 始 地 址 












































在 用 户 进程 地 址 最 高 的 段 之 上 就 可 以 了 。 




















好 啦 ， 本 节 到 此 结束 ， 下 一 节 
11.3.8 “实现 用 户 进 程 一 下 


上 回 说 到 process.c 的 上 


略 














们 继续 完成 用 户 进程 。 









































EF 场 ， 下 面 继续 介绍 实现 用 户 进程 的 其 他 函数 ， 大 伙 儿 请 看 代码 11-6-2。 




















代码 11-6-2 (project/c11/b/userprog/process.c ) 














63 /* 创建 页 











录 表 ， 将 当前 页 表 的 表示 内 核 空间 的 pde 复制 ， 








64 * 成 功 贝 


65 mh 七 32 七 示 Cre 





返 








可 页 





录 的 虚拟 地 址 ， 

















ate page dir(void) 








否则 返回 -1 */ 
















































































66 
67 外 进程 的 页 表 不 能 让 用 户 直 接 访问 到 ， 所 以 在 内 核 空 间 来 申请 */ 
68 uint32 tx page dir vaddr = get kernel pages (1); 
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69 if (page dir vaddr == NULL) { 

70 console put str("create page dir: get kernel page failed!"); 
71 return NULL; 

了 2 4‘ 

73 


了 起 /太太 大 大 火炎 类 炎炎 炎炎 炎炎 炎炎 类 大大 大大 大 大 大 大 于 先 复制 页 表 大大 大 炎炎 类 类 类 类 大大 类 大 大 类 大 类 大大 类 大 类 大 大 大 大 大 了 


75 /* page dir vaddr + 0x300*4 是 内 核 页 目录 的 第 768 项 */ 





























76 memcpy ( (uint32 t*) ((uint32 t)page dir vaddr + 0x300*4),\ 

(uint32 t*) (Oxfffff000+0x300*4), \ 

1024); 
了 学 /类 业 太 火炎 大火 类 类 大 大头 大 火炎 类 类 类 类 大 类 六 大 炎炎 大 炎炎 类 大 类 六 大 类 类 大 类 类 大 大 类 类 大 大 大 大 类 类 大 类 交大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 了 
78 











79 /六 大 火炎 火炎 火炎 炎炎 炎炎 炎炎 大大 大 大 大 大 2 更 新 页 目录 地 址 类 关 大米 类 大米 大业 类 类 类 类 类 大 类 类 大 类 类 类 了/ 











80 uint32 t new page dir phy addr = addr v2p((uint32 t)page dir vaddqr) 
81 /* 页 目录 地 址 是 存 入 在 页 目录 的 最 后 一 项 ， 

更 新 页 目录 地 址 为 新 页 目录 的 物理 地 址 */ 

82 page dir vaddr[1023] = new page dir phy addr\ 

| FG USU | PGRWW | PGP 1; 


83 /类 业 太 炎炎 炎炎 类 六 大 类 类 大 炎炎 类 类 类 六 大 类 类 大 类 类 类 类 类 类 大 类 大大 炎炎 大 类 类 大 大 类 类 大 类 类 大 类 大 大 类 大大 大 大 大 大 大 大 大 大 大 大 大 大 太阴 


































































































84 return page dir vaddr; 
85 } 

86 

87 /* 创建 用 户 进程 虚拟 地 址 位 图 */ 



































88 void create user vaddr bitmap (struct task struct* user prog) { 





































































































89 User prog->userprog vaddr.vaddr start = USER VADDR START; 
90 uint32 七 bitmap pg _ cnt = DIV _ ROUND UP(\ 
(0xc0000000 - USER VADDR START) / PG SIZE / 8, \ 
PG_SIZE); 
91 User prog->userprog vaddr.vaddr bitmap.bits =\ 
get kernel pages (bitmap pg cnt); 
92 UsSer prog->userprog vaddr.vaddr bitmap.btmp bytes len =\ 
(0xc0000000 - USER VADDR START) / PG SIZE / 8; 
93 bitmap init (&user prog->userprog vaddr.vaddr bitmap); 
94 } 
95 
96 /* 创建 用 户 进 程 */ 
97 Void process execute(void* filename, char* name) { 
98 /* pcb 内 核 的 数据 结构 ， 由 内 核 来 维护 进程 信息 ， 
因此 要 在 内 核 内 存 池 中 申请 */ 
99 struct task struct* thread = get kernel pages (1); 
100 init thread (thread, name, default prio); 
0 create user vaddr bitmap (thread); 
02 thread create (thread, start process, filename); 
103 thread->pgdir = create page dir(); 
104 
十 95 enum intr status old status = intr disable(); 
106 ASSERT (!elem find(&thread ready list, &thread->general tag)); 
107 list append(&thread ready list, &thread->general tag); 
108 
109 ASSERT (!elem find(&thread all list, &thread->all list tag)); 
小 证人 list append(&thread all list, &thread->all list tag); 
111 intr set status(old status); 
L112: 4 














在 代码 11-6-2 的 开头 是 函数 create_page_dir， 此 函数 用 来 创建 页 表 ， 确 切 地 说 是 创建 页 目录 表 。 
大 伙 儿 知道 ， 操 作 系统 是 为 用 户 进程 服务 的 ， 它 提供 了 各 种 各 样 的 系统 功能 供用 户 进程 调用 。 为 了 用 
户 进程 可 以 访问 到 内 核 服 务 ， 必 须 确保 用 户 进 程 必须 在 自己 的 地 址 空间 中 能 够 访问 到 内 核 才 行 ,也 就 是 说 
内 核 空间 必须 是 用 户 空间 的 一 部 分 ， 咱 们 看 看 是 如 何 做 到 这 一 点 的 。 
虚拟 地 址 空间 由 页 表 来 控制 ， 页 表 由 操作 系统 管理 ， 因 此 用 户 进 程 的 虚拟 空间 是 由 操作 系统 规划 分 配 的 。 
每 个 用 户 进程 都 拥有 4GB 虚拟 地 址 空间 ， 操 作 系 统 把 这 4GB 空间 分 为 用 户 空间 和 内 核 空间 两 部 分 ， 因 此 内 
核 空 间 和 用 户 空 间 的 大 小 是 不 固定 的 ， 它 们 可 以 以 任意 比例 分 配 这 4GB， 比 如 内 核 和 用 户 空间 可 以 各 占 2GB。 
Linux 分 了 3GB 给 用 户 空间 ， 自 己 本 身 占 1GB， 所 有 用 户 进程 的 最 高 1GB 空间 都 指向 Linux 所 在 的 内 存 
空间 ， 这 样 操作 系统 就 被 所 有 用 户 进 程 共 享 。 这 种 共享 操作 系统 的 内 存 布局 如 图 11-19 所 示 。 
让 操作 系统 被 所 有 用 户 进程 共享 ， 这 是 如 何 做 到 的 呢 ? 
我 想 您 可 能 想到 了 ， 既 然 用 户 空 间 是 由 页 表 来 表示 的 ， 那 么 必须 通过 设置 页 表 来 解决 。 
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让 我 介 录 表 寄存 器 CR3 中 的 是 页 


物理 地 址 ， 








] 复 习 





下 页 表 的 知识 ,我 们 
页 目录 表 中 一 共 包 含 1024 








前 使 用 的 是 

















个 


表 可 


洁 











页 目录 项 仅 表 示 1 个 页 表 ， 
[容纳 1024 个 页 表 项 (pte )， 页 表 ] 
框 ， 页 表 项 中 存储 的 是 4KB 大 人 小 

















二 级 页 表 ， 加载 到 页 
个 页 目录 项 (pde)， 页 目录 项 大 小 为 4B， 故 页 
页 目录 项 中 存储 的 是 页 表 所 在 物理 页 框 的 物理 


























录 表 的 





























录 表 大 小 为 4KB。 每 





地 址 及 页 目录 项 的 属性 。 

















硕大 小 为 4B， 故 每 个 页 表 本 身 








占用 4KB 。 





每 个 页 表 项 仅 表 示 


每 个 页 


个 物理 页 








的 物理 页 框 的 物理 地 址 及 页 表 项 的 属 | 





oe 











1024*4KB=4MB， 一 个 页 目录 表 中 可 包含 1024 个 页 表 ， 因 此 可 表示 1024*4MB=4GB 大 小 的 地 址 空间 。 


目前 我 
指向 的 页 表 中 ， 这 一 
目前 页 表 与 内 核 的 关系 如 图 
图 11-20 是 任意 进程 的 页 目录 表 ， 


满 )， 























共 是 256 


门 的 内 核 位 于 0xc0000000 以 上 的 地 址 空间 ， 也 就 是 位 于 页 目录 表 中 第 768 一 1023 个 页 目录 项 所 


1GB 空间 《当然 我 们 的 内 核 没 那么 大 ， 不 会 把 1GB 




















个 页 








录 项 ， 即 
11-20 所 示 。 
其 中 ， 















































目录 表 中 第 768 一 1023 个 页 目录 项 。 
用 户 进程 的 4GB 虚 拟 地 址 空间 中 ， 


3GB 


用 户 空 间 














4 图 11-19 ”操作 系统 被 所 有 


最 高 1GB 空 间 指向 内 核 





用 户 空间 


页 目录 表 





第 1023 个 页 目录 项 





物理 内 存 








普通 物理 页 





页 目录 表 中 





第 1023 个 页 表 所 











3GB 





第 768 个 页 目录 项 











页 目录 表 中 




















第 767 个 页 目录 项 
用 户 进程 四 
页 目录 项 





占 物理 页 














第 0 个 页 目录 项 






































户 进程 共享 


























大 伙 儿 知道 ,即使 是 同一 个 用 户 程序 在 被 加 载 多 次 时 ， 操 作 系统 每 次 为 它们 分 配 的 物理 





| 于 第 





0 一 767 个 页 


























录 项 属于 用 户 
“内 核 页 目录 表 中 第 0 个 页 表 所 占 物 理 


空间 ， 图 11-20 只 
页 ”未 画 出 相关 页 表 。 


























































































































想 表达 内 核 所 月 





11-20 ”内核 页 目录 



































定 ， 但 操作 系统 不 一 样 。 
首先 ， 操 作 系统 启动 后 ， 其 在 物理 内 存 中 的 位 置 是 固定 的 ， 不 会 再 变动 。 
其 次 ， 操 作 系统 只 有 一 套 页 表 ， 它 们 也 是 固定 的 。 
我 们 的 目的 是 只 要 在 用 户 进程 中 能 够 访问 到 内 核 即 可 ， 现 在 有 两 个 方法 。 





(1) 为 每 一 个 用 户 进 程 单独 准备 一 份 内 核 的 拷贝 映像 。 


(2) 为 每 一 个 用 户 进程 准 
第 1 个 办 法 不 太 理 想 ， 
先 将 数据 缓存 到 硬 





























盘 ， 然 后 借 




















备 一 





助 pagefault 异常 将 数据 调 回 内 存 ， 


方法 ， 为 内 核准 备 “ 符 号 链接 ” 


来 个 4 











\ 插 | 





1， 什 么 是 














把 文件 名 型 














口 ， 相 当 于 为 原文 件 起 个 别名 ， 
如 图 所 示 ， 原 文件 obj 是 





“sl2_to_obj 








解 为 存储 在 磁盘 上 的 文件 实体 的 访问 入 口 


符号 链接 ? 
符号 链接 是 Linux 系统 中 的 概念 。 




















都 有 名 称 ， 对 于 





文件 














就 ee 和 小 名 ,都 是 指 同 一 个 人 。 











是 空 的 ， 








Se 














份 内 核 的 符号 链接 〈 软 链接 )。 
进程 越 多 ， 内 核 拷贝 越 多 ， 这 受 限 于 物理 

















但 这 种 做 法 效率 太 低 了 ， 





内 核 页 表 





第 1023 个 页 表 项 | 











第 768 个 页 表 项 |-: 

















第 0 个 页 表 项 “|--; 








第 1023 个 页 表 项 | } 











第 768 个 页 表 项 了 | 

















第 0 个 页 表 项 _ 上-; 





有 的 页 表 ， 故 在 中 间 的 物理 内 存 中 ， 




















j 户 来 说 ， 文 件 是 通过 文件 
。 符 号 链接 是 为 同一 个 文件 实体 多 创建 了 一 个 访问 入 
咱们 拿 图 11-21 来 说 明 符 号 链接 。 

n 命令 为 obj 文件 创建 了 2 个 符号 链接 ， 分 别名 为 “sl1_to_obj” 和 
” 也 就 是 说 ， 对 于 文件 ee 在 磁盘 上 的 文件 实体 来 说 ， 现 在 除了 文件 

















名 obj 外 ， 


内 存 也 不 会 


生 ， 因 此 每 个 页 表 可 表示 的 地 址 空间 为 


空间 占 


户 进程 占据 页 目录 表 中 第 0 一 767 个 页 目录 项 ， 内 核 占据 页 


i 








型 





内 存 大 小 及 实际 内 核 大 小 ， 的 > 








咱们 看 看 第 














名 来 访问 的 ， 可 以 


还 可 以 通过 
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sl 1_to_ob] 和 和 国 sl2_to_ob] 访 问 它 o 接 下 来 分 别 通过 文件 A [work@localhost tmp]$ touch obj 
obj、“sll_to_obj” 和 “sl2_to_obj 
通过 cat 命令 显 


此 ， 符 号 链 

















人 小] 


重 曲 














插播 结束 ， 赶 紧 














十 
页 表 是 记录 在 页 目 











存 的 作 


用 
内 核 所 在 物理 











内 存 的 入 


























也 就 是 


口 即 可 。 











9》 生 之 zw Ar 466 


与 子 付 ab 











C”、 “xyz” 和 123 2 





























来 。 





示 文 件 内 容 ， 发 现 都 是 写 进 了 同一 个 文件 。 因 [和 全 拉 [ 于 王 5 和 
接 的 作用 就 是 多 了 个 “访问 入 


总 计 0 


[work@localhost tmp]$ cat obj 
[work@localhost tmp]$ ln -s obj sl1_to_obj 
[work@localhost tmp]$ ln -s obj sl2_to_obj 


-rw-rw-r-- 1 work work 0 03-20 14:50 obj 
lrwxrwxrwx 1 work work 3 03-20 14:51 sl1 to_obj -> obj 
lrwxrwxrwx 1 work work 3 03-20 14:51 sl2_to_obj -> obj 


[work@localhost tmp]$ echo 'abc' >> obj 


录 项 中 , 此 处 页 目录 项 对 于 内 核 物理 内 “| 




















abc 











abc 


Xxy: 














因此 ,为 了 访问 到 内 核 , 我们 只 要 给 每 个 
问 内 核 的 入 





























用 内 核 页 














合 

















核 所 在 的 
能 让 用 户 进程 的 高 1GB 空 








巴 用 户 进 程 页 目录 表 : 
录 表 的 第 768 一 1023 个 页 
页 目录 项 复制 到 进程 页 目录 表 中 同等 位 置 ， 这 样 就 
































] 户 进程 创建 访 





4 
work@localhost tmp]$ cat sl1_to_obj 


> 相 当 于 Linux 中 文件 的 符号 链接 ， 风 目 录 项 是 访 问 [work@localhost tmp]$ echo 'xyz' >> sl1_to_obj 
[work@localhost tmp]$ cat obj 


[work@localhost tmp]$ echo '123' >> sl2_to_obj 


的 第 768 一 1023 个 页 目 录 项 [work@localhost tmp]$ cat obj 




















录 项 代 





村， 其 实 就 是 将 



































间 指 向 内 核 。 








每 创建 


个 新 的 用 户 i 








程 , 就 























将 内 核 页 目录 项 复制 到 用 户 
































进程 的 页 




















而 实现 了 攻 











11-19 中 的 所 有 用 户 进程 共享 内 核 。 





录 表 ， 这 样 就 为 

















内 核 物理 内 存 创 建 了 多 个 入 口 ， 从 









































好 ， 咱 们 已 经 讨论 清楚 了 进程 共享 内 核 的 原理 ， 函 数 


create_page_dir 正 是 按照 此 原理 实现 的 ， 趾 


A 





page_dir_vaddr 中 
接 下 来 的 了 












































门 现在 说 代码 。 



































第 68 行 ， 通 过 get kernel _pages(]) 在 
， 注 意 ，page_dir_vaddr 中 
[ 作 分 为 两 部 分 ， 首先 我 人 














门 要 和 














内 核 内 存 池 中 申请 一 页 内 
的 值 是 虚拟 地 址 。 



































| 























巴 内 核 的 页 目录 项 复制 到 用 户 i 


过 第 76 行 的 memcpy 完成 的 ， 咱 们 分 析 下 这 人 句 代码 。 


memcpy 的 多 
其 中 page_dir_vaddr 是 为 用 
的 大 小 ，0x300*4 表示 768 个 页 目录 项 的 偏 移 量 ， 因 此 ， 这 表示 复制 的 目标 地 址 为 偏 移 月 
地 方 ， 此 处 正 是 内 核 起 始 地 址 0xc0000000 被 映射 
是 复制 的 源 地 址 ， 此 处 的 实 参 是 (uint32_t*)(OxffffFF000+0x300*4)， 用 
， 其 中 Oxfffff000 便 是 用 来 访问 内 核 页 目 
扁 移 量 ， 也 就 是 内 核 起 始 地 志 








基地 址 768 个 页 
memcpy 的 第 二 
建 是 在 内 核 中 完成 的 ， 
(也 是 第 0 个 页 目录 项 )，0x 
0xc0000000 所 在 的 页 目录 项 

memcpy 的 和 
这 样 内 核 
其 次 需 
这 么 做 的 原 
因此 内 核 需 要 知道 该 用 
例如 ， 如 果 
































户 进程 日 


录 项 区 
个 形 

















此 目前 是 在 内 核 
300*4 是 内 核 起 始 页 目录 项 在 页 目录 表 中 的 1 
此 Oxfffff000+0x300*4 是 内 核 页 





bh 址 ， 因 

















敬一 个 形 参 是 复制 的 目标 地 址 ， 出 
Fi 请 作为 页 目 



























































的 页 表 





三 个 形 参 是 复 f 




















占用 的 页 目 











录 项 被 复制 到 了 用 户 进程 的 页 目 























三 | 


地 址 存储 到 指针 变 直 





员 | 
































处 的 实 参 为 (uint32_b9((uint32_bpage_dir_vaddr + 0x300*4)， 
录 表 的 基地 址 ，0x300 是 十 进 制 的 768, 4 是 每 个 页 








录 项 


















































有 户 进程 页 目录 表 
的 页 表 所 在 的 页 目 





录 项 地 址 。 
户 进 程 的 创 























录 表 的 基地 






































判 的 字 节 量 ， 这 里 是 1024， 即 1024/4=256 个 页 
录 表 中 ， 也 就 














要 把 用 户 页 目录 表 中 最 后 





个 页 目录 项 更 新 为 用 户 进程 自己 的 页 目录 表 的 物理 













































































请 的 内 存 大 小 跨越 了 物理 








页 























程 能 够 使 





因 是 将 来 用 户 进程 
”进程 的 页 目录 表 在 咀 
通过 系统 调用 











j 户 进 和 











运行 时 ， 执 行 期 间 有 可 能 会 有 页 表 : 






































了 里。 




















录 表 中 第 768 个 页 






























































录 项 的 地 址 。 


录 项 的 大 小 。 
是 为 用 户 进程 创建 了 访问 内 核 的 入 口 。 


地 址 。 








操作 ， 页 表 操 作 是 










































































录 项 和 页 表 ] 






































(大 于 4KB )， 
目录 项 和 在 页 表 中 创建 页 表 项 ， 否 则 会 引起 pagefault 异常 。 每 个 用 
系统 为 其 分 配 的 地 址 空间 ， 肯 定 需 要 内 核 事 先 在 该 用 户 进 
硕 ， 无 论 怎 样 操作 页 表 ， 必 须要 让 内 核 获 取 页 目录 表 的 地 








1 请 内 存 ， 它 会 陷入 内 核 态 ， 











那 时 内 核 除 了 为 其 分 配 内 存 外 ， 如 果 




















至 跨越 了 页 表 (大 于 4MB )， 还 需 


内 核 代 码 完成 的 ， 



































录 表 中 创建 


























单独 的 页 表 ， 为 了 证 用 户 进 




































































程 自己 的 页 表 中 创建 该 地 址 对 应 的 页 























上 。 大 伙 儿 已 经 知道 ， 内 核 访 问 页 目 











录 表 





过 虚拟 地 址 Oxfffff000， 这 会 访问 到 当前 页 目录 表 的 最 后 一 个 页 目录 项 。 为 了 保证 内 核 操作 的 是 该 








的 方法 是 通 ; 
用 户 进程 自己 的 页 目 
您 看 ,i 
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文 里 说 的 是 页 目录 表 的 物 天 
































录 表 ， 此 时 必须 把 页 目录 表 的 物理 地 址 写 入 用 户 进程 
地 址 ， 我 们 通过 get_kernel_pages 返 



































页 目录 表 的 最 后 一 个 页 目录 项 中 。 


的 page_dir_vaddr 是 虚拟 地 址 ， 


























因此 必须 将 其 转换 为 物理 地 址 。 这 是 在 第 80 行 用 函数 addr_v2p((uint32_tf)page_dir_vaddr) 完 成 的 ， 转 换 后 的 地 


址 存储 到 变量 














new_page_dir_phy_addr 中 。 





第 81 行 ， 














将 物理 地 址 new_page_dir_ phy_addr 加 上 属性 PG_US_U 和 PG_RW_W 以 及 PG_P_1 后， 


























用 户 进程 页 














录 表 的 最 后 一 个 页 目录 项 ， 即 page_dir_vaddr[1023]。 





























至 此 ，create_page_dir 函数 完成 ， 通 过 return page_dir_vaddr 返回 页 表 的 虚拟 地 址 。 




















我 们 知道 

















还 要 包括 用 户 进程 自己 的 堆 和 栈 ， 用 户 进程 可 以 在 自己 的 堆 中 申请 、 释 放 内 存 ， 因 此 必须 有 一 套 方法 跟踪 
内 存 的 分 配 情况 。 和 内 核 一 样 ， 用 户 进程 也 是 用 位 图 来 管理 
储 在 进程 pcb 中 的 userprog_vaddr 中 。 回忆 一 下 , 在 C 语 言 中 用 户 进 程 用 malloc 申请 的 内 存 是 在 进程 
的 堆 空间 中 ,操作 系统 在 用 户 进 程 的 堆 空间 找到 可 用 的 内 存 后 ， 返 回 该 内 存 空 间 的 起 始 地 址 。 我们 也 












































， 用 户 进程 有 自己 的 4GB 虚拟 地 址 空间 ， 这 空间 中 除了 存放 用 户 进程 E 







































































































































































地 址 分 配 的 ， 每 个 进程 有 自己 单独 的 位 图 








写 入 


己 的 指令 和 数据 外 ， 


， 存 



































自己 









































现 堆 内 存 管 理 









































程 虚拟 内 存 池 











为 用 户 进 程 创建 虚拟 


人 双 忆 日 








进程 ， 函 数 功 





user_prog- 














址 ， 您 可 以 用 


























， 为 了 实现 简单 ， 现 在 并 没有 为 堆 单独 规划 起 始 地 址 ， 而 是 由 用 户 进程 自己 的 虚拟 内 存 
管理 ,用 户 进 程 被 加 载 到 内 存 后 ， 剩 余 未 用 的 高 地 址 都 被 作为 堆 和 栈 的 共享 空间 。 下 面 我 们 介绍 用 






































的 创建 。 



















































































HA 
妇 闫 





池 统 





户 进 


内 存 池 的 函数 是 create_user_vaddr_bitmap, 它 接 受 一 个 参数 user_prog, 表示 用 户 





能 是 创建 用 户 进程 的 虚拟 地 址 位 图 user_prog->userprog_vaddr， 也 就 是 按照 用 户 进 程 的 虚拟 
内 存 信 息 初 始 化 位 图 结构 体 struct virtual_addr。 





































































































实现 除法 的 向 上 取 整 ， 此 宏 定 义 在 globalh 中 ， 原 型 是 : 


| #define DIV_ROUND_UP (xX, STEP) ((X + STEP - 1) / (STEP)) 


接 下 来 通过 get_kernel_pages(bitmap_pg_cnt) 为 位 图 分 配 内 存 ， 返 回 的 地 
userprog_vaddr.vaddr_bitmap.bits 中 。 然 后 将 位 图 





bytes_len 中 。 































































































最 后 调用 函数 bitmap_init(&user_prog->userprog_vaddr.vaddr_bitmap) 进 行 位 图 初始 化 ， 至 此 用 户 
地 址 位 图 创建 完成 。 











>userprog_vaddr.vaddr_start 是 位 图 中 所 管理 的 内 存 空间 的 起 始 地 址 ， 我 们 为 用 户 进程 定 的 起 始 
地 址 是 USER_VADDR_START， 该 值 定义 在 process.h 中 ， 其 值 为 0x8048000， 这 是 Linux 用 户 程序 入 口 地 
readelf 命令 查看 一 下 ， 大 部 分 可 执行 程序 的 “Entry point address” 都 是 在 0x8048000 附近 。 
变量 bitmap_pg_cnt 用 来 记录 位 图 需要 的 内 存 页 框 数 ， 计 算 过 程 中 用 到 了 宏 DIV_ROUND_UP， 它 用 来 








址 记录 在 位 图 指针 user_prog-> 
长 度 记 录 在 user_prog->userprog_vaddr. vaddr_bitmap.btmp 























本 节 中 最 后 要 介绍 的 函数 是 process_execute， 它 接受 两 个 参数 ，filename 是 用 户 进程 地 址 ，name 






































的 过 程 ， 大 家 应 该 很 熟悉 ， 而 且 经 过 前 面 元 长 相关 的 介绍 ， 我 相信 此 函数 不 用 多 说 了 。 

















11.3.9 ”让 进程 跑 起 来 一 一 用 户 进 程 的 调度 


在 这 之 前 






































， 我 们 已 经 将 进程 创建 好 ， 并 且 添 加 到 就 绪 队 列 中 了 ， 不 管 人 



































是 进 


创建 用 户 进程 flename 并 将 其 加 入 到 就 绪 队 列 等 待 执行 。 此 函数 的 实现 是 类 似 线程 创建 














E 务 是 线程 ， 还 是 进程 ， 




















王 务 调度 器 schedule 一 律 按 内 核 线程 来 处 理 。 内 核 线程 是 0 特权 级 ， 并且 它 使 用 内 核 的 页 表 ， 这 与 进 

















前 的 























见 代码 11-7。 


… 略 


OO 


oO 





























代码 11-7 (project/c11/b/ thread/thread.c ) 


#include "process.h" 





102 /* 实现 任务 调度 */ 
103 void schedule() { 


… 略 


水肥 入 thread tag = list pop(&thread ready list); 
122 struct task struct* next = \ 
elem2entry(struct task struct, general tag, thread tag); 














区 别 很 大 ， 进 程 的 特权 级 是 3， 并 且 有 自己 单独 的 页 表 ， 因 此 我 们 需要 改进 调度 器 ， 增 加 对 进程 的 处 理 。 


程 的 
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123 next—->status = TASK RUNNING; 
124 

125 /* 激活 任务 页 表 等 */ 

126 process activate (next); 

二 之 7 

128 Switch to (cur，next) ; 

二 299 




















这 次 我 们 在 thread.c 中 需要 修改 schedule， 修 改 的 内 容 也 很 简单 ， 就 是 在 第 126 行 增加 了 代码 “process_ 
activate(next);”，process_activate 除了 用 来 更 新 任务 的 页 表 外 ,还 要 根据 任务 是 否 为 进程 , 修改 tss 中 的 esp0， 
此 函数 之 前 已 经 介绍 了 。 

好 啦 ， 本 节 的 内 容 就 这 么 少 ， 下 一 节 咱 们 要 实际 创建 用 户 进 程 了 。 


11.3.10 ”测试 用 户 进程 


用 户 进 程 的 创建 是 由 函数 process_execute 完成 的 ， 本 节 咱 们 将 在 main.c 中 调用 它 ， 创 建 两 个 用 户 进 
程 。 上 菜 了 ， 请 见 代 码 11-8。 



































































































































代码 11-8 (project/c11/b/kernel/main.c ) 
… 略 


#include "Process .hn 


void k thread a(voidr) 
9 void k thread b (voidqx) 7 

10 void u prog al(void); 

11 void u prog pb (void) ; 


12 :int test var a = 0, test var b = 0;，; 

13 

14 int main(void) { 

15 put_str("I am kernel\n"); 

16 init all(); 

LF 

18 thread start ("k thread a", 31, k thread a, "argA "); 
19 thread start ("k thread b", 31, k thread b, "argB "); 
20 process execute(u prog a, "user prog a"); 

之 于 process execute(u prog b, "user prog b"); 

22 

之 3 intr enable(); 

24 while(1); 

25 return 0; 

26 } 

27 


28 /* 在 线程 中 运行 的 函数 */ 
29 void k thread al(lvoid* arg) { 








30 char* para = arg; 

3 while(1) { 

32 console put str("v a:0x"); 
33 console put int (test Var a); 
34 } 

So 

36 


37 /x* 在 线程 中 运行 的 函数 */ 
38 void k thread bl(void* arg) { 






































39 char* para = arg; 

40 while(1) { 

41 console put str(" Vv b:0x"); 
42 console put int (test Var b); 
43 } 

44 } 

45 

46 /* 测试 用 户 进 程 */ 

47 void u prog a(lvoid) { 

48 while(1) { 

49 test var at+t+;}; 

50 } 

D1 中 

52 





























53 /* 测试 用 户 进 程 */ 


520 


54 void u prog pb (voidq) { 


55 while(1) { 

56 test var bt++; 
3 } 

58 1 


代码 11-8 中 ， 我 们 在 第 18 一 21 行 














先 说 一 下 进程 吧 ， 第 20 行 用 




















分 别 创建 了 两 个 线程 和 两 个 进程 ， 至 此 我 人 


process_execute(u_prog_a, "user_prog_a") 创 建 了 用 














百 . 儿 

















是 用 户 进 程 
许 让 您 意外 
程序 文件 。 其 实 … 
磁盘 上 载 入 ， 
不 能 一 口吃 个 胖子 ， 

也 许 您 又 在 想 ， 
user_prog_test.c， 那 样 
于 内 核 呢 ? 

先 别 








bh 址 ， 是 待 运 












































大 
人 





现在 


Pay 
尔 能 不 











云 行 的 进程 。 
的 是 u_prog_a 是 在 main.c 中 定义 的 ， 而 它 只 是 个 函数 ， 
… 这 么 做 也 是 没 办 法 啊 ， 我 们 现在 还 
再 解析 elf 文件 ， 再 分 配 内 存 ， 再 去 执行 …… 还 是 等 以 后 
攻 模 拟 用 户 进程 就 足 矣 了 ， 至 少 此 处 ) 
一 些 ” 好 歹 专门 建立 个 文件 











能 模拟 得 “像样 
的 话 我 更 容易 接受 一 些 ， 


它 定 义 在 第 








没有 实现 文件 


和 47 行 ， 功 能 是 执行 死 循环 ， 使 全 局 


的 系统 中 并 














行 了 4 个 任 














me 




















进程 





,其 









































着 急 , 您 看 , 无 论 用 户 进程 是 从 磁盘 上 载 入 , 还 是 定义 在 另外 一 








最 终 都 得 在 内 存 中 才 行 。 
文件 ， 无 3 














在 内 存 中 
FE 是 少 了 程序 加 载 的 过 程 ， 在 运 
它 定义 在 其 他 文件 中 ， 不 是 还 得 再 单独 编译 、 
地 址 是 在 0xc0000000 以 上 ， 位 于 内 





的 用 户 


行 时 ， 











核 空 间 ， 


进程 只 是 一 段 指 
函数 和 从 磁盘 
链接 吗 ? 有 点 麻烦 。 另 外 ， 
































u_prog_a 的 


实 是 内 核 空间 的 函数 ， 但 这 并 不 是 i 




















用 户 进程 了 ， 只 要 处 到 
地 址 就 行 
GDT 中 准备 
段 描 述 符 ， 用 户 进程 的 CPL 为 












































也 址 是 0xc00015df， 按 地 ] 
说 此 函数 就 不 能 模拟 
器 在 执行 用 户 进程 时 能 够 访问 该 
， 虽 然 它 属于 内 核 的 地 址 ， 但 我 人 
了 DPL 为 3 特权 级 的 代码 段 描 述 符 和 数据 











址 来 说 ， 它 确 


] 之 前 已 经 在 


























3， 并 且 ) 



































权 级 检查 。 这 就 像 进 火 车 站 ， 
火车 ， 从 只 要 能 够 
咱们 再 从 理论 方 







































































j 户 进程 的 ， 在 地 址 空 


























用 户 进程 ， 
分 它 是 用 户 代码 ， 
学 习 操作 系统 而 提出 的 概念 
可 以 认为 处 理 器 不 知道 什么 是 月 























军人 可 以 
上 火车 , 火车 上 的 资源 
而 分 析 下 ， 想 想 看 ， 
栈 ， 我 们 的 函数 u_prog_a 在 运行 后 完全 
间 上 


» 目 自 



































区 分 


走 军人 专用 
谁 
j 户 进程 的 特 和 
条 件 。 
内 核 和 用 
的 规定 ， 只 要 我 们 高 兴 的 话 ， 甚 至 可 以 把 4GB 
对 此 ， 无 论 代码 位 于 内 核 空 
还 是 内 核 代码 ， 而 且 也 没 必 要 区 分 ， 用 户 态 和 内 核 态 这 两 种 名 词 是 人 们 为 了 方便 开发 、 
是 为 了 让 大 家 对 处 理 器 执行 流 


x 间 ， 还 是 用 户 


但 这 并 不 表示 它 无 法 模拟 


有 指向 DPL 为 3 的 段 
通道 ， 普 通 老 百姓 




















系统 ， 无 法 按 常 规 
后 完成 了 文件 系统 
函数 来 代 
来 写 这 两 个 用 户 
这 样 把 u_prog_a 挤 在 main.c 中 ， 我 怎么 


个 文件 中 , | 
令 的 起 始 地 址 而 
上 载 入 的 程序 文件 在 本 
您 的 疑虑 是 正 
j 户 进程 。 























用 户 进程 














函数 吧 ， 比 如 


么 觉得 _prog_a 


参数 u prog a 


变量 test_var_a++。 也 
并 不 是 当初 想像 的 在 磁盘 上 的 二 进 制 
的 方法 先 把 程序 从 
中 人 
































] 再 
真 的 


那样 


做 吧 。 
够 


了 。 


























叫 
属 














] 户 进 








程 要 执行 的 话 ， 























已 , 我 们 这 里 




















函数 来 代 
质 上 没 
确 的 ， 
其 地 址 如 图 11-22 








村 程序 
区 别 。 如 果 将 
u_prog_a 的 
所 示 。 

















[work@localhost b]$ nm build/kernel .bin lgrep -P 'u_progltest_var' 


c00065e0 B test_var_a 
c0006480 D test_var_b 


c90015df T u_prog_a 
c00015f1 T Uprog_b 
[work@localhost b]$ 目 





受 | 














A 
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11s22 


























述 符 的 选 














择 子 去 


< 访问 











就 要 





























都 可 以 使 用 











具备 这 三 个 


东 


























,不 会 


户 进 程 ， 这 是 


大 


























为 是 军人 就 比 一 般 人 优先 
F 是 什么 ? 3 特权 级 ， 自 
者 ， 处 理 器 并 不 是 靠 代 码 地 址 来 区 分 是 





般 通 道 ， 











。 当 
己 单独 的 页 表 ， 



































它 都 只 4 是 一 段 











用 户 态 和 内 核 态 的 概念 转换 为 处 到 
只 要 处 理 器 的 当前 特权 级 CPL 为 3， 
本 身 是 在 内 核 地 址 空间 ， 处 理 器 
问 的 u_prog_a 及 变量 test_var_a, 








进程 








有 户 
































] 的 是 


、 内 核 ; 
器 能 够 识别 的 东西 ， 
就 不 能 
进程 页 目录 表 ， 





态 


4CAN » 














已 只 知道 它 原 生 支 持 的 东西 , 


























el 























而 且 页 表 中 
u_prog_ a 运行 后 ， 它 的 特权 级 为 3， 











氏 3GB 的 空 





它 拥 








和 


的 第 
， 但 这 

















有 自己 独立 的 页 表 ， 并 且 是 通过 为 用 


咱们 为 了 方便 管理 
空间 的 高 3GB 内 存 置 为 内 核 空 
空间 ， 


ji 所 处 的 某 种 状态 达成 








间 ， 只 留 最 





户 进程 ”地 址 在 内 核 空 间 


内 核 空 间 ， 这 符合 特 
两 种 方式 都 可 


以 上 
然 这 只 是 比喻， 
有 3 特权 级 的 
内 核 ， 




















而 人 为 规划 的 ， 并 不 是 硬件 


低 1GB 内 存 给 











指令 ,执行 过 程 








处 理 器 无 法 区 




















yp 








因此 您 














那 就 是 特权 级 变化 和 特权 级 检查 。 处 到 
访问 比 它 特权 级 更 高 (数值 上 DPL <CPL) 的 内 存 。 
站 向 内 核 空间 
s 间 没 用 J 








768 个 页 














致 的 j 理 牛 ， 
如 特权 级 。 若 把 咱们 所 说 的 


录 项 对 
文 和 用 户 态 、 内 核 态 无 关 。 当 























器 关注 的 是 
尽管 u_prog_ a 
应 的 页 表 来 访 
j 户 







































































的 段 描述 符 访问 内 存 ， 这 完全 符合 
的 US 位 都 置 为 1 (loaderS 和 








页 表 项 
表示 处 理 器 允许 所 有 特权 级 的 各 
用 户 进程 是 没有 问 



























































j 户 进程 


Imemory. 











c 中 所 有 涉 














E 务 可 以 














访问 











的 特征 和 行为 ， 而 且 最 最 
及 到 PDE 和 PTE 的 地 方 都 用 
录 项 或 页 表 项 指向 的 内 存 , 所 以 用 
题 的 。 提 醒 一 下 大 伙 儿 ， 如 果 此 时 将 US 置 为 0 的 话 中 





重要 的 是 我 人 


户 进程 准 


备 的 DPL 为 3 















































内 核 空间 















































们 就 不 能 用 内 核 函 


] 早 已 把 所 有 页 目录 1] 
的 是 PG_US_U), 这 


项 和 





的 函数 来 模拟 
数 来 模拟 用 户 
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我 
大 





线程 的 创建 大 伙 儿 肯定 再 熟悉 不 过 了 ， 那 为 什么 我 还 要 创建 线程 
门 创建 的 两 个 用 户 进 程 u_prog_a 和 u_prog_b， 它 们 分 别 将 全 局 变量 test_var_a 和 test_var_b 
直 在 变化 就 说 明 我 1 
法 直接 访问 0 特权 级 的 显存 段 ， 故 调用 打印 函数 时 处 理 
各 显存 段 的 DPL 和 eflags 寄存 器 的 IOPL 改 为 3， 要 么 在 bochs 中 通过 
的 就 是 最 后 一 个 方法 ,为 了 让 大 伙 儿 看 到 用 


家 看 到 用 
一 直 在 执行 。 但 
抛 出 一 般 保护 性 异常 ， 
调试 来 查看 , 或 者 干脆 


， 处 理 器 会 抛 出 page_fault 异常 ， 是 的 ， 就 是 缺 页 


忆 
本 FT 










































































实 有 在 执行 ,我 想 把 变量 值 打 印 出 来 , 如 果 变 量 值 











户 进程 确 
是 由 于 目前 我 们 的 用 户 进程 
寻 此 ， 要 人 么 ; 


高 特权 级 的 线程 来 帮忙 打印 。 这 里 





















































































































































日 








户 进 

















果 如 


可 以 在 此 设置 断 点 ， 


执行 命令 sreg 查看 段 寄存 器 ， 此 时 cs 的 人 
最 低 2 位 为 pl 
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程 确 实在 运行 ， 











日 k_thread_a 和 kk_thread_b 分 别 将 变量 test_var_a 和 test_var_b 的 值 打 印 出 来 。 
























































/ 
6 晓 





























































































































































































































页 





然后 查看 cs 寄存 器 的 值 ， 如 图 11-24 所 示 。 


























bochs:1> lb 0xc00015df 
bochs:2> c 
(9) Breakpoint 1, OxcQ0015df in ?? () 
ext at t=21937798 
(0) [Ox0000000015df] 6002b:c90015df (unk. 
bochs:3> sreg 
es:0x0033, dh=QxQQcff300, dl=0xO000ffff, valid=1 

Data segment, base=0x00000000, limit=Qxffffffff, 
cs:Qx002b, dh=Qx0O0cff900, dl=QxO000ffff, valid=1 

Code segment, base=Qx00000000, limit=Qxffffffff, 


ctxt): push ebp | 


Read/Write, Accessed 


rming, Accessed, 32-bit 


ss:0x0033, dh=QxQ0cff300, dl=QxQ000ffff, valid=1 
Data segment, base=0x00000000, limit=Qxffffffff, 
ds:0x0033, dh=QxQ0cff300, dl=0xO000ffff, valid=1 
Data segment, base=0x00000000, limit=Qxffffffff, 
fs:Qx0033, dh=QxO0cff300, dl=QxQ000ffff, valid=1 
Data segment, base=0x00000000, limit=Qxffffffff, 
gs:9x99006，dh=0x90001000，dL=9x99000009，vaLid=0 
dtr:Qx00060, dh=0x00008200, dl=0x0999ffff, valid=1 
r:0x0020, dh=Qxc0808b00, dl=0x67cO006b, valid=1 
gdtr:base=0Qxc0000900, limit=0Ox37 
idtr:base=Qxc0006600, limit=0Qx17f 


Read/Write，Accessed 
Read/Write, Accessed 


Read/Write, Accessed 














11-24 ”用 户 进程 在 3 特权 级 调试 











A 




















你 
4CAN 

























































































以 判断 此 时 用 户 进程 确 
告 一 段落 ， 以 后 我 们 还 要 在 


也 就 是 3， 所 以 可 
好 ， 有 关 用 户 进程 的 部 分 暂 



















































































面 加 新 的 内 容 。 











Execute-Only, Non-Confo 


并 不 是 一 般 保护 性 异常 (GP 异常 )。 
k thread a 和 k thread bh 





尼 ? 您 看 








9 增 , 为 了 让 











门 的 用 户 进 程 
































器 会 






































好 啦 ， 在 一 番 过 以 理 ， 动 之 以 情 ” 之 后 ， 我 们 要 碍 看 下 运行 结果 啦 ， 编 译 、 写 入 磁盘 后 ， 运 行 结 
图 11-23 所 示 。 
图 OC eml [ eforge.net | 
从 | sn T 人 人 
rf :Ox 
4 
5 
15107F v_b 
151E98 v_b:Qx151E98 v_b: 
98 © v_b:Qx15 上 | 
Qx152CB3 v_b 
153ACE w 
155704 v 
6b51F v_b 651F v_b 
1F v_b:Qx15651F v_b: 651F v 
QOx15733f v_b:0: 33f v_b:Qx15733A v_b 
_b:9x158155 Qx158155 
CTRL + 3rd button enables mouse | | | | | | | 
4 图 11-23 用户 进 程 的 执行 
运行 一 段 时 间 之 后 ， 这 两 个 变量 的 值 已 经 很 大 了 ， 本 节 的 用 户 程序 暂时 成 功 了 。 
为 了 确认 一 下 用 户 进程 确实 进入 了 3 特权 级 ， 咱 们 再 调试 一 下 ，u_prog_a 的 地 址 是 0xc00015df， 我 们 


， 我 们 用 lb 命令 使 bochs 在 虚拟 地 址 0xc00015df 处 停 下 ， 用 命令 c 持续 执行 ， 当 bochs 停 住 后 ， 





Ar 人 
付 侣 。 














为 0x002b， 我们 关注 最 低 4 位 ， 其 值 为 bp,， 换 为 二 进 制 是 1011， 
实 是 在 3 特权 级 下 ， 与 预期 

















系统 调 











使 开发 效率 大 大 提升 了 ,但 人 们 也 因此 受到 了 束缚 ， 
呢 ? 一 部 分 原因 是 为 安全 起 见 ， 不 能 由 程序 “ 乱 来 ”。 
户 程序 的 能 力 限制 得 很 低 ， 即 使 用 
用 户 进程 还 是 需要 提升 “战斗 力 ” 
户 进 程 绝 对 是 不 放心 的 ， 绝 对 不 能 # 
我 ， 我 杀 自 帮 您 办 。” 操 作 系统 提 


需要 什么 功能 就 调用 什么 ， 这 组 接 












































对 用 











j 是 这 么 来 的 ， 为 方便 人 们 开发 程序 ， 
上 做 少量 的 工作 就 能 完成 各 种 各 样 功能 的 程序 ， 这 个 基础 平台 就 是 操作 系统 。 虽 然 基于 操 


> 区 有 4 系统 调用 浅 析 









































一 些 前 非 们 开发 出 一 个 基础 平台 ， 只 要 人 们 在 这 个 平台 
乍 系统 开发 程序 
必须 要 遵循 操作 系统 制定 的 规则 。 为 什么 要 制定 规则 
































操作 系统 不 允许 用 户 程序 过 于 “神通 广大 ” 它 把 用 



































户 程序 做 了 坏事 ， 也 不 会 影 








以 完成 一 些 合法 的 了 




















口 就 是 系统 调用 接 






































系统 调用 就 是 让 用 户 进程 申 




















程 调 
如 今 Linux 的 发 








展 如 火 如 蔡 ， 融 聚 了 众多 精 


























[ 作 ， 比 如 访问 打印 机 为 
巴 权 力 放出 去 ， 
共 了 一 组 “提升 战斗 力 ” 的 接 
用 接口 。 

请 操作 系统 的 帮助 ， 让 操作 系统 帮 其 完成 某 项 工作 ， 也 就 是 相当 于 用 户 进 
用 了 操作 系统 的 功能 ， 因 此 “系统 调用 ”准确 地 来 说 应 该 被 称 为 “操作 系统 功能 调用 ”。 











向 到 整个 计算 机 的 安全 。 不 过 ， 在 很 多 时 候 
用 户 打印 文件 等 。 操 作 系统 
合理 需求 ， 操 作 系统 说 了 :“ 有 事 您 找 
， 每 个 接口 都 是 不 同 的 功能 ， 用 户 进程 





























为 满足 这 

























































































条 盐 











英 的 





几乎 任何 大 型 互 





晶 霹 \，» 


联网 公司 的 底层 业务 都 要 用 























Linux 来 支撑 , 医 
说 在 咱们 系统 中 
Linux 系统 调用 是 


此 虽 介 






































] 还 是 参照 Linux 系统 调用 
十 么 都 是 简易 的 )。 
中 断 门 来 实现 

















的 ， 通 过 软 中 











断 指 令 int 来 主动 发 起 中 断 信 和 号。 








于 要 支持 的 系统 功 











[a 
里 ， 
































小 是 





Linux 只 占用 








能 很 多 ， 总 不 能 一 个 系统 功能 调 有 
真 要 是 这 样 的 话 整 个 中 断 
断 癌 量 号 ， 即 0x80， 处 理 
































下 烛 





就 个 中 断 向 
述 符 表 都 不 够 用 呢 。 
器 执行 指 


















































令 int 0x80 
通过 这 一 个 中 断 门 调 
































时 便 触 发 了 系统 调用 。 为 了 让 
多 种 系统 功能 ， 在 系统 调 
前 ，Linux 在 寄存 器 eax 中 写 入 子 功能 号 ， 
































户 程序 可 以 
之 
例如 系统 调 


























用 open 和 close 都 是 不 同 
int 0x80 进行 系统 调用 时 ， 
eax 的 值 来 判断 用 户 进程 









































的 子 功能 号 ， 
对 应 的 中 
1 请 哪 种 系统 调用 。 
我 们 先 来 看 看 Linux 中 系统 调 


~ 




















通过 
里 例 程 会 根据 


] 户 程序 通 i 





























断 处 3 















































~ 
. 





j syscall 是 怎么 用 
就 是 man 了 ， 还 是 老 样 

















的 。 在 Linux 中 最 方便 的 帮 











子 ， 先 执行 man syscall 回 车 ， 


























结果 如 图 12-1 所 示 。 


syscall 的 原型 是 int syscall(int number, ...)， 其 ! 



































这 是 系统 调 

















number 是 int 型 ， 








子 功能 号 。 























不 同 的 子 功能 需要 
number 后 面 的 “...” 表 示 此 函数 支持 变 参 ， 





支持 不 同 参数 个 数 的 系统 调 月 











看 看 有 什么 惊喜 ， 输 出 
的 

号 ， 也 就 是 前 面 所 说 的 
的 参数 也 是 不 同 的 ， 所 以 
函数 syscall 

月， 在 新 版 本 Linux 中 ， 所 


的 原理 , 模仿 


有 的 系统 调用 功能 都 可 通过 这 


























它 咱 们 实现 一 份 简易 的 系统 调用 版 本 ( 话 





























NAME 


syscall -|indirect system call 


SYNOPSIS 
#define _GNU_SOURCE 
ad <unistd.h> 
#include <sys/syscall.h> 


/* or _BSD_SOURCE or _SVID_SOURCE *, 
/* For SYS_xxx definitions */ 


); 


int syscall(Cint number, .. 


DESCRIPTION 
Syscall() performs the system call whose assembly languagel 
interface has the specified number with the specified arguments. 
Symbolic constants for system calls can be found in the header 
file <sys/syscall.h>. 


RETURN VALUE 
The return value is defined by the system call being invoked. 
In general, a 0 return value indicates success. A -1 return 
value indicates an error, and an error code is stored in errno. 


syscalLLC) first appeared in 4BSD. 


EXAMPLE 
#define _GNU_SOURCE 
抽 nclude <unistd.h> 
#include <sys/syscall.h> 
#include <sys/types.h> 








int 
main(Cint argc, char *argv[D) 
{ 
pidt tid; 
tid = syscall(SYS_gettid); 
$ 
A 图 12-1 syscall 的 man 帮助 


























个 函数 完成 。 顺便 说 一 
























































































































































二 全 





第 也 于 寺 守信 
句 , 函数 syscall 并 不 是 由 操作 系统 提供 的 , 它 是 由 C 运行 库 glibc (GNU 发 布 的 libc 库 版 本 ) 提供 的 , 因此 syscall 
实际 上 是 库 函 数 ， 提 到 这 个 是 为 了 与 后 面 的 宏 方 式 做 对 比 。 

企图 最 下 面 的 框框 中 ， 用 syscall(SYS_getpid) 举 例 了 syscall 的 用 法 。 此 时 只 给 代入 了 一 个 参 








数 SYS_getpid， 也 前 
图 12-2 所 示 。 
SYS_getpid 的 值 是 NR getpid， ”NR getpid 还 是 个 宏 ， 在 32 位 机 器 


i 是 子 功能 号 。SYS_getpid 是 个 宏 ， 其 定义 在 文 



































syscall 


后 “Jusr/include/bits/syscall.h” 中 ， 如 





FEF， 定义 在 文 伯 












































asm/unistd 32.h” 中 ， 值 为 20， 输 出 结果 如 图 12-3 所 示 。 





/usr/include/bits/syscall.h [RO] 























































































































A 图 12-2 syscall.h A 图 
此 处 “ NR ”+“ 系 统 调用 名 称 ” 形 式 的 子 功能 号 宏 还 会 被 用 到 ， 
户 进程 而 言 ， 在 Linux 上 执行 系统 调用 ， 只 需要 提供 子 功能 号 和 参数 就 行 了 





烦 ， 也 只 要 求 提供 这 两 项 。 

我 们 再 回头 看 一 下 图 12-1, 在 其 
接 ” 的 系统 调用 ， 其 实 想 想 这 种 “间接 ”也 是 必然 的 ， 因 为 它 是 
函数 的 好 处 有 很 多 ， 其 中 之 一 就 是 实现 跨 平台 兼容 , 医 




























































































12=-3 


会 儿 我 们 会 
， 我 们 也 不 


usr/include/asm/unistd_32.h [RO] 
unistd_32.h 





FEF“/usr/include/ 






































上 面 用 方 框框 起 来 的 是 “indirect system call”， 这 是 说 syscall 属于 “ 间 








| glibc 提 作 
此 库 函 数 几乎 都 是 对 宿主 


























装 。 说 到 这 您 一 定 想到 了 ， 肯定 还 有 “直接 ”进行 系统 调 ) 
应 该 是 由 操作 系统 提供 ， 这 样 才 显得 “直接 ” 您 说 对 了 ， 
它 是 一 系列 的 宏 ， 这 次 我 们 执行 man _syscall 回 车 ， 输 出 结果 如 





"| 的 方 式 这 个 


































































































加 




















NAME 

_S5yscallL - invoking a System coall |without Library support||(0BSOLETE)) 
SYNOPSIS 

#include <linux/unistd.h> 


A _syscall [macro] 
desired system call 


DESCRIPTION 

The important thing to know about a System call is its prototype 
know how many arguments, their 

types, and the function return type. 
call into the system easier. 

They have the form: 


—SyscallX(type,name, typel,arg1,type2,arg2,...) 


这 个 直接 的 做 法 是 利 月 
12-4 所 示 。 


提起， 总 之 对 用 
j 户 进程 添 麻 


台 已 Z 人 
能 给 


的 库 函数 ， 您 ; 
系统 的 系统 调 






































二 
且 





5 














的 和 
] 接 


使 用 库 
的 圭 








fan 
































直接 的 方式 肯定 不 再 是 库 函 数 了 ， 




















日 操作 系统 提供 的 _syscall[X]， 





You need to 


There are seven macros that make the actual 


X is 0-6, which are the number of arguments taken by the system call 


type is the return type of the system call 


[1 


typeN is the Nth argument's type 


argN is the name of the Nth argument 











12-4 _syscall 的 man 帮助 





524 





有 关 syscall 的 几 个 关键 点 我 






























































框框 标 出 ， 咱 们 从 上 到 下 说 明 。 最 上 面 的 英文 表示 ， 用 _syscall 



































进行 系统 调 
OBSOLETE, 
个 符号 , 后 下 


























借鉴 这 位 老 

















_syscall 是 系统 调 ) 
其 原型 是 _syscallX(type,name,typel,argl,type2,arg2,.. 


不 需要 通过 库 函 数 ， 这 说 明 

意思 是 过 时 的 、 
j 在 源码 解 忆 
虽然 已 经 过 时 了 ， 但 它 






































它 是 直接 的 系统 调用 方式 。 不 过 , 在 它 的 后 面 的 括号 中 有 个 单词 
废弃 的 ， 这 说 明 此 方法 已 经 被 Linux 废弃 了 (注意 ， 只 是 废弃 了 _syscall 这 
音 羽 是 此 方式 最 多 文 持 6 个 参数 , 一 会 儿 您 _syscall 


[后 会 再 阐述 ), 废弃 的 原 就 了 解 了。 
的 实现 思路 非常 简单 ， 对 于 咱们 简易 版 本 的 系统 调用 需求 已 经 绰绰有余 ， 所 以 还 是 













































































































































































前 辈 的 方法 


为 己 用 吧 ， 磨 刀 不 误 砍 柴 工 ， 下 面 我 们 花 点 时 间 学 习 一 下 它 的 实现 。 
所 以 图 中 用 _syscallX 来 表示 它们 ， 其 中 的 X 表示 系统 调用 中 的 参数 个 数 ， 
ji; ] 宏 来 实现 的 ， 根 据 系统 调用 中 参数 




















用 “ 族 ”， 






































_syscallx 是 / 








个 数 、 类 型 及 返 忆 








值 的 不 同 ， 

















这 里 共有 7 个 不 同 的 宏 ， 分 别 是 _syscall[0-6]， 因 此 ， 对 于 参数 个 数 不 同 的 




















系统 调用 ， 击 归 j 
统 调用 名 称 《〈 字 符 串 ) 








: 田 
到 





























] 不 同 的 宏 来 完成 。 图 中 对 参数 已 有 介 











绍 ，type 是 系统 调用 的 返回 值 类 型 ，name 是 系 
值 型 能 号 


， 最 后 通过 宏 蔡 换 会 转换 成 数值 型 的 子 功能 号 ，typeN 和 argN 配对 出 现 ， 分 别 表示 



































参数 的 类 型 及 变量 名 。 





也 同 理 ， 先 看 一 下 宏 具 体 实现 ， 如 下 所 示 。 





下 面 咱们 拿 syscall3 举例 ， 其 



































1 #define 


_syscall3 (type, name, typel, argl, type2, arg2, type3, arg3) \\ 


2 type name (typel argl, type2 arg2, type3 arg3) { \ 


long _res; \ 


_asm 


: "Oo" 
nad" 


volatile 
: "=a" (res) 


__Ssyscall return(type,_ res); 


("push SS%ebx; movl %2,%%ebx; int $0x80; pop SS%Sebx" \ 
\ 

(_ NR ##name), "ri" ((long) (arg1)),"c" ((long) (arg2)), 
((long) (arg3)) : "memory"); \ 

总 


NY 


J 二 上 日 习 z 








此 宏 不 长 
这 里 给 大 


人 




















9 行 。 
伙 说 明 下 ， Linux 


名 及 参数 的 定义 ， 完 全 是 按照 图 12-4 中 的 说 明 实现 的 。 
的 系统 调用 是 用 寄存 器 来 传递 参数 的 ， 这 些 参数 需要 按照 从 左 到 右 的 顺 


其 中 第 1 行 是 宏 


















































序 依次 存 入 到 不 同 的 通 | 
数 ，ecx 保存 第 2 个 参数 ， 
栈 (内 存 )， 不 知道 您 想 过 没有 ， 
的 ， 没 有 哪个 操作 系统 愿意 更 慢 

















可 以 
定 是 这 样 
器 传 参 的 步 又 少 一 些 ， 















































寄存 器 ( 除 esp) 中 。 其 中 ， 寄 存 器 eax 用 来 保存 子 功能 号 ，ebx 保存 第 1 个 参 
edx 保存 第 3 个 参数 ， esi 保存 第 4 个 参数 ，edi 保存 第 5 个 参数 。 传 递 参 数 还 
为 什么 Linux 用 寄存 器 来 传递 参数 ， 而 不 用 栈 ? 用 寄存 器 快 ? 肯 

。 不 过 这 个 “ 快 ” 可 不 是 出 于 存储 介质 方面 的 考虑 ， 而 是 用 寄存 
听 我 慢 慢 道 来 。 用 户 进程 执行 int 0x80 时 还 处 于 用 户 态 ， 编 译 器 根据 c 调 | 















































































































































Se 


























系统 调用 所 





的 参数 会 被 压 到 











约定 ， 
户 栈 中 ， 这 是 3 特权 级 栈 。 当 int 0x80 执行 后 ， 任务 陷入 





SR 











入 了 0 特权 级 , 医 








此 需要 























内 核 态 ， 此 时 进 
0 特权 级 栈 , 但 系统 调用 的 参数 还 在 3 特权 级 的 栈 中 , 为 了 获取 用 户 栈 地 址 ， 

















到 









































还 得 在 0 特权 级 栈 ! 
后 给 您 提供 个 栈 
回 到 代码 , 第 


下 


























第 3 行 是 函数 体 的 开 











赋 
返 
预 





口 





























获取 处 理 器 自动 压 入 的 
光 传 递 参数 就 涉及 
传递 参数 的 例 
2 一 9 行 是 宏 体 ， 这 是 按照 函数 定义 的 方式 定义 的 。 
name 是 函数 名 ， 也 就 是 系统 调 
始 ， 

跨 过 第 4 行 先 说 下 第 5 一 7 行 , 第 5 行 的 "=a" (_res) 位 于 输 
值 。 我 们 知道 ， 根 据 abi 约定 ，eax 作为 函数 
值 。 第 6 行 是 参数 输入 部 input，"0" (_NR 检 name) 中 的 NR 
处 理 后 会 先 变 成 _NR 系统 调 | 



































j 户 栈 的 SS 和 esp 寄存 器 的 值 ， 然 后 再 次 从 用 户 栈 中 获取 参 
到 了 多 次 内 存 访 问 的 情况 ， 内 存 比 寄存 器 要 慢 ， 而 且 步 又 很 肪 烦 ， 我 会 在 最 
子 ， 到 时 候 您 可 以 体会 一 下 

















三 
e 是 函 


函数 的 返回 值 类 型 ， 
_syscall3 中 的 参数 。 
































名 ， 函数 名 后 面 
_ res 是 返回 值 。 


括号 中 是 一 系列 的 形 
































部 output, 这 表明 变量 _ res 由 寄存 器 eax 
用 变量 _res 来 存储 从 中 断 返 回 后 的 

#name 是 系统 调用 的 字符 串 名 ， 经 过 
| 


0 其 中 “ 撩 ”表示 联结 字符 串 ， 这 是 预 









































周 上 





j 的 返 


口 





口 





值 ， 0 



























































名 ， 然 后 变 成 数 









































爷 


理 器 支持 的 语法 ， 咱 














企 介 绍 中 断 入 口 函 数 时 已 经 





门 了 





说 过 了 ， 比 如 系统 调用 名 为 getpid， 预 处 理 后 就 变 成 

















NR_getpid 也 是 宏 , 它 的 值 如 前 面 的 图 12-3 所 示 。"0" (_ NR _ 霜 name) 中 





NR getpid, 











通用 约束 ， 

















表示 ”NR # 椅 name 使 
行 的 "=a" (_res) 一 致 ， 

















的 0 是 ; 
的 寄存 器 或 内 存 与 第 0 个 约束 表达 式 使 用 的 寄存 器 或 内 存 一 致 , 这 里 指 的 是 和 第 5 
能 号 输入 ， 又 做 返回 值 的 输出 。 后 面 "ri" ((long)(argl)) 


















































是 将 变量 argl 约束 到 通 
((long)(arg3)) 是 将 变量 























肯 
也 就 是 寄存 器 eax 既 做 子 功 能 号 

寄存 器 中 ，"c" (dong)(arg2)) 是 将 变量 约束 到 ecx 寄存 器 中 ， 第 7 行 的 "d" 
约束 到 edx 中 。 




















525 























再 回头 看 第 4 行 , 此 行 是 内 联 ; 








[ 编 代码 , ] 


其 中 push %%ebx 的 作用 是 在 用 户 空间 的 栈 中 提前 保护 好 ebx 








的 值 ，movl %2,%%ebx 将 argl 的 值 写 入 寄存 器 ebx，%2 是 序号 占 位 符 ， 表 示 第 2 个 约束 ， 即 argl 对 应 的 


寄存 器 或 内 存 。int $0x80 触发 软 中 断 ， 进 行 系统 调 ) 


A 





现 如 下 ， 不 再 说 明 。 


#define syscall return(type, res) 


do { 


if ((unsigned long) (res) >= 


errno = -(res); 


} 


return (type) (res); 


} while (0) 


当 参 数 多 于 5 个 时 ， 可 以 ) 


和 
2 
3 
4 
3 res = -1;} 
6 
J 
8 
































]， 完 成 后 通过 pop %%ebx 恢复 ebx 的 值 。 





























第 8 行 是 _syscall return(type， res);， 对 返回 值 _res 判断 后 返回 ， 其 中。 syscall return 也 是 个 宏 ， 实 



































\ 


(unsigned long) (-125)) { \ 
\ 


\ 





内 存 来 传递 ,注意 啦 ， 此 时 在 内 存 中 存储 的 参数 仅 是 第 1 个 参数 及 第 6 个 














以 上 的 所 有 参数 ， 不 包括 第 2 一 $ 个 参数 ， 第 2 一 $ 个 参数 依然 要 顺序 放 在 寄存 器 ecx、edx、esi 及 edi 中 ， 
eax 始终 是 子 功能 号 。 我 们 看 下 宏 _syscall6 的 实现 就 清楚 了 ， 如 下 所 示 。 





#define syscall6 (type,name, type 














l,argl, type2,arg2, type3,arg3, 
type4,arg4, type5,arg5, type6,arg6) \ 


type name (typel argl,type2 arg2,type3 arg3,\ 


Struct {1 long. al3 


LONY - 流 63 ' 寺 


type4 arg4,type5 arg5,type6 arg6) { \ 


{ (long)argl, (long)arg6 }; \ 


_asm volatile ("push %%ebp ; push %S%ebx ; movl 4(%2),%%ebp ; "AN 


是 
2 
3 
4 
5 long _res; \ 
6 
7 
8 


"movl 0(%2),%S%ebx ; movl $1,%%eax ; int $0x80 ; "AN 


9 "pop S%ebx ; pop Ss%ebp" \ 
10 : "=an (_ res) \ 
二 : "i™ ( NR ##name), "on" ((long) (&_s))，"c" ((long) (arg2)), \ 
下 和 "d" ((long) (arg3)),"S" ((long) (arg4)),"D" ((long) (arg5)) \ 
13 : "memory"); \ 
14 __syscall return(type, res); \ 
二 5 


大 体 上 和 _syscall3 的 原理 











差不多 ,无 非 是 为 了 存储 第 6 个 参数 ,在 _syscall6 的 第 6 行 声明 了 结构 及 实 


























例 struct { long _ al; long ”a6; } _s， 然 后 在 第 11 行将 实例 _s 的 地 址 作为 输入 ， 最 后 在 第 7 行 用 movl 


4(%2),%%ebp 将 第 6 个 参数 写 入 寄存 器 ebp， 在 














过 ebx 中 还 是 第 1 个 参数 。 
好 啦 ， 介 绍 就 到 这 ， 总 结 一 下 。 
宏 _syscall 和 库 函 数 syscall 相 比 ，syscall 实现 更 灵活 ， 对 用 户 来 说 任何 参数 个 数 的 系统 调用 都 统一 用 











一 种 形式 ， 用 户 只 要 记 住 syscall 就 可 以 了 ， 而 宏 
都 要 有 单独 的 形式 ， 因 此 支持 的 参数 数量 必然 有 P 
入 实 参 的 类 型 ， 确 实 有 些 麻烦 ， 此 外 这 个 宏 会 引发 安全 漏洞 《有 兴趣 可 自行 检索 相关 




















输入 实 参 外 ， 还 要 输 
资料 )， 故 必然 会 被 












































名 8 行 用 movl 0(%2),%%ebx 将 第 1 个 参数 写 入 ebx。 总 











syscall 的 实现 比较 死板 ， 针 对 每 种 参数 个 数 的 系统 调用 











民 ， 而 且 








syscall 取代 。 








强调 一 下 ， 这 是 
户 进 程 无 法 通过 宏 _ 
最 直接 的 方式 是 汇编 









































有 所 说 Linux 废弃 宏 syscall， 是 # 











syscall 进行 系统 






































统 内 部 ， 系 统 调 | 


j 接 





























号 ， 然 后 调用 相应 的 子 功能 函数 ， 其 对 
































j 户 要 记 住 7 种 形式 syscall[0-6]， 调 用 时 除了 








ee 















































引 Linux 系统 不 提供 _syscall 的 定义 及 实现 了 ， 因 此 用 
































《当然 咱们 可 以 再 写 一 个 )，_syscall 虽然 已 经 很 直接 了 ， 但 真正 
尺码 “mov eax， 子 功能 号 ;int 0x80”，_syscall 是 这 两 句 汇 编 指令 的 封装 ， 在 Linux 
口 并 未 改变 ， 依 然 是 在 中 断 向 











量 0x80 对 应 的 中 断 处 理 例 程 中 把 eax 的 值 作 为 子 功 





























日 是 eax 为 子 功 能 号 ， 然 后 执行 0x80 中 断 。 说 白 了 就 

















Linux 中 虽然 没有 方便 的 _syscall 了 ， 但 我 











Linux 系统 调用 








昌 然 库 函 数 syscall 更 加 先进 ，1 
的 工作 吧 ， 毕 竟 我 能 力 有 限 ， 短 期 内 不 








理 就 到 此 结束 啦 。 
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门 依然 可 以 写 汇编 代码 “mov eax, 子 功 能 号 ;int 0x80” 去 执 





















































| 





咱们 为 了 实现 简单 ， 还 是 参考 这 个 “过 气 ” 的 宏 _syscall 来 完成 咱们 
之 力 拿 下 全 世界 的 “智慧 结晶 ”有 关 这 个 系统 调用 的 原 














区 系统 调用 的 实现 


上 节 已 经 跟 大 伙 儿 介绍 了 Linux 系统 调用 的 部 分 实现 , 本 节 以 它 为 范本 , 参照 着 实现 自 
12.2.1 


系统 调用 实现 框架 


Fs | 
Cj 


的 系统 调用 。 

















一 个 系统 功能 调用 分 为 两 部 分 ， 一 部 分 是 暴露 给 用 户 进 程 的 接口 函数 ， 它 属于 用 户 空间 ， 此 部 分 只 是 用 户 


进程 使 用 系统 调用 的 途径 ， 只 负责 发 需求 。 另 



































































































































部 分 是 与 2 







































































对 应 的 内 核 具 体 实现 ， 它 属于 内 核 空 间 ， 此 部 分 完 


























































































































































































































成 的 是 功能 需求 ,就 是 我 们 一 直 所 说 的 系统 调用 子 功 能 处 理 函 数 。 为 区 分 这 两 部 分 ,一 般 情况 下 内 核 空 间 的 
函数 名 要 在 用 户 空间 函数 名 前 加 “sys_”。 咱 们 以 函数 getpid 为 例 说 明 ， 我 们 知道 getpid 的 功能 是 返回 任务 
的 pid， 这 是 给 用 户 进 程 使 用 的 系统 调用 的 接口 ， 接 口 的 男 一 端 是 实现 该 功能 的 内 核 函 数 ， 该 内 核 函 数 就 是 
系统 调用 子 功 能 为 “getpid” 对 应 的 函数 ， 即 sys_getpid， 它 才 是 幕后 功臣 , 由 它 负 责 找 出 调用 者 的 pid 并 返回 。 

前 面 已 经 介绍 过 部 分 Linux 中 系统 调用 相关 的 内 容 ， 大 家 也 大 致 了 解 系统 调用 实现 的 框架 ， 现 在 到 了 
咱们 动手 实践 的 时 候 了 ， 先 梳理 下 咱们 系统 调用 的 实现 思路 。 用 户 进程 

(1) 用 中 断 门 实现 系统 调用 ， 效 仿 Linux 用 0x80 号 中 断 作 为 系统 调用 ET 
的 入 int 0x80 

(2) 在 IDT 中 安装 0x80 号 中 断 对 应 的 描述 符 ， 在 该 描述 符 中 注册 系统 调 
用 对 应 的 中 断 处 理 例 程 。 0X80 呈 中断 处 理 全 和 

(3) 建立 系统 调用 子 功能 表 syscall_table， 利 用 eax 寄存 器 中 的 子 功能 号 edhe het osnoscan 
在 该 表 中 索引 相应 的 处 理 函 数 。 

(4) 用 宏 实 现 用 户 空间 系统 调用 接口 syscall， 最 大 支持 3 个 参数 的 系统 系统 调用 子 功 能 数组 
调用 ， 故 只 需要 完成 syscall[0-3]。 寄 存 器 传递 参数 ，eax 为 子 功能 号 ，ebx syscall table ={ 
保存 第 1 个 参数 ，ecx 保存 第 2 个 参数 ，edx 保存 第 3 个 参数 。 子 功能 函数 2 

以 上 4 个 步骤 的 流程 如 图 12-5 所 示 。 

看 上 去 还 是 蛮 简 单 的 ， 大 方向 就 是 这 样 ， 出 发 。 图 12-5 系统 调用 实现 流程 




















12.2.2 增加 0x80 号 中 断 描述 符 


为 实现 系统 调 












































j， 我 们 需要 改进 相关 的 一 系列 文件 ， 我 们 有 关中 断 处理 例 程 的 文件 有 kemelS 和 




















interrupt.c, 一 步 一 步 来 吧 , 首先 我 们 要 修改 interrupt.c, 在 其 中 安装 0x80 对 应 的 中 断 描 述 符 ,请 见 代 码 12-1。 
代码 12-1 





… 略 
#define IDT DESC CNT 0x81 


… 略 


pA 














( project/c12/a/kernel/interrupt.c ) 
































extern uint32 t syscall handler (void); 


/* 初 始 化 中 断 描述 符 表 */ 





static void idt desc init(void) { 


int i, lastindex 
for (i = 0; i < IDT 


make idt aqesc(&i 








dt[il, 











} 
单独 处 理 系统 调 











， 系 统 调 











/* 
大 











But .str(™ 
} 


对 应 的 





DT DESC CNT - 1; 
DESC CNT; i++) { 


前 总 共 支 持 的 中 断 数 


IDT DESC ATTR DPLO, intr entry table[i]); 


FP 断 门 dpl 为 3， 


中 断 处 理 程序 为 单独 的 syscall handler */ 
make idt desc(&idt[lastindex], 
idt desc init done\n"); 


IDT DESC ATTR DPL3, syscall handler); 


代码 第 12 行将 宏 IDT_DESC_CNT 修改 为 0x81， 这 表示 我 们 最 大 文 持 0x81 个 中 断 ， 即 0 一 0x80，0x80 


是 我 们 系统 调 | 
第 17 行 声明 了 外 部 函数 syscall_ handler， 我 们 将 在 kernel.S 中 定义 它 ，syscall_handler 就 是 系统 调用 








县. 
里 











对 应 的 中 断 向 








o 
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对 应 的 中 断 入 口 例 程 。 
在 后 面 的 idt_desc init 函数 中 ， 我 们 在 第 80 行 增加 了 0x80 号 中 断 向 量 对 应 的 中 
中 注册 的 中 断 处 理 例 程 为 syscall handler。 这 里 要 注意 的 是 记得 给 此 


























AITR_DPL3， 若 指定 为 0 级 ， 则 在 3 级 环境 下 执行 int 指令 会 产生 GP 异常 。 
好 啦 ，interruptc 就 修改 完了 。 


12.2.3 ”实现 系统 调用 接口 
之 前 我 们 已 经 讨论 了 宏 _syscall 的 原理 ， 用 户 进 程 可 以 通过 调 


心 就 是 用 内 联 汇编 传 参 并 触发 中 断 。 我 们 说 过 了 ， 选 择 它 的 原因 得 
现 自 























用 宏 syscall[0-6] 进 
是 因为 它 简 单 ， 现 
























































这 次 我 们 把 它 定 义 在 syscall.c 中 ， 它 在 目录 lib/user/ 下 ， 请 大 伙 儿 见 代码 12-2。 
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代码 12-2 (project/c12/a/lib/user/syscall.c ) 

1 #include "syscall.h" 

2 

3 /* 无 参数 的 系统 调用 */ 

4 #define syscall0 (NUMBER) ({ ™ 

5 int retval; ~ 

6 asm volatile ( \ 

3 Min $0x80™ \ 

8 : "=a" (retval) \ 

9 : "a" (NUMBER) \ 

10 : "memory" 人 

二 ); \ 

下 2 retval; \ 
十 3) 
14 

… 略 

39 /* 三 个 参数 的 系统 调用 */ 
40 #define syscall3 (NUMBER， ARG1， ARG2, RARG3) ({ NS 
41 区 下 GE 七 人工， \ 
42 asm volatile ( \ 
43 "int $0x80" \ 
44 : "=a" (retval) \ 
45 : "an (NUMBER), "b" (ARG1), "c" (ARG2), "d" (ARG3) \\ 
46 : "memory" \ 
47 ); \ 
48 retval; \ 
49 }) 














如 前 所 述 ， 只 














































































































断 描述 符 ， 在 描 





























i 述 符 的 dpl 指定 为 用 户 级 IDT DESC _ 


行 系统 调用 ， 它 的 核 
在 咀 们 就 要 参照 它 实 








己 的 版 本 啦 ， 告 诉 大 伙 儿 一 个 好 消息 ， 咀 们 是 一 山 更 比 一 山 低 ， 咱 们 的 实现 比 它 还 要 简单 。 


们 打算 最 多 支持 3 个 参数 的 系统 调用 ， 它 们 是 _syscall[0-3]， 代 码 12-2 中 列 出 了 无 参数 版 本 












































































































































和 3 个 参数 的 版 本 ， 由 于 _syscall[1-3] 只 是 在 为 参数 赋值 时 有 所 不 同 ， 故 只 贴 出 了 _syscall3 。 

咱们 的 _syscall 版 本 和 Linux 的 版 本 类 似 ,不 过 和 它 相 比 ， 咱 们 的 版 本 更 简单 一 些 ，Linux 中 是 用 安定 
义 了 一 个 函数 ， 咱 们 这 里 是 直接 用 大 括号 完成 的 ， 也 许 有 同学 对 大 括号 的 这 种 用 法 比较 陌生 ， 大 括号 中 最 
后 一 个 语句 的 值 会 作为 大 括号 代码 块 的 返回 值 , 而 且 要 在 最 后 一 个 语句 后 添加 分 号 ; ', 否则 编译 时 会 报错 。 
另外 ， 在 咱们 的 内 联 汇编 中 都 没 用 到 通用 约束 ， 确 实 简陋 了 很 多 。 

想必 在 介绍 系统 调用 原理 的 时 候 大 伙 已 经 对 _syscall 非常 清楚 了 , 因此 本 节 又 没戏 唱 了 , 大 伙 儿 下 节 再 见 。 
































12.2.4 增加 0x80 号 中 断 处 理 例 程 


下 面 需要 修改 kernel.S$， 在 里 面 安装 中 断 向 量 0x80 对 应 的 中 断 处 弄 
handler， 请 见 代码 12-3。 






































代码 12-3 
0x80 号 中 断 


( project/c12/a/kernel/kernel.S ) 


98 rr 
99: [Bits"32] 
100 extern syscall table 
101 section .text 
102 global syscall handler 


本 
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程序 ， 也 就 是 上 节 提 到 的 syscall_ 


103 syscall handler: 
104 ;1 保存 上 下 文 环境 




























































































































































































105 push 0 ; 压 入 0， 使 栈 中 格式 统一 

106 

107 push ds 

108 push es 

.0.9 push fs 

110 push gs 

111 pushad ; PUSHAD 指令 压 入 32 位 寄存 器 ， 
112 ; EAX,ECX,EDX,EBX,ESP,EBP,ESI,EDI 
圭 生 党 

114 push 0x80 ; 此 位 置 压 入 0x80 也 是 为 了 保持 统一 的 栈 格式 
1 

116 ;2 为 系统 调用 子 功能 传 入 参数 

ly. push edx ; 系统 调用 中 第 3 个 参数 

118 push ecx ; 系统 调用 中 第 2 个 参数 

119 push ebx ; 系统 调用 中 第 1 个 参数 

120 

121 ;3 调用 子 功能 处 理 函数 

122 call [syscall table + eax*4] 

123 add esp, 12 ; 跨 过 上 面 的 三 个 参数 
124 

125 ;4 将 call 调用 后 的 返回 值 存 入 当前 内 核 栈 中 eax 的 位 置 
126 mov [esp + 8*4], eax 

127 jmp intr exit ; intr exit 返回 ， 恢 
在 第 100 行 中 声明 了 外 部 数 和 





























应 的 处 理 函数 〈 以 后 ; 








第 103 行 是 中 断 例 程 syscall handler 的 定义 
第 105 行 压 入 了 中 靳 和 











各 在 新 文件 中 定义 它 )， 这 里 我 们 用 子 功 能 号 在 此 数组 
， 为 了 复 用 intr_exit， 此 例 程 的 前 
误 码 0， 第 107 一 111 行 用 来 保存 任务 的 上 下 文 ， 第 114 行 显 









































居 结 构 syscall table，syscall table 是 个 数组 ， 数 组 成 员 是 系统 调用 中 子 功 能 对 























中 索引 子 功能 号 对 应 的 处 理 函 数 。 




















部 分 和 其 他 中 断 例 程 一 样 ， 











式 压 入 了 中 断 号 0x80。 划 








实 第 105 行 和 第 114 行 只 是 占 位 
第 117 一 119 行 是 为 子 功能 函数 # 









































调用 约定 ， 最 右边 的 参数 先入 栈 ， 因 此 先 把 edx 中 的 第 3 个 参数 入 栈 ， 






























































1 个 参数 。 注 意 ， 这 上 






























































































































































]， 无 所 谓 内 容 。 不 过 还 是 为 了 意义 统一 ， 分 别 压 入 了 错误 码 和 中 断 向 量 号 。 
传 备 参数 ， 由 于 只 支持 3 个 参数 的 系统 调用 ， 故 只 压 入 了 三 个 参数 ， 按 照 C 
其 次 是 ecx 中 的 第 2 个 参数 、ebx 中 的 第 
我 们 不 管 具 体系 统 调 用 中 的 参数 是 几 个 ， 一 律 压 入 3 个 参数 ， 也 许 您 对 此 感到 奇怪 。 是 
这 样 的 ， 子 功能 处 理 函 数 都 有 自己 的 原型 声明 ， 声 明 中 包括 参数 个 数 及 类 型 ， 编 译 时 编 
栈 中 匹配 出 正确 数量 的 参数 ， 


译 器 会 根据 函数 声明 在 





进入 函数 体 后 ， 根 据 C 调用 约定 ， 栈 顶 的 4 字 节 (32 位 系统 ， 下 同 ) 是 函数 的 返 














上 方向 ) 获取 参数 的 ， 参 数 
FE 了 多 余 的 参数 用 不 上 ， 因 此 ， 尽 
良 费 了 一 点 点 栈 空间 。 














也 不 会 出 错 ， 而 我 们 也 只 是 

















加 地 址 ， 往 上 高 地 址 的 栈 底 方向 ) 的 4 季节 是 第 1 个 参数 ， 再 往 上 的 4 字 节 便 是 第 2 个 参数 ， 依 此 类 推 。 在 
函数 体 中 ， 编 译 嚣 生成 的 取 参 数 指令 是 从 栈 顶 往 上 跨 过 栈 顶 的 返回 地 址 ， 向 高 地 
个 数 是 通过 函数 声明 事先 确定 好 的 ， 因 此 并 不 会 获取 到 错误 的 参数 ， 从 而 保 订 
管 我 们 压 入 了 3 个 参数 ， 但 对 于 那些 参数 少 于 3 个 的 函数 






































寄存 器 eax 中 是 系统 调用 子 功能 号 ， 用 它 在 数组 syscall table 中 索引 对 应 的 子 功能 处 理 函 数 。 


syscall_table 中 存储 的 是 函数 地 址 ， 每 个 成 员 是 4 字 节 大 小 ， 
的 偏 移 量 ， 这 样 代码 “call [syscall table + eax*4]” 便 去 调用 子 功能 处 到 

















“add esp, 12” 跨 过 这 三 个 参数 。 















































根据 二 进 制 编程 接口 abi 约定 ， 寄 存 器 eax 用 来 存储 返 
果 有 返回 值 的 话 ，eax 的 值 已 经 变 成 了 返回 值 〈 如 果 没有 返回 
























































122 行 中 ， 要 用 eax*4 做 syscall table 
函数 。 调 用 之 后 ， 在 第 123 行 通过 

































































看 第 122 行 的 call 函数 调用 ， 如 
值 也 没关系 ， 编 译 器 会 保证 函数 返回 后 eax 











的 值 不 变 )， 此 时 我 们 要 把 返回 值 传 给 用 户 进程 ， 但 是 从 内 核 态 退出 时 ， 要 从 内 核 栈 中 恢复 寄存 器 上 下 文 ， 


这 会 将 当前 eax 的 返回 值 履 盖 , 那 如 何 将 返回 值 传 给 用 户 进程 呢 ? 聪明 的 您 一 定 
的 值 回 写 到 内 核 栈 中 用 于 保存 eax 的 内 存 处 , 这 样 从 













































































次 eaX 寄存 器 ， 返回 至 




















栈 顶 ，8*4 就 是 相对 栈 项 ， 往 栈 中 高 地 址 方向 的 偏 移 量 ， 












































I 用 户 态 时 ， 用 户 进 程 便 获 取 到 了 系统 调用 
以 上 的 思路 是 在 第 126 行 通过 “mov [esp + 8*4], eax” 实 ] 
时 是 内 核 栈 ) 中 保存 eax 的 那个 内 存 空间 。 这 里 解释 一 下 [esp- 





想到 了 , 就 是 把 寄存 器 eax 














内 核 返回 时 














该 返回 值 重新 覆盖 一 





























pe 






































上 面 的 push 0x80 所 占 的 4 字 节 ， 另 外 的 7 是 指 pushad 二 




















已 人 全 











的 ， 此 行 代 码 就 是 将 返回 值 写 到 了 栈 〈 此 
H8*4]， 这 是 寄存 器 相对 寻 址 ，esp 就 是 当前 
二 实 把 8*4 拆 分 成 (1+7)*4 更 好 ， 其 中 的 1 是 指 
将 eax 最 先 压 入 ， 故 要 跨 过 7 个 4 字 节 ， 总 
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共 是 8 个 4 字 节 ， 即 [esp+8*4] 是 对 应 栈 中 eax 的 “藏身 之 所 ”。 
第 127 行 通过 “jmp intr_exit” 从 中 断 出 口 函数 intr_exit 返回 ， 这 里 是 复 用 intr exit， 它 还 是 老 版 本 ， 
没有 变化 。 

好 啦 ， 本 节 到 此 结束 啦 ， 离 完成 还 有 不 远 的 距离 ， 大 伙 儿 辛苦 了 。 



























































12.2.5 ”初始 化 系统 调用 和 实现 sys_getpid 


为 了 支持 系统 调用 ， 我 们 的 前 期 工作 做 得 差不多 了 : 已 经 在 IDT 中 安装 了 0x80 号 中 断 描 述 符 ， 增 加 
了 相应 的 中 断 处 理 例 程 ， 实 现 了 _syscall 接口 ， 似 乎 还 差 那 么 一 点 点 ， 对 ， 我 们 还 需要 个 数据 结构 ， 系 统 
调用 子 功能 数组 syscall table， 用 它 来 存放 不 同 子 功 能 对 应 的 处 理 函 数 。 

实现 syscall_table 还 是 很 简单 的 ， 就 是 数组 定义 ， 两 句 话 就 完成 了 ， 现 在 还 需要 在 这 个 数组 中 注册 子 
功能 处 理 函数 ， 也 就 是 使 数组 syscall_table 中 的 元 素 为 子 功能 处 理 函 数 指针 ， 这 样 在 0x80 号 中 断 向 量 的 
中 断 处 理 例 程 中 才能 调用 到 相应 的 子 功能 处 理 函 数 ， 还 记得 吗 ， 具 体 的 函数 调用 是 文件 kernel.S 第 122 行 
的 代码 “call [syscall table + eax*4]” 在 咱们 的 设计 中 , 往 syscall table 中 注册 处 理 函 数 这 项 工作 是 在 初始 化 
系统 调用 时 完成 的 。 可 现在 的 关键 是 目前 没有 实现 具体 系统 调用 功能 ， 还 没有 子 功 能 处 理 函 数 呢 ， 巧 妇 难 
为 无 米 之 炊 ， 要 不 趁 现在 一 块 定义 个 子 功能 处 理 函 数 吧 。 

咱们 要 实现 的 第 一 个 系统 调用 是 getpid，getpid 的 功能 是 获取 任务 自己 的 pid，getpid 是 给 用 户 进程 使 
用 的 接口 函数 ， 它 在 内 核 中 对 应 的 处 理 函 数 是 sys_getpid， 有 具体 请 见 代码 12-4。 


代码 12-4 (project/c12/a/userprog/syscall-init.c ) 





























































































































































































































































































































































































































… 略 
7 #define syscall nr 32 
8 typedef void* syscall; 
9 syscall syscall table[syscall nr]; 











11 /* 返回 当前 任务 的 pid */ 

12 uint32 t sys getpid(void) { 

于 学 return running thread()->pigd; 
14 } 

















16 /* 初始 化 系统 调用 */ 
17 void syscall init (void) { 











18 put_str("syscall init start\n"); 

19 syscall table[SYS GETPID] = sys _ getpid; 
20 put str("syscall init done\n"); 

21 } 





代码 12-4 的 第 7 一 9 行 定义 了 syscall table 相关 参数 ,syscall_nr 表示 最 大 支持 的 系统 调用 子 功能 个 数 ， 
其 值 为 32。 第 8 行 用 typedef 自 定 义 syscall 类 型 为 空 指针 void*， 第 9 行 syscall 是 数组 syscall table 的 元 
素 类 型 ， 也 就 是 syscall table 为 函数 指针 数组 。 
第 12 行 是 sys_getpid 的 定义 ， 它 的 实现 很 简单 ， 就 是 将 当前 任务 pcb 中 的 pid 返回 。 不 过 此 时 咱们 的 
任务 创建 中 还 没有 分 配 pid 的 功能 ， 先 不 急 ， 一 会 儿 再 把 相关 代码 补 上 
第 17 行 是 初始 化 系统 调用 函数 syscall init, 很 简单 , 就 是 为 数组 syscall table 赋值 , 这 里 用 到 了 SYS_GETPID， 
它 是 个 枚 举 型 数值 ， 表 示 系 统 调用 子 功能 号 ， 目 前 其 值 为 0， 定 义 在 lib/user/syscall.h 中 ， 后 面 咱们 会 介绍 。 
下 面 补 上 为 任务 分 配 pid 相关 的 代码 ， 先 见 代码 12-5。 


代码 12-5 (project/c12/a/thread/thread.h ) 
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… 略 
10 typedef int16 t pid t; 
76 /* 进程 或 线程 的 pcb， 程 序 控制 块 */ 
77 struct task struct { 












































78 uint32 tx self kstack;  // 各 内 核 线 程 都 用 自己 的 内 核 栈 
79 pid t pid; 
80 enum task status status; 


"iO 
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代码 12-5 仅 在 struct task struct 中 添加 了 成 员 pid， 其 





关 代 码 。 
代码 12-6 
… 略 
15 struct lock pid lock; 
… 瞄 
35 /* 分 配 pid */ 
36 static pid t allocate pid(void) { 
3 static pid t next pid = 0; 
38 lock acquire(&pid lock); 
39 next pid++; 
40 lock release(&pid lock); 
41 return next pid; 
42 } 
… 略 
58 /* 初始 化 线程 基本 信息 */ 
59: 


60 memset (pthread, 0, sizeof (*pthread)); 
61 pthread->pid = allocate pid(); 
62 strcpy (pthread->name, name); 


170 /* 初始 化 线程 环境 */ 
171 void thread init (void) { 


172 put_str("thread init start\n"); 
73 list init(&thread ready list); 
174 list init(&thread all list); 
2 lock init (&pid lock); 

176 /* 将 当前 main 函数 创建 为 线程 */ 

于 法 人 make main thread(); 

178 put_str("thread init done\n"); 
179 } 


本 次 thread.c 中 涉及 的 变化 有 第 15 行 的 struct lock pid lock， 这 是 定义 了 pid 锁 ， 
E 务 分 配 重 复 的 pid。 第 























此 锁 用 来 在 分 配 pid 时 实现 互 斥 ， 避 人 免 为 不 同 的 外 
































类 型 








I 为 int16 t。 下 面 














( project/c12/a/thread/thread.c ) 


// 分 配 pid 锁 





void init thread(struct task struct* pthread, char* name int prio) { 

















pid 必须 是 
有 36 行 的 函数 allocate_pid | 


看 thread.c 中 分 配 pid 的 相 


唯一 的 ， 

















j 来 分 





配 pid， 这 里 用 静态 全 局 变量 next pid 的 值 
因此 第 1 个 任务 的 pid 为 1 (Linux 中 pid 为 0 的 
E 务 的 pid 会 自 增 。 分 配 pid 是 在 线程 创建 后 的 初始 化 











为 1 )， 之 后 

















作为 pid，next_pid 初始 为 0， 其 加 1 后 的 结果 为 新 线程 的 pid， 
E 务 是 init, 将 来 咱们 实现 任务 init 后 也 要 把 它 的 pid 分 配 
期 间 进 行 的 ， 因 此 函数 allocate_pid 是 
















































































在 init_ thread 函数 中 使 用 ， 


L 体 代码 是 第 61 行 的 “pthread->pid = allocate pid0;”。 注 意 啦 ，pid lock 的 类 











型 是 struct lock， 在 使 用 前 要 初始 化 ， 


这 是 在 函数 thread init 中 第 175 行 的 “lock init(&pid lock)” 完 成 的 。 














好 啦 ， 相 关 的 修改 差不多 了 ， 下 一 步 就 要 为 用 











户 进 程 添加 getpid 系统 调 





] 接 

















， 兄 弟 们 休 轧 





‘下 ,下 


本 节 要 在 系统 中 安装 第 一 个 系统 调用 一 一 getpid， 需 要 增加 儿 个 文件 ， 














直接 

















代码 12-7 
#ifndef _LIB USER SYSCALL H 
#define LIB USER SYSCALL H 
#include "stdint.h" 
enum SYSCALL NR { 
SYS_GETPID 


( project/c12/a/lib/user/syscall.h ) 


}; 
uint32 七 getpidl(void); 
#endif 


OONRODP 


























吕 


AN 














面具 有 SYS_GETPID， 默 认 值 为 0， 以 后 再 增加 新 的 系统 调用 后 还 需 















































在 syscall.h 中 主要 定义 了 枚 举 结构 enum SYSCALL NR， 此 结构 用 来 存放 系统 调用 
和 要 把 新 的 子 功能 





上 菜 啦 ， 请 见 代 码 12-7。 









































子 功 能 号 ， 前 生 
号 添加 到 此 结构 中 。 





























接 下 来 要 考虑 实现 系统 调 | 




















接口 了 ， 这 里 要 实现 的 接口 是 getpid， 将 它 定义 在 


那里 呢 ? 想来 想 去 ， 还 





是 放 在 syscall.c 中 比较 合适 ， 这 样 比较 方便 调用 宏 _syscall[0-3]， 如 代码 12-8 所 示 。 
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代码 12-8 (project/c12/a/lib/user/syscall.c ) 




















1 #include "syscall.h" 

2 

3 /* 无 参数 的 系统 调用 */ 

4 #define syscall0 (NUMBER) ({ \ 
5 int retval; N 
6 asm volatile ( \ 
2 vint. $0x80" ~ 
8 "=a" (retval) \ 
9 : "a™" (NUMBER) \ 
10 : "memory" \ 
半生 ); \ 
12 retval; 六 
二 3 

… 瞄 














51 /* 返回 当前 任务 pid */ 

52 uint32 t getpid() { 

53 return syscall0 (SYS GETPID); 
54 } 


此 次 在 syscall.c 的 第 51 行 添 加 了 getpid 系统 调用 ， 当 然 您 懂 的 ， 它 只 是 用 户 接口 ， 真 正 实 现 此 功能 
的 函数 是 位 于 syscall-init.c 中 的 sys_getpid。 

好 啦 ， 到 此 为 止 ， 我 们 完成 了 系统 调用 的 实现 ， 并 且 添 加 了 第 一 个 系统 调用 getpid， 随 着 系统 的 完善 ， 
我 们 还 会 增加 更 多 系统 调用 呢 ， 现 在 总 结 下 增加 系统 调用 的 步 又。 

(1) 在 syscall.h 中 的 结构 enum SYSCALL NR 里 添加 新 的 子 功能 号 。 

(2) 在 syscall.c 中 增加 系统 调用 的 用 户 接口 。 

(3) 在 syscall-init.c 中 定义 子 功能 处 理 函 数 并 在 syscall table 中 注册 。 
有 关系 统 调用 的 内 容 到 此 为 止 ， 下 节 中 我 们 将 在 用 户 进程 中 调用 getpid 进行 测试 。 


12.2.7 ”在 用 户 进程 中 的 系统 调用 


本 节 我 们 将 在 用 户 进程 中 执行 系统 
中 用 函数 来 模拟 ， 请 见 代 码 12-9。 


代码 12-9 (project/c12/a/kernel/main.c ) 
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2 





] 了 ， 想 想 还 是 很 激动 呢 。 咱 们 的 用 户 进程 还 是 暂时 在 main.c 


















































#include "syscall-init.h" 
#include "syscall.h" 


略 
2 
8 
9 
10 void k thread a(voidqx) 7 
11 void k thread b (void*); 
12 void u prog al(void); 
13 void u prog pb (void) ; 
14 int prog a pid = 0, prog b pid = 0; 
5 
16 int main(void) { 
二 了 put_str("I am kernel\n"); 
18 init all(); 
19 


20 process execute(u prog a, "user prog a"); 

21 process execute(u prog b, "user prog b"); 

22 

23 intr enable(); 

24 console put str(" main pid:0x"); 

25 console put int (sys getpid()); 

26 console put char('\n'); 

27 thread start ("k thread a", 31, k thread a, "argA "); 
28 thread start ("k thread b", 31, k thread b, "argB "); 
29 while(1); 

30 return 0; 

< 

32 


33 /* 在 线程 中 运行 的 函数 */ 
34 void k thread al(voidqx arg) { 
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3 char* para = arg; 

36 console put str(" thread a pid:0x"); 
37 console put int (sys getpid()); 

38 console put char('\n'); 

39 console put str(" prog a pid:0x"); 
40 console put int (prog a pid); 


console put char('\n'); 
while(1); 
} 


41 
42 
43 
44 
45 /* 在 线程 中 运行 的 函数 */ 

46 void k thread b (voidx arg) { 
47 

48 

49 

50 








char* para = arg; 

console put str(" thread b pid:0x"); 
console put int (sys getpiqd()); 
console put char('\n'); 





与 二 console put str(" prog b pid:0x"); 
52 console put int (prog b Pid) ; 

53 console put char('\n'); 

54 while(1); 

55: 1} 

56 























57 /* 测试 用 户 进 程 */ 
58 void u prog a(lvoid) { 


59 prog a pid = getpid(); 
60 while(1); 

61 } 

62 























63 /* 测试 用 户 进程 */ 
64 void u prog b (void) { 








65 prog b pid = getpid(); 
66 while(1); 
67 + 



































大 体 上 说 一 下 ， 这 里 创建 了 两 个 用 户 进 程 ， 分 别 是 u_prog a 和 uw prog b， 它 们 都 调用 getpid0) 来 获得 
己 的 pid， 返 回 的 pid 分 别 存储 在 全 局 变量 prog a pid 和 prog b pid 中 ， 又 创建 了 内 核 线程 k_thread a 
和 kk_thread b， 它 们 也 都 调用 sys_getpid0 来 获得 自己 的 pid。 目 前 尚未 实现 为 用 户 进程 打印 字符 的 系统 调 
用 ， 因 此 还 是 老 办 法 ， 先 让 内 核 线程 帮 着 把 用 户 进程 pid 打印 出 来 ， 也 就 是 在 内 核 线程 k thread_a 和 
k_thread_b 中 分 别 输 出 变量 prog a_pid 和 prog_b_pid。 

之 前 我 们 验证 程序 时 都 是 在 屏幕 上 循环 输出 信息 ， 看 着 确实 很 乱 ， 为 了 屏幕 清爽 一 些 ， 这 次 我 们 只 输出 一 
次 。 不 过 有 一 点 点 的 不 同 ， 这 次 是 进程 创建 在 先 ， 线 程 创 建 在 后 ， 这 样 做 的 目的 是 同步 输出 ,“ 尽 量 ” 使 线程 
在 进程 之 后 执行 ， 避 免 线程 执行 完 时 ， 进 程 尚未 执行 ， 也 就 是 进程 没 来 得 及 执行 getpid 时 线程 已 经 将 变量 
prog [ab] pid 输出 了 ,这 会 导致 打印 的 pid 为 0。 当然 , 这 么 做 也 并 不 总 是 靠 谱 ， 还 是 要 取决 于 调度 和 阻塞 时 机 。 
编译 、 写 入 磁盘 ， 运 行 效果 如 图 12-6 所 示 。 


了 | Bochs x86 emulator, http://bochs.sourceforge.net/ oy 


' 国 "1 - Th’ Reset 2 NDF Co 


init done 
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二 
Ba 











































































































Hi 




































































mem_pool_init start 
itmap_sta 99 kernel_pool_phy anrt 99 
) itmap_start:C099h81F9 user_pool_phy_addr rt: 1100909 
1_init done 
em_init done 
Et tart 
thread_init done 


timer_ init s 


ltr done 
start 
done 





CTRL + 3rd button enables mouse | | | | | | | | 


12-6 系统 调用 之 getpid 
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入 























533 














第 12 章 进一步 完善 内 核 
您 看 图 12-6 中 最 下 面 的 方 框 









































用 户 进 程 prog a 的 pid 为 


看 出 ， 


和 两 个 内 核 线程 ， 至 于 失 























， 从 上 到 下 显示 了 主线 程 的 pid, 其 值 为 1, 线程 
0x2， 线 程 thread_b 的 pid 为 0x5， 进 程 
任务 创建 的 顺序 和 代码 顺序 是 一 样 的 ， 主 线程 是 最 先 创 建 的 ， 因 此 pid 为 1， 接 着 是 两 个 用 户 进程 








prog_b 的 pid 为 0x3。 根 扩 









































机 和 





! 请 锁 时 的 阻塞 有 关 。 

















好 ， 本 节 到 这 就 结束 了 ， 大 家 辛苦 了 。 


























12.2.8 ”系统 调用 之 栈 传递 参数 
我 们 目前 的 系统 调用 是 通过 寄存 器 来 传递 参数 的 ， 原 医 


《用 户 进程 ) 首先 得 把 参数 压 在 3 特权 级 的 栈 中 ， 然 后 内 核 将 其 





























印 的 顺序 并 不 与 任务 创建 顺序 一 致 ， 这 与 创建 


和 大 伙 说 过 了 ， 若 | 























thread a 的 pid 为 0x4， 
居 pid 的 值 可 以 

































































读 出 来 















































栈 的 读 写 ， 故 通过 寄存 器 传递 参数 效率 更 高 。 道 理 虽然 容易 说 ， 





















































栈 传递 参数 的 话 ， 
于 压 入 0 特权 级 栈 ， 这 涉及 到 两 种 
但 依然 有 很 多 同学 好 奇 如 何 通 过 栈 传 递 参 
数 ， 更 直接 地 说 ， 是 想 了 解 如 何在 内 核 态 下 访问 用 户 态 的 栈 空间 。 好 吧 ， 为 满足 部 分 同学 的 好 奇 心 ， 这 里 





j 户 进程 的 步 又 较 多 、 实 际 调度 时 


调用 者 

















给 大 伙 儿 做 个 演示 ， 故 本 节 与 咱们 后 续 工 作 无 关 ， 仅 作为 选读 。 
从 内 核 态 访问 用 户 态 的 栈 空 间 ， 听 起 来 似乎 有 点 “ 炫 ” 但 其 实 一 点 难度 都 没有 ， 就 是 有 一 点 点 麻烦 ， 


要 想 在 内 核 态 下 访问 用 户 态 的 栈 空 间 


伏笔 ， 


子 SS 及 栈 指针 esp， 故 我 们 在 中 断 处 理 程序 中 可 以 从 内 核 栈 中 把 它 
所 以 只 要 从 内 核 栈 中 把 eip 读 取 





平坦 模型 ， 即 




































































， 关 键 在 于 如 何 得 到 用 户 栈 的 地 址 。 不 过 好 在 处 理 




















当 从 用 户 态 进 入 内 核 态 时 




















于 特权 级 发 生 了 变化 ， 处 理 器 会 自动 在 内 核 栈 中 




















YH 











[一 











门 再 读 出 来 ， 

















一 个 段 4GB 大 小 ， 





























再 添加 一 定 的 偏 移 量 ， 
要 完成 这 次 尝试 ， 需 要 改造 两 个 地 方 ， 











就 能 获得 用 户 进 程 传 入 的 参数 。 


< 日 
个 是 用 









































户 空 间 


































































































中 的 参数 处 理 ， 咱 们 先 改 进 下 用 户 进程 的 参数 传递 部 分 ， 
代码 12-10 
1 #include "syscall.h" 
2 
3 /* 无 参数 的 系统 调用 */ 
4 #define syscall0 (NUMBER) ({ N 
5 int retval; N 
6 asm volatile ( \ 
7 "pushl S$[number]; int $0x80; addl $4, S$%esp"\ 
8 : "=a" (retval) \ 
9 : [number] "i"™" (NUMBER) \ 
10 : "memory" SS 
] ); 
2 retval; 站 
13: 了 ) 
… 瞄 
42 /* 三 个 参数 的 系统 调用 */ 
43 #define syscall3 (NUMBER， ARGO, RARG1，RARG2) ({ 
44 int retval; 
45 asm volatile ( 
46 "pushl %S[arg2]; Pushl %[argl]; Pushl %[arg0]; 
47 "pushl S$[number]; int $0x80; addl $16, SS%esp" 
48 : "=a" (retval) 
49 : [number] "ii" (NUMBER), 
50 [arg0] "g" (ARGO), 
当主 [arg1l] "g" (ARG1) ， 
SZ [arg2] "g" (ARG2) 
53 : "memory" 
54 ); 
oe retval; 
56' -39) 
与 了 
58 /* 返回 当前 任务 pid */ 
59 uint32 t getpid() { 
60 return syscall0 (SYS GETPID); 
61 } 
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m \ 


H 来 就 行 了 。 有 了 3 特权 级 栈 





( project/c12/a_stack_syscall/lib/user/syscall.c ) 


1 于 我 介 











器 已 经 帮 虽 们 埋 下 了 
压 入 3 特权 级 栈 的 选择 
] 把 段 描述 符 设 置 为 了 
的 栈 顶 指针 ， 


























的 参数 传递 ， 另 一 个 是 0x80 中 断 处 理 例 程 
如 代码 12-10 所 示 。 





















































































































































































































































12.2 ”系统 调用 的 实现 
这 里 只 列 出 了 两 个 代表 性 的 _syscall， 无 参数 的 _syscall0 和 3 个 参数 的 _syscall3， 虽然 getpid 中 用 到 的 

是 _syscall0， 但 还 是 介绍 下 稍微 复杂 一 点 的 _syscall3，_syscall0 与 它 同 理 。 系 统 调用 需要 参数 和 子 功能 号 ， 
因此 用 户 程 序 要 在 执行 int 0x80 前 将 参数 和 子 功能 号 压 入 用 户 栈 ， 这 里 约定 下 ， 参 数 先 压 入 栈 ， 子 功能 号 后 
压 入 栈 ， 只 有 提前 确定 好 它们 在 栈 中 的 次 序 , 相应 的 0x80 号 中 断 处 理 程 序 才能 正确 获取 到 参数 及 子 功 能 号 。 
代码 第 43 行 是 宏 syscall3 的 定义 ， 在 内 联 汇编 中 ， 这 里 并 没有 像 Linux 那样 用 序号 占 位 符 ， 原 因 是 
序号 占 位 符 不 够 灵活 ， 需 要 与 约束 的 次 序 绑 定 ， 因 此 这 里 用 的 是 名 称 占 位 符 ， 在 第 49 一 52 行 ， 将 同名 的 
大 写 参数 转 而 用 小 写 名 称 作为 占 位 符 。 第 46 行 按照 调用 约定 ， 将 3 个 参数 从 右 往 左 依次 入 栈 。 第 47 行 
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故 了 三 件 事 ， 先 压 入 子 功能 号 ， 再 执行 nt 0x80 触发 软 中 断 ， 最 后 通过 addl $16, %%esp 使 栈 顶 指针 +16， 
跨 过 栈 中 的 3 个 参数 和 子 功能 号 。 
下 面 看 一 下 0x80 号 中 断 处 理 例 程 的 代码 ， 如 代码 12-11 所 示 。 
代码 12-11 (project/c12/a_stack_syscall/kernel/kernel.S ) 
… 略 
QO en ORO rh Va 
99, [bits’ 32] 
100 extern syscall table 
101 section .text 
102 global syscall handler 
103 syscall handler: 
104 
105 ; 系统 调用 传 入 的 参数 在 用 户 栈 中 ， 此 时 是 内 核 栈 
106 ;1 保存 上 下 文 环境 
107 push 0 ; 压 入 0， 使 栈 中 格式 统一 
108 
109 push ds 
TQ push es 
le push fs 
过 push gs 
113 pushad ; PUSHAD 指令 压 入 32 位 寄存 器 ， 其 入 栈 顺 序 是 : 
114 ; EAX,ECX,EDX,EBX,ESP,EBP,ESI,EDI 
5 
116 push 0x80 ; 此 位 置 压 入 0x80 也 是 为 了 保持 统一 的 栈 格式 
117 
118 ;2 从 内 核 栈 中 获取 cpu 自动 压 入 的 ' 栈 指针 esp 的 值 
119 mov ebx [esp + 4+ 48 +4+12 
120 
121 ;3 再 把 参数 重新 压 在 内 核 栈 中 ， 此 时 ebx 是 用 户 栈 指针 
L122 此 处 只 压 入 了 三 个 参数 ， 所 以 目前 系统 调用 最 多 支持 3 个 参数 
123 push dword [ebx + 12] ; 系统 调用 的 第 3 个 参数 
124 push dword [ebx + 8] ; 系统 调用 的 第 2 个 参数 
125 push dword [ebx + 4] ; 系统 调用 的 第 1 个 参数 
126 mov edx, [ebx] ; 系统 调用 的 子 功能 号 
127 
128 ; 编译 器 会 在 栈 中 根据 c 函数 声明 匹配 正确 数量 的 参数 
129 call [syscall table + edx*4] 
130 add esp, 12 ; 跨 过 上 面 的 三 个 参数 
3 
132 ;4 将 call 调用 后 的 返回 值 存 入 待 当 前 内 核 栈 中 eax 的 位 置 
3 mov [esp + 8*4], eax 
134 jmp intr exit ; intr_exit 返回 ,恢复 上 下 文 
第 98 一 116 行 同 寄存 器 传 参数 的 版 本 相同 , 第 119 行 是 在 内 核 栈 中 获取 用 户 空 间 的 栈 指针 , 给 大 伙 儿 





说 明 下 “[esp +4+48+4+12]” 这 里 的 esp 是 当前 内 核 栈 项 ， 后 对 
面 的 push 0x80 所 占 的 位 置 ，48 是 上 


站 
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X4 王 48 字 节 ， 





(4+8) 


es 
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1> 





















































j 的 数字 是 偏 移 上 














机 4 个 push 段 寄存 器 操作 和 1 个 pushd 压 入 的 8 个 
2 个 4 是 上 面 占 位 用 的 错误 码 0。 最 后 的 12 是 这 样 的 ，! 



































低 特 权 进 入 高 特权 级 ， 它 会 把 ss3、esp3、eflag、cs、eip 依次 压 入 栈 中 ， 


要 跨 过 eip、cs 和 eflags， 所 以 添加 了 12 字 节 的 偏 移 上 
“mov ebx, [esp+4+48+4+12]” 在 内 核 栈 中 esp3 位 置 取 值 ， 将 值 写 入 寄存 器 ebx， 故 ebx 此 时 是 用 
第 123 一 126 行 按照 咱们 之 前 的 约定 ， 以 系统 








中 获取 用 户 进 











程 传 入 的 系 








二 ， 左 边 第 1 个 4 是 上 


通用 寄存 器 ， 总 












































k 20 字 节 。 为 

















Ey 






































统 调 | 





| 参数 及 子 功 能 号 。 


周 


这 样 esp 十 4 二 48 


























] 参 数 最 先 压 入 ， 子 功能 号 后 月 


断 发 生 后 ， 处 理 器 由 
访问 到 栈 中 的 esp3， 需 


4+ 12 便 指 向 栈 中 esp3 的 位 置 ， 代 码 





户 栈 顶 指针 。 














E 入 的 顺序 ， 从 用 户 栈 
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此 时 ebx 中 的 值 便 是 子 功能 号 ， 在 第 129 行 通过 “call [syscall table + edx*4]” 调 用 子 功能 处 理 函 数 。 
以 上 就 是 通过 栈 传递 参数 的 系统 调用 版 本 ， 运 行 结 果 与 寄存 器 传 参 的 版 本 一 致 ， 不 再 单独 贴图 。 
好 啦 ， 本 节 到 此 结束 ， 兄 弟 们 再 见 。 


蕊 让 用 户 进程 “说 话 " 


虽然 用 户 进程 已 经 跑 起 来 了 ， 但 一 直 以 来 我 们 都 借助 内 核 线程 帮 它 打印 消息 ， 它 从 来 没 真正 “开口 说 话 ” 
这 一 次 我 们 要 为 它 安装 个 “嘴巴 ”有 了 哈 事 让 它 自己 “说 ”这 就 是 大 家 非常 熟悉 的 格式 化 输出 函数 一 一 printf。 


12.3.1 可 变 参 数 的 原理 


在 我 们 平时 使 用 的 函数 中 ,大 部 分 都 是 参数 个 数 已 知 的 函数 ， 比 如 字符 串 函 数 “strlen(const char* s)”， 
只 有 一 个 参数 s, 还 有 一 小 部 分 函数 , 它们 的 参数 个 数 是 不 固定 的 , 这 称 为 可 变 参 数 , 本 节 要 介绍 的 printf 
就 是 其 典型 应 
为 了 引出 本 节 介绍 的 重点 ， 先 得 来 点 铺垫 。 大 伙 儿 知道 , 起 初 人 们 发 明 计 算 机 的 目的 是 使 人 们 从 重复 、 
宛 长 、 易 出 错 的 工作 中 解脱 出 来 ， 用 程序 来 代替 人 工 ， 一 方面 原因 是 计算 机 比 人 要 快 ， 而 且 在 正常 情况 下 
不 会 出 错 ， 另 一 方面 是 此 类 工作 的 流程 是 固定 的 ， 执 行 过 程 中 不 会 出 现 意 外 的 步 又， 程序 中 的 每 一 步 都 可 
以 提前 确定 下 来 ， 而 那 时 候 的 操作 系统 和 编译 器 能 力也 有 限 ， 只 支持 这 种 能 够 提前 确定 下 来 的 程序 ， 因 此 
那 时 候 的 程序 也 只 能 够 取代 人 们 那些 具有 重复 性 、 步 骤 有 限 且 明确 的 工作 。 所 以 ,， 那 时 的 编译 器 对 程序 源 
码 的 要 求 很 苛刻 ， 不 允许 源码 中 存在 未 知 的 东西 ， 究 其 原因 ， 是 那 时 候 的 编译 器 和 操作 系统 都 较 落 后 ， 操 
作 系 统 只 会 在 加 载 程序 时 为 其 分 配 内 存 ， 而 且 只 分 配 这 一 次 ， 我 们 把 程序 本 身 占 用 的 内 存 称 为 静态 内 存 。 
而 程序 在 运行 时 若 需要 新 的 内 存 空间 ， 操 作 系统 就 无 能 为 力 了 ,我 们 把 这 种 程序 运行 过 程 中 额外 需求 的 内 
存 称 为 动态 内 存 。 由 于 受 限 于 操作 系统 ， 那 时 候 的 编译 器 只 支持 能 够 事先 确定 大 小 的 程序 结构 ， 也 就 是 编 
译 出 来 的 程序 全 部 都 使 用 静态 内 存 。 在 这 样 艰苦 的 条 件 下 ， 人 们 为 了 满足 运行 时 的 内 存 要 求 ， 在 程序 源码 
中 预先 定义 个 大 数组 作为 运行 时 的 内 存 池 。 随 着 计算 机 的 进步 ， 操 作 系 统 开始 支持 扒 内 存 管理 ， 堆 内 存 专 
门 用 于 程序 运行 时 的 内 存 申请 ， 因 此 编译 器 也 开始 支持 程序 在 运行 时 动态 内 存 申请 ， 也 就 是 编译 器 开始 文 
持 源码 中 的 变 长 数据 结构 。 程 序 中 的 数据 结构 终归 有 个 长 度 ， 此 长 度 要 么 在 编译 时 确定 ， 要 么 在 运行 时 确 
定 。 编译 时 确定 是 指数 据 结构 在 源码 编译 阶段 就 能 确定 下 来 , 说 白 了 就 是 编译 器 必须 提前 知道 数据 结构 的 
长 度 ， 它 为 此 类 数据 结构 分 配 的 是 静态 内 存 ， 也 就 是 程序 被 操作 系统 加 载 时 分 配 的 内 存 。 运 行 时 确定 是 指 
数据 结构 的 长 度 是 在 程序 运行 阶段 确定 下 来 的 ， 编 译 器 为 此 类 数据 结构 (如 C99 中 的 变 长 数组 ) 在 堆 中 
分 配 内 存 ， 己 经 说 过 了 ， 堆 本 来 就 是 用 于 程序 运行 时 的 动态 内 存 分 配 ， 因 此 可 以 在 运行 阶段 确定 长 度 。 
下 面 说 一 下 函数 。 函 数 占用 的 也 是 静态 内 存 ， 因 此 也 得 提前 告诉 编译 器 自己 占用 的 内 存 大 小 。 为 了 在 
编译 时 获取 函数 调用 时 所 需要 的 内 存 空 间 〈( 这 通常 是 在 栈 中 分 配 内 存单 元 )， 编 译 器 要 求 提供 函数 声明 ， 
声明 中 描述 了 函数 参数 的 个 数 及 类 型 ,编译 器 用 它们 来 计算 参数 所 占据 的 栈 空间 。 因 此 编译 器 不 关心 函数 
声明 中 参数 的 名 称 ， 它 只 关心 参数 个 数 及 类 型 (您 懂 的 ， 函 数 声明 中 的 参数 可 以 不 包括 参数 名 ,但 必须 包 
括 类 型 )， 编 译 器 用 这 两 个 信息 才能 确定 为 函数 在 栈 中 分 配 的 内 存 大 小 。 重 点 来 了 ， 函 数 并 不 是 在 堆 中 分 
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配 内 存 ， 因 此 它 需 要 提前 确定 内 存 空间 ， 这 通常 取决 于 参数 的 个 数 及 类 型 a 

大 小 ， 但 编译 器 却 允 许 函数 的 参数 个 数 不 固 定 ( 可 变 参 数 )， 怎 么 看 上 去 显 arg n 

得 那么 “动态 ”? 其 实 可 变 参数 的 这 种 “动态 ”只 是 一 种 幻想 ， 本 质 上 还 和 , 

是 静态 ， 这 一 切 得 益 于 编译 器 采用 C 调用 约定 来 处 理 函数 的 传 参 方式 。C Ee 

调用 约定 规定 ， 由 调用 者 把 参数 以 从 右 向 左 的 顺序 压 入 栈 中 ， 并 且 由 调用 a 

者 清理 堆栈 中 的 参数 。 我 们 拿 格式 化 输出 函数 printf(char* format，argl， 返回 地 址 eip | 。 esp 
arg2，...) 举 例 ， 其 中 的 参数 format 就 是 大 伙 儿 再 熟悉 不 过 的 包含 “% 类 型 

字符 ”的 字符 串 ， 其 调用 后 栈 中 布局 如 图 12-7 所 示 。 4 图 12-7 ”可 变 参 数 在 栈 中 的 布局 
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您 看 ， 既 然 参数 是 
此 无 论 函 数 的 参数 个 数 是 否 
此 ， 看 似 “ 动 态 ” 
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阶段 就 确 





定 下 





在 编译 





说 了 半天 ， 似 乎 还 没 说 到 “点 ”- 
BB 中， 此 


Ar 器 


格式 化 字符 上 





来 的 。 





Ar 器 


字符 上 








的 字符 "%' 便 是 在 栈 ， 











Wy 


J 
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关 的 内 容 。 格 式 化 字 





符 串 ， 





有 多 少 '%'， 





















































固定 ， 采 用 C 调 
的 可 变 参数 函数 ， 其 实 也 是 “静态 ”“ 
































加 








用 约定 ， 调 用 者 都 能 完好 地 
固定 ” 








收 栈 空间 




















， 如 何 知 道 栈 9 





> pr 呈 


字符 上 








sr hr 


子 付 ， 
找 多 少 次 参数 ， 尽 管 











| 日 





就 在 栈 

























































































当然 知道 栈 中 压 入 了 几 个 参数 ， 参 数 占有 
， 不 必 担 心 栈 
的 ， 传 入 参数 的 个 数 是 由 编 i 


有 多 少 个 参数 呢 ， 如 何 找 到 它们 呢 ? 其 实 
通常 称 为 format， 不 知道 什么 是 格式 化 
中 的 第 1 个 参数 ， 比 如 printf (”hello %s!”, ”martin”)， 其 中 的 ”hello %s!”* 介 
找 可 变 参 数 的 依据 ， 紧 跟 %' 后 面 的 是 类 型 





有 目 了 多 少 空 | 
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Tr 


答案 全 在 








a? 其 实 您 太 熟 悉 了 ， 就 是 printf 
便 是 format。 在 格式 化 
类 型 字符 表示 数 
j 户 (程序 员 ) 输入 '% 咱 


rr Apr 器 


字符 
中 类 型 和 进 





中 
央 相 
的 数量 可 以 








如 
1 
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和 参数 个 数 不 一 致 ， 但 那 是 用 户 自己 的 事 ， 除 非 用 户 愿 意 扳 起 石头 砸 自己 的 脚 , 编译 器 也 不 会 检查 它们 的 
数量 是 否 匹 配 ， 因 为 参数 处 理 与 否 是 函数 自己 的 行为 ， 由 函数 体内 的 代码 决定 。 总 之 正常 情况 下 ， 用 户 传 
入 可 变 参数 的 数量 应 与 format 中 字符 '%' 的 数量 匹配 ， 以 format 中 的 '%' 作 为 参数 的 线索 ， 每 找到 一 个 '%'， 
就 到 栈 中 去 找 一 次 参数 。 




















好 啦 ， 经 过 上 面 














变 参 数 的 支持 。 为 方便 引 
我 机 器 上 的 路 径 是 “/usr/lib/gcc/i686-redhat-Linux/4.4.4/include/”)， 如 

这 3 个 宏 va_start、va_end 和 va arg 都 以 va (Variable Argument) 
门 的 值 都 是 以 _builtin 为 开头 的 内 
值 为 builtin va_start(v,]))， 那 
尼 ? 哈哈 , 都 说 了 是 内 建 











AD 


付 三 ， 





建 








开头 ， 表 示 可 变 参数 ， 
就 拿 va_start(v,]) 来 说 ， 

_builtin_va_start 的 实现 又 是 什么 
能 ， 因 此 肯定 要 挖 到 gcc 的 源码 
源码 文件 gcc-4.9.0/gcc/builtins.c 中 是 | 


的 讨论 ， 我 相信 大 


| 荫 























vw 





但 这 里 


1 








它 的 












































人体 实现 我 也 不 恒 


得 对 编译 原理 





























现 
输 





套 处 肖 
如 图 12-9 所 示 。 




















弄 清楚 这 


#include <stdarg.h> 


void va_start(va_list ap, last); 

type va_arg(va_list ap, type); 

void va_end(va_list ap); 

void va_copyCva_list dest, va_list src); 


DESCRIPTION 


A function may be called 


数 中 的 可 变 参数 ，4 


及 gcc 源码 有 
虽然 无 法 渗透 到 编译 器 中 了 解 这 3 个 宏 的 最 终 实 现 , 但 中 
E 变 参 的 方法 。 为 了 














导 


可 变 参 数 是 怎么 回 事 了 ， 下 
用 译 器 gcc 的 头 文件 stdarg.h 上 
加 


伙 儿 已 经 非常 清楚 
































12-8 所 示 。 





FP 定 义 了 3 个 宏 〈 此 文件 在 





面 说 说 Linux 中 对 可 

















受 ] 


12-8 








A 
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符号 





























了 ,内 建 builtin 的 意思 就 是 指 
了 ，gcc 的 内 建 函 数 都 放 在 其 源码 文件 builtins.c 中 ， 拿 gcc-4.9.0 来 说 ， 在 其 


肯 函 数 static rtxexpand builtin_ va_start (tree exp) 来 处 理 “builtin va start 的 ， 


可 变 参 数 安 


在 程序 内 部 实现 的 功 




















了 解 的 同学 可 以 贡献 一 

















下 自己 的 力量 ， 在 此 小 弟 4 





E 谢 过 。 


























们 只 要 到 


j， 先 在 Linux 中 查看 






































几 个 宏 的 作 








E 解 这 3 四 太 的 原 到 
帮助 ， 执 行 man 3 stdarg 后 


要 己 就 可 以 实 
回 车 ， 














上 上》 











with qa varying number of arguments of varying types. The include file <stdarg.h> declares a type 


va_List and defines three macros for stepping through a list of arguments whose number and types are not known to the called 


function . 


The called function must declare an object of type va_list which is used by the macros va_start()，va_arg()，and va_endO. 


va_startO 


The va_start() macro initializes ap for subsequent use by va_arg() and va_end(), and must be called first. 


va_argO 
The va_arg() macro expands to an expression that has the type and value of the next argument in the call. 
the va_list ap initialized by va_startO. 


The argument 


type 


obtained simply by adding a * to type. 


. vendO 


Each call to va_arg() modifies ap so that the next call returns the 


Each invocation of va_start() must be matched by a _ corresponding invocation of vaLendC) in the same function. 
va_end(ap) the variable ap is undefined. Multiple traversals of the list, each bracketed by va_start() and va_end() are possi- 
ble. va_end() may be a macro or a function. 





man 3 stdarg 输 昌 





ap (argument po 





便 介绍 它们 ， 和 大 伙 儿 约定 下 这 上 








A 图 











12-9 ”stdarg 帮助 


The argument ap is 


next argument. 


is a type name specified so that the type of a pointer to an object that has the specified type can be 


After the call 


8 的 内 容 还 是 很 多 的 ， 图 12-9 只 是 重点 部 分 的 截屏 ， 现 在 简要 介绍 下 这 3 个 宏 ， 为 方 




















inter) 是 个 指 旬 


| 变 











三 贞 
耳 


旦 ， 








表示 参数 的 指针 ， 用 来 指 











的 可 变 参 数 是 指 已 被 压 入 栈 中 的 1 个 或 多 个 参数 ， 参 数 个 数 未 知 。 
向 可 变 参 数 在 栈 中 的 地 址 。 
ap 的 类 型 为 va_list，va_list 是 什么 昵 ? 大 估 儿 已 经 知道 ap 是 个 指针 变量 了 ， 故 va_list 本 质 | 





上 是 指针 
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第 12 章 进一步 完善 内 核 

















一 系列 的 参数 列表 “%x%d%f...”， 故 va_list 的 类 型 是 char*。 


下 面 是 3 个 宏 的 说 明 。 











(1) va_start(ap,v)， 人 参数 ap 是 





必须 先 于 其 他 两 个 宏 ， 相 当 于 初始 
(2) va_ arg(ap,t)， 参 数 ap 是 用 











(3) va_end(ap)， 将 指向 可 
好 啦 ， 有 关 可 变 参数 的 民 


3 个 宏 ， 在 代码 中 实践 会 是 理解 






































12.3.2 ”实现 系统 调用 wri 

我 们 当初 学 习 C 语言 时 ， 写 出 的 第 
因此 在 使 用 
标准 输出 ( 
作用 的 是 write 系统 调 


te 






























































加 
j 。 您 看 ， 























write 接受 3 个 参数 ， 其 中 的 fd 是 文件 



























































其 值 。 








口 ， 老 方法 ， 














i 述 符 ，buf 是 被 




















输出 数据 所 在 的 缓冲 区 ，count 是 输出 的 字符 数 ，write 的 功 
能 是 把 buf 中 count 个 字符 写 到 文件 描述 符 锯 指向 的 文件 中 。 
您 看 , 由 于 咱们 还 没 实现 文件 系统 ,更 谈 不 上 文件 描述 


















































符 得 了 ， 故 本 节 完 成 write 只 能 是 个 简易 版 ， 等 将 来 完成 文 











件 系统 后 再 把 它 改造 成 标准 实现 。 














write 是 个 系统 调用 ， 还 记得 前 面 总 结 的 添加 系统 调用 
的 3 个 步骤 吗 ? 咀 们 按照 这 3 个 步骤 完成 简单 版 write 系统 调用 。 











第 1 步 先 在 syscallh : 
所 示 。 











代码 12-12 

#ifndef _LIB USER SYSCALL H 
#define LIB USER SYSCALL H 
#include "stdint.h" 
enum SYSCALL NR { 

SYS_GETPID, 

SYS_ WRITE 
}; 
uint32 七 getpid(void) ; 
uint32 t Write (Charx Str) 
#endif 


O 〇 Do- 性 wmN 哺 


js 











第 2 步 在 syscall.c 中 增加 系统 调用 的 用 








= 
征 





， 由 于 ap 用 于 指向 栈 中 可 变 参数 的 地 址 ， 其 所 指向 的 参数 类 型 未 知 ， 故 va_list 应 该 是 较 通用 的 指针 
是 void* 或 char* 都 可 以 ， 但 从 名 称 上 看 va_list 是 可 变 参数 的 列表 ， 














这 让 人 联想 到 字符 串 format 中 


于 指向 可 变 参 数 的 指针 变量 ， 参 数 v 是 文 持 可 变 参数 的 函数 的 第 1 个 
参数 〈 如 对 于 printf 来 说 ， 参 数 v 就 是 字符 串 format)。 此 宏 的 功 
化 ap 指针 的 作用 。 
于 指向 可 变 参 数 的 指针 变 
使 指针 ap 指向 栈 中 下 一 个 参数 的 地 址 并 返回 
] 变 参数 的 变量 ap 置 为 null， 也 就 是 清空 指针 变量 ap。 


台 已 


能 是 使 指针 ap 指向 v 的 地 址 ， 它 的 调用 





量 ， 参 数 1 是 可 变 参数 的 类 型 ， 此 宏 的 功能 是 











有 理 就 介绍 到 这 ， 如 果 您 此 时 尚未 完全 
它们 的 最 佳 方式 。 


E 起 到 “格式 化 ” 作 
FE 呵 ， 哈 哈 ， 咱们 先 去 实现 它 
man 2 write 








有 白 也 没关系 ， 下 节 咀 们 会 实现 以 上 这 

















人 名 “hello,worldn” 就 是 用 printf 函数 来 完成 的 ， 它 是 标准 io 函数 ， 
它 之 前 需要 include <stdio.h>。printf 函数 是 “格式 化 ”“ 输 出 ”函数 ， 将 格式 化 后 的 信息 输出 到 
通常 是 屏幕 )。 但 它 只 是 个 外 壳 ， 真 
白 对 printf 膜拜 了 N 多 稀 
系统 调用 。 查 看 下 Linux 系统 调用 write 的 接 
































函数 ， 真 正 起 “输出 ?” 
的 幕后 功臣 一 一 write 
图 12-10 所 示 。 








的 是 vsprintf 


























回 车 ， 输 出 如 





NAME 
write - write to a file descriptor 


SYNOPSIS 
#include <unistd.h> 


ssize_t writeCint fd, const void *buf, size_t count); 


DESCRIPTION 
write() writes up to count bytes from the buffer pointed 


buf to the file referred to by the file descriptor fd. 


12-10 系统 调 











受 ] 














Write 














的 结构 enum SYSCALL NR 里 添加 新 的 子 功能 号 SYS_WRITE， 如 代码 12-12 





( project/c12/b/lib/user/syscall.h ) 


户 接口 ， 如 代码 12-13 所 示 。 








代码 12-13 
… 略 
56 /* 打印 字符 串 str */ 
57 uint32 七 write(char* str) { 
58 
58 3} 





( project/c12/b/lib/user/syscall.c ) 


return _syscalll (SYS WRITE, str); 

















i 


您 看 ， 咱 们 的 write 真 的 是 名 符 划 
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实 的 简易 版 ， 它 只 


EB 


需 


要 























一 个 参数 ， 作 用 是 向 





屏幕 上 打印 str。 这 里 用 





一 个 参数 的 宏 syscalll 来 完成 系统 调用 。 






































第 3 步 在 syscall-init.c 中 定义 子 功能 处 班 


代码 12-14 





性 Ar 呈 


/* 打印 字符 
Uint32 七 sys write(char* str) 
console put strl(str); 
return strlenl(str); 





{ 


} 
/* 初始 化 系统 调用 */ 


void syscall init (void) 














{ 





函数 sys_write 并 在 syscall table 中 注册 ， 如 代码 12-14 所 示 。 








( project/c12/b/userprog/syscall-init.c ) 


str ( 未 实现 文件 系统 前 的 版 本 ) */ 


sys_getpid; 
sys write; 


26 put_str("syscall init start\n"); 
27 syscall table[SYS_GETPID] = 

28 syscall table[lSYS WRITE] = 

29 put_ str("syscall init done\n"); 
30: 下 

















sys_write 的 实现 很 简 让 
write 会 返回 输出 的 字符 个 数 。 








> 





口 














直接 用 console put _ str(s 由 输出 str。 最 后 用 strlen(str) 返 回 str 的 长 度 ， 也 就 是 


好 啦 ，write 暂时 完成 了 ， 目 前 的 简易 版 对 实现 printf 来 说 已 经 足够 了 ， 待 以 后 有 了 文件 系统 后 再 改进 


write。 另 外 ， 这 里 就 不 单独 测试 write 啦 ， 以 后 











攻 














的 。 





] printf 测试 也 是 一 档 














12.3.3 ”实现 printf 

















原型 是 2 





printf 是 我 们 C 语言 标准 输出 函数 ， 


“int printf(const char *format, ...); 
其 中 的 format 就 是 格式 化 字符 串 ， 上 
符 ,“%d” 用 于 输出 十 进 制 整 型 等 
化 字符 串 format 向 标准 输出 打印 字符 


























> 








[= 
日 














如 
1 























节 的 目标 是 使 printf 支持 十 六 进 








面包 含 “% 类 型 
“... ”表示 参数 数量 
和 。 如 前 所 述 ，printf 是 vsprintf 和 write 的 封装 ，write 已 经 完成 ， 本 
节 要 完成 vsprintf、 用 于 可 变 参数 解析 的 3 个 宏 以 及 转换 函数 itoa， 这 些 实现 后 就 
由 输出 ， 即 完成 “%x” 的 功能 。 


pr AT 


字符 
不 


[=z 


字符 ”如 “%c” 它 用 于 输出 单个 字 
可 变 参 数 。 此 函数 的 功能 是 根据 格式 


2 “% 类 型 
固定 ， 即 



































i 完成 了 基本 的 printf， 本 








先 看 一 下 函数 vsprintf 作 用 ,在 Linux 中 执行 man vsprintf, 可 以 看 到 其 原型 是 “int vsprintf(char *str, const 


char *format, va list ap);”。 出 


换 标记 ， 不 修改 原 格式 


ZA 





> Ar 器 


字符 将 


B format， 


























函数 的 功能 是 把 ap 指向 的 可 变 参 数 ， 以 字符 串 格 式 format 中 的 
format : 


”替换 成 具体 参数 后 写 入 str 中 对 应 “% 类 型 





符号 '%' 为 蔡 
字符 ”以 外 的 内 容 复制 到 stt， 把 “% 类 型 字 


的 位 置 ， 也 就 是 说 函数 执行 后 ，str 的 内 容 相 当 于 格 














除 “% 类 型 














pA 


和 手 付 














符 
式 字 符 串 format 中 的 “% 类 型 字符 ”被 
不 做 修改 ，format 只 是 被 参考 的 格式 ， 如 


str 对 应 的 第 








本 





2 


唱 

















人 体 参 数 蔡 换 后 的 format 


第 
1> 


2 个 '%' 处 ，vsprintf 执行 完成 后 返回 
您 看 ， 之 所 以 printf 能 按照 格式 化 输出 ， 或 者 说 


字符 串 ， 再 次 提醒 ， 原 格式 字符 串 format 
1 个 参数 插入 到 str 中 对 应 的 第 1 个 '%' 处 ， 第 2 个 参数 插入 到 
字符 串 str 的 长 度 。 


字符 
是 能 把 BB format 中 的 “% 类 型 








记 zr Ar 


字符 


A Ar 9») 


字符 ” 蔡 换 为 具体 












































参数 ,这 全 是 vsprintf 的 功劳 。 I 








们 马上 动手 实现 它 吧 ,vsprintf 定义 在 文 从 





F lib/stdio.c 中 ， 请 看 代码 12-15。 






















































































代码 12-15 (project/c12/b/lib/stdio.c ) 
… 略 
8 #define va start(ap, v) ap = (va list)&yv // 把 ap 指向 第 一 个 固定 参数 v 
9 #define va arg(ap, t) *((t*) (ap += 4)) // ap 指向 下 一 个 参数 并 返回 其 值 
10 #define va endl(ap) ap = NULL // 清除 ap 
I 
12 /* 将 整 型 转换 成 字符 ( integer to ascii) */ 
13 static void itoa(uint32 七 value, char** buf ptr_addr, uint8 t base) 
14 uint32 t m = value % base; // 求 模 ， 最 先 掉 下 来 的 是 最 低位 
45 uint32 t i = value / base; // 取 整 
16 主 丰 如 ( 汪 }》- 不 // 如 果 倍 数 不 为 0， 则 递归 调 
二 学 itoa(i, buf ptr addr, base); 
18 } 
19 if (m < 10) { // 如 果 余 数 是 0 一 9 
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20 *((*buf ptr addr)++) = m+ '0'; // 将 数字 0 一 9 转换 为 字符 '0' 一 '9' 
21 } else { // 否则 余数 是 A~F 

22 *((*buf ptr addr)++) = m - 10 + 'A'; // 将 数字 A~F 转换 为 字符 'R' 一 "FE 
23 } 

24 } 

25 























26 /* 将 参数 ap 按照 格式 format 输出 到 字符 串 str， 并 返回 替换 后 str 长 度 */ 
27 uint32 七 vsprintf(char* str, Const char* format, va list ap) { 

























































































28 char* puf ptr = str; 

29 const char* index ptr = format; 

30 char index char = *index ptr; 

31 NES2. Et rg -Int 

32 while(index char) { 

学 if (index char != '%') { 

34 *(buf ptr++) = index char; 

35 index char = *(++index ptr); 

36 continue; 

37 } 

38 index char = *(++tindex ptr); // 得 到 后 面 的 字符 

39 switch(index char) { 

40 Case 'x': 

41 arg int = va arg(ap, int); 

42 itoal(larg int, &buf ptr, 16); 

43 index char = *(++index ptr); 
// 跳 过 格式 字符 并 更 新 index_char 

44 break; 

45 } 

46 } 

47 return strlen(str);} 

48 } 

49 

50 /* 格式 化 输出 字符 串 format */ 

51 Uint32 bt printtf(const ‘Char* fornaty ss) 

52 VaalLigt TT 

号 3 va start (args, format); // 使 args 指向 format 

54 char puf[1024] = {0}; 7 存储 拼接 后 的 字符 串 

vsprintf (buf, format, args); 

56 va end (args) 7 

57 return write (buf); 

S58 






































文件 开头 定义 了 用 于 处 理 可 变 参数 的 3 个 宏 ， 各 宏 的 功能 已 经 和 大 伙 儿 介绍 过 ， 下 面 介绍 下 各 宏 的 实现 。] 
中 用 到 的 va_list 定义 在 stdio.h 中 ， 代 码 是 “typedef char* va_list;” 因此 va_list 是 字符 指针 。 

va_start(ap，V) 的 作用 是 初始 化 指针 ap， 即 把 ap 指向 栈 中 可 变 参数 中 的 第 一 个 参数 v， 其 实 匠 
(va_list)&v。ap 和 v 的 类 型 都 是 char*， 但 不 同 的 是 ap 用 来 存储 v 的 地 址 &v，&v 的 类 型 实际 
因此 在 &v 前 用 (va_lisb 强 制 转换 为 一 级 指针 后 再 赋值 给 ap。 

va_arg(ap, 了 的 作用 是 使 指针 ap 指向 栈 中 下 一 个 参数 ， 并 根据 下 一 个 参数 的 类 型 { 返回 下 一 个 参数 的 
值 〈 曼 嗪 并 严谨 着 )， 其 实现 是 *x((t*)(ap += 4))。va_arg(ap, 必须 在 va_start(ap, Vv) 之 后 调用 ， 否 则 指针 ap 
未 初始 化 将 导致 错误 。 经 va_start 初始 化 后 ，ap 已 经 指向 了 栈 中 可 变 参 数 中 的 第 1 个 参数 ， 由 于 32 位 栈 
的 存储 单元 是 4 字 节 ， 故 (ap+=4) 将 指向 下 一 个 参数 在 栈 中 的 地 址 ， 而 后 将 其 强制 转换 成 t 型 指针 (t*)， 最 
后 再 用 * 号 取 值 ， 即 *((t*)(ap += 4)) 是 下 一 个 参数 的 值 。 

va_end(ap) 的 作用 就 是 回收 指针 ap， 清 空 ， 其 实现 为 ap = NULL。 

下 面 要 介绍 的 函数 是 itoa， 此 函数 的 作用 是 将 整 型 转换 为 字符 串 ， 也 就 是 integer to ascii。 其 原型 是 

“void itoa(uint32 t value, char** buf ptr_addr uint8 tbase)” 

此 函数 不 属于 Linux， 它 是 Windows 下 的 产物 ， 咀 们 这 里 借鉴 它 的 功能 ， 取 其 精华 。 

虽然 此 函数 并 不 是 今天 的 主角 ， 但 它 还 是 很 重要 的 ，itoa 接受 3 个 参数 ， 第 1 个 参数 value 是 待 转换 
的 整数 ， 第 2 个 参数 buf ptr_addr 是 保存 转换 结果 的 缓冲 区 指针 的 地 址 ， 这 里 多 说 两 句 ， 绥 冲 区 指针 本 身 
已 经 是 指针 了 ， 这 里 说 的 是 指针 所 在 的 地 址 ， 也 是 指针 的 指针 ， 即 二 级 指针 ， 因 此 类 型 是 char** 。 这 里 用 
二 级 指针 的 原因 是 : 在 函数 实现 中 要 将 转换 后 的 字符 写 到 缓冲 区 指针 指向 的 缓冲 区 中 的 1 个 或 多 个 位 置 ， 
这 取决 于 进 制 转 换 后 的 数值 的 位 数 ， 比 如 十 六 进 制 0xd 转换 成 十 进 制 后 变 成 数值 13，13 要 被 转换 成 字符 
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和 '3'， 所 以 数值 13 变 成 字符 后 将 占用 缓冲 

















友人 


此 每 写 一 个 字符 到 缓冲 区 后 ， 








改 指针 的 操作 , 最 方便 的 是 用 其 下 








要 更 











级 指针 buf_ptr addr， 这 样 便于 原 地 修改 
代码 就 清楚 了 。 第 3 个 参数 base 是 转换 的 基数 ， 也 就 是 进 制 。 
还 记得 printf 中 的 输出 类 型 吗 ? 比如 


























转换 ， 且 将 转换 结 
iota 的 任务 有 两 个 : 
后 递归 调 ) 






































]， 依 次 求 出 次 低位 








区 中 两 个 字符 位 置 
新 缓冲 区 指针 的 值 以 使 其 指 
一 级 指针 类 型 来 保存 此 指针 
级 指针 。 如 果 我 没 说 } 


%d 是 按照 十 进 
果 再 转换 成 字符 的 函数 ， 这 就 是 itoa 的 使 命 ， 下 面 




















个 是 数 制 转换 ， 原 型 





Ap 全 之 





， 子 付 与 




















三 


向 缓冲 区 中 下 


到 哪里 是 由 缓冲 区 指针 决定 的 ， 因 











个 可 写 入 的 位 置 , 这 种 原 ] 
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地 











的 地 址 ， 故 将 一 级 指针 的 地 址 作为 参数 传 给 二 











了 


























A 人 E， 





也 





许 您 要 问 了 ， 





会 儿 1 




















由 输出 ，%x 是 按照 











六 进 制 输出 ， 

















看 














4 的 实现 。 


[一 























次 高 位 、 最 高 位 ， 











们 多 看 看 实现 中 有 关 递归 的 
用 这 个 函数 干吗 ? 是 这 样 的 ， 

















此 必须 要 有 个 数 制 





EE 是 把 数值 对 基数 求 模 ， 先 掉 下 来 的 是 最 低位 个 位 )， 然 























台 忆 旧 
用 十 





为 0 时 结束 。 这 部 分 功 


一 级 的 最 低位 。 第 15 


台 b 上 昌 


























数值 转换 成 字符 ， 这 部 分 功 


字 加 上 字符 '0' 的 ASCII 码 ， 


用 十 








zz Ah 


字 答 




















然后 将 结果 写 入 绥 ; 











区 并 更 新 缓冲 区 指 






























































结果 写 入 缓冲 区 并 更 新 缓冲 
这 里 值得 注意 的 是 递归 


























区 指针 (一 级 
调用 过 程 中 , 第 14 


Eu 


BS- 
指针 )， 贞 





[第 22 行 





17 行 
第 19 行 ， 和 


他 








的 递归 调用 。 男 








1 果 掉 下 来 的 位 m 是 数字 0 一 9， 
'0' 一 '9' 在 ASCII 码 表 中 是 连续 的 ， 因 此 转换 原理 就 是 将 数 


直到 数值 无 法 整除 基数 ， 也 就 是 没有 数位 可 取 ， 倍 数 
代码 第 14 一 18 行 完成 的 。 第 14 行 是 对 基数 base 求 模 ， 也 就 是 逐步 求 出 每 
行 是 对 基数 base 取 整 数 倍 ， 此 整数 倍 用 于 第 
由 代码 19 一 23 行 完 成 的 。 在 
其 转换 成 对 应 字符 的 ASCII 码 ， 方 法 很 简单 ， 








个 是 将 转换 后 的 


将 
































(一 级 指针 )， 即 第 20 行 的 代码 
































行 的 求 模 运算 ,最 先 掉 




















习惯 ,最 高 位 在 左边 ， 最 低位 在 右边 ， 


大 












































区 的 ， 最 高 位 也 是 一 样 ， 虽 然 最 高 位 是 最 后 得 到 的 ， 但 其 对 应 的 字 








指针 值 的 变化 ， 因 此 函 








数 itoa |/ 
乡 傅 























一 下 ， 如 果 用 一 级 指针 作为 








个 全 局 变量 来 记录 ， 要 么 itoa 将 最 











A 缘 ， 
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新 指针 返 























就 有 























式 format 输出 到 








点 哈 宾 夺 主 了 ， 上 毕竟 今天 的 主 
在 代码 第 27 行 是 vsprint 的 定义 ， 在 本 节 开 头 
字符 串 str 并 返回 替换 后 str 的 长 度 。 
第 28 行 用 变量 buf ptr 指向 str， 不 喜欢 对 指针 型 














此 最 低位 虽然 是 最 先 得 到 


目 . 时 








“*((*buf ptr_ addr)++) =m+'0'” 在 第 21 行 ， 若 掉 下 来 的 位 m 大 于 9 〈 默 认为 0xA 一 0xF， 处 理 较 粗 糙 )， 则 


用 0xA 一 0xF 减 去 10 (0xA) 所 得 到 的 差 ， 加 J 





符 A 的 ASCII 码 ， 便 是 字符 'A' 一 中 的 ASCII 码 ， 然 后 将 
的 代码 “*((*buf ptr addn++) = m - 10 十 


'A'; 人 








下 来 的 是 最 低位 〈 个 位 )， 按 照 正 








的 ， 但 








其 转换 后 的 字符 














符 是 最 先 写 入 缓冲 








j 的 是 二 级 指针 作为 形 参 ， 




















缓冲 区 指针 作为 实 参 ， 









































便于 原 地 修改 一 级 指针 《此 处 为 缓冲 
于 参数 是 值 传递 ， 为 更 新 组 

















区 的 ， 这 涉及 到 缓冲 
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党 的 阅读 
后 写 入 缓冲 





却 是 最 





畜 区 | 


区 指针 )。 试 ; 
指针 的 值 ， 要 么 用 























， 多 少 都 有 些 麻 焕 ， 不 如 二 级 指针 原 地 修改 方 
不 是 它 ， 有 请 主 
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。 好 啦 ， 再 多 说 











9 vsprintf 登场 。 
,经 把 它 的 原理 介绍 了 ， 它 的 功能 是 将 参数 ap 按照 格 
4 参数 直接 操作 ， 后 续 都 用 buf ptr 指 代 str。 第 29 行 


用 index_ptr 指 代 形 参 format， 此 处 形 参 format 是 用 printf 函数 中 的 字符 串 format 作为 实 参 代 入 的 。 第 30 


行 index_char 指向 格式 字符 

第 32 行 用 
第 33 一 37 行 用 来 复制 format 
字符 %' 时 ， 也 就 是 找到 了 待 






































串 format 中 的 每 个 字符 ， 
while(index_char) 循 环 判 断 format 中 的 每 个 字符 index char， 直 到 index_char 为 结束 字符 \0'。 
中 除 '%' 以 外 的 字符 到 buf ptr， 也 就 是 复制 
寺 换 的 “% 类 型 字符 ”， 

















跳 过 字符 '%'， 
本 节 只 文 持 十 六 进 制 的 输出 ， 














也 就 是 类 型 符号 








va_arg(ap, int) 获 取 下 一 个 整 型 参数 , 将 结果 存储 到 变量 arg int 
进 制 ， 并 存储 到 buf ptr 中 ， 即 代码 “itoa(arg_int，&buf ptr 16);” 注意 ， 
故 在 第 43 行 的 














过 了 itoa 要 原 地 修改 buf ptr。 
跨 过 类 型 字符 'x'， 
最 














char* format, ...)， 其 中 的 “.. 


更 新 index_char 为 字符 x' 后 
后 要 介绍 的 就 是 “ 虚 有 其 表 ” 


此 























.” 表 示 可 变 参 数 。 








第 $S2 一 53 行 定义 了 变量 
对 其 初始 化 。 
第 54 行 定 义 了 1024 字 

















在 第 56 行 通过 宏 va_end(args) 使 args 








args ( 





节 大 小 的 数组 buf， 


三 


清空 。 最 后 














如 “%x” 为 了 获取 





时 index_ptr 指向 类 型 字符 'x'， 
下 的 下 一 个 字符 ， 
的 printf 啦 , 它 支 持 可 变 参数 ， 


其 实 就 是 ap)， 用 它 来 指向 














我 们 | 























“类 型 字符 ”7 
然后 取 值 ， 将 获取 到 的 类 型 字符 更 新 index_char。 随 后 在 第 39 行 用 switch 结 


j 它 来 找 字符 '%'。 








到 str 中 。 循 环 遍历 中 ， 当 index_char 为 





pa 














构 











。 随后 7 
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Ar 1 

























































































在 第 38 行 先 使 THindex_ptr 


对 index_char 判断 ， 


符号 为 X， 故 switch 中 只 有 case 为 x 的 分 支 。 在 此 分 支 中 ， 通 过 宏 
企 第 42 行 调用 itoa 将 arg_int 转换 为 十 六 
这 里 传 入 的 是 buf ptr 的 地 址 ， 前 下 











说 





Nf “index_char = *(++index ptD;” 
继续 下 一 轮 循环 在 format 中 找 字符 '%'。 
的 函数 声明 为 uint32 tprintfconst 


第 52 行 调 用 宏 va_start(args, format) 





























是 str， 完 成 之 后 























羽 此 它 

参数 ， 在 
j 它 来 存储 由 vsprintf 处 理 的 结果 ， 也 高 
第 57 行 执行 系统 调用 write(buf), 将 处 怪 


后 的 字符 串 输 出 。 
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好 啦 ， 该 说 的 都 说 了 ， 到 了 测试 的 时 候 了 ， 还 是 老 样 子 ， 修 改 main.c， 如 代码 12-16 所 示 。 
代码 12-16 (project/c12/b/kernel/main.c ) 


9 #include "stdio.h" 
略 





42 /* 在 线程 中 运行 的 函数 */ 
43 void k thread b (voidqx arg) { 





44 char* para = arg; 

45 console put str(" thread b pid:0x"); 
46 console put int (sys getpid()); 

47 console put char('\n'); 

48 while(1); 

49 } 

50 























51 /* 测试 用 户 进 程 */ 
52 void u prog a(lvoid) { 


53 printf(" prog a pid:0xsxNn"n"，， getpid()); 
54 while(1); 

SD 中 

56 























57 /* 测试 用 户 进 程 */ 
58 void u prog b(void) { 





















































59 printf(" prog b pid:0x%x\n", getpid()); 
60 while(1); 
61> 生 
还 是 以 getpid 为 例 ， 这 次 让 用 户 进 程 通过 printf 打印 出 自己 的 pid， 运 行 结果 如 图 12-11 所 示 。 
团 Bochs x86 emulaton http://bochs.sourceforge.net 一 x 












































init done 


p init done 
idt_init done 


nel_pool_phuy_a 
pool_phy_addr_ 


init start 
init done 
start 
init and ltr done 
3 all_init Start 
suscall init done 
main_pid:Qx1 


thread_a_p 
prog_b_pid 
4 











4 图 12-11 运行 的 结果 


独 地 一 看 ， 图 12-11 和 图 12-6 一 样 ， 但 其 实 框框 中 的 打印 顺序 不 一 样 了 ， 不 信和 您 回头 对 比 下 ， 好 叶 ， 
本 节 到 这 就 结束 了 ， 下 节 咱 们 继续 丰富 printf 的 功能 ， 让 它 支持 更 多 的 输出 格式 。 
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12.3.4 完善 printf 


上 节 中 , 咱们 的 printf 版 本 只 支持 十 六 进 制 “%x” 的 输出 , 本 节 再 接 再 厉 , 一 口气 拿 下 “%c”“%s” 和 “%d”。 
虽然 看 上 去 一 下 子 要 完成 3 种 类 型 输出 ， 但 由 于 完成 了 前 期 的 基础 工作 ， 本 节 的 工作 量 很 小 。 这 
里 还 是 修改 vsprintf， 在 其 switch 分 文中 加 入 类 型 字符 为 sS、c、d 的 处 理 ， 如 代码 12-17 所 示 。 


代码 12-17 (project/c12/c/lib/stdio.c ) 
































































































































.… 略 
26 /* 将 参数 ap 按照 格式 format 输出 到 字符 串 str， 并 返回 替换 后 str 长 度 */ 
27 uint32 七 vsprintf(char* str, Const char* format va list ap) { 
28 char* buf ptr = str; 
29 const char* index ptr = format; 
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30 char index char = *index ptr; 

当下 Tint32 七 二 本 1 七 7 

32 char* arg str; 

33 while(index char) { 

34 if (index char != '%$') { 

ee *(buf ptr++) = index char; 

36 index char = *(++index ptr); 

3 continue; 

38 } 

39 index char = *(++index ptr); // 得 到 % 后 面 的 字符 

40 switch(index char) { 

41 Case 's': 

42 arg_ str = va argl(ap, char*); 

43 strepy'(buf DEEY. 了 可 -23 七 下) 

44 buf ptr += strlen(arg str); 

45 index char = *(++index ptr); 

46 break; 

47 

48 Case 'c': 

49 *(buf ptr++) = va arg(ap, char); 

50 index char = *(++index ptr); 

51 break; 

52 

53 case 'd': 

54 arg int = va arg(ap， int); 

55 /* 若是 负数 ， 将 其 转 为 正 数 后 ， 在 正 数 前 面 输出 个 负 号 '-' */ 

56 if (arg int < 0) { 

2 arg int = 0 - arg int; 

58 *buf Ptr++ = 一 0 

59 } 

60 itoa(arg inty buf ptr, 410)» 

61 index char = *(++index ptr); 

62 break; 

63 

64 Case 'x': 

65 arg int = va arg(ap, int); 

66 itoa(larg -ints &buf ptry. 16); 

67 index char = *(++index ptr); 
// 跳 过 格式 字符 并 更 新 index_char 

68 break; 

69 } 

70 } 

2 return strlenl(str); 

了 2 3 

3 

74 /* 同 printf 不 同 的 地 方 就 是 字符 串 不 是 写 到 终端 ， 而 是 写 到 buf 中 */ 

75: Uint32% tt Sprintf (ohar* bufy .comst. char* ~ formaty. ss) 4 

5 va list args; 

了 uint32 七 retval; 

| va start (args, format); 

79 retval = vsprintf (buf, format, args); 

80 va end(args); 

81 return retval; 

82 } 





本 次 在 代码 第 32 行 增加 了 “char* arg_str”，arg_str 是 指针 变量 ， 专 门 处理 “%s” 也 就 是 打印 字符 串 ， 














在 Switch : 










































































增加 了 对 类 型 字符 's' 的 处 理 ， 代 码 是 第 41 一 46 行 。 我 们 知道 ， 当 操作 数 对 象 为 字符 串 时 ， 编 
译 器 只 会 把 字符 串 的 地 址 作为 操作 数 ， 并 不 会 把 整个 字符 串 中 的 全 部 字符 复制 一 份 作为 参数 ， 这 样 的 好 处 





是 显而易见 的 ， 节 省 了 时 间 与 空间 。 在 类 型 字符 为 's' 的 分 文中 ， 第 42 行 通过 宏 调用 va_arg(ap, char*) 获 取 
了 待 打 印字 符 串 的 地 址 , 返回 给 变量 arg_str, 第 43 行 通过 “strcpy(buf ptr, arg_str)” 将 待 打 印字 
拷贝 到 buf ptr 中 ， 这 就 完成 了 拼接 ， 然 后 更 新 buf ptr 的 指针 ， 跨 过 待 打印 字符 串 的 长 度 ， 即 代码 第 44 
行 的 “buf ptr += strlen(arg_ str)” 的 作用 。 第 45 行 更 新 index_char 的 值 为 类 型 字符 's' 后 面 的 字符 ， 即 








“index_char = *(++index_ptr);” 至 此 “%s” 的 处 理 就 完成 了 ， 是 不 是 很 简单 ， 还 有 更 简单 的 。 















































让 时 


符 串 arg_str 































































































再 看 单个 字符 “%c” 的 处 理 ， 第 49 行 代码 “*(buf ptr++) = va_arg(ap, char)” 直 接 获 得 单个 








字符 后 写 














入 buf ptr， 





























处 理 更 省 事 ， 第 50 行 同样 是 使 指针 index_ptr 跨 过 字符" ， 并 更 新 index_char。“%c” 处 理 结束 ， 
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没 法 再 简单 了 。 
下 四 
还 是 有 些 令 人 费解 的 ， 咱 




















i 是 十 进 制 整数 “%d” 的 处 理 ,“%d” 可 | 


社会 中 整数 大 体 


























们 这 里 要 小 讨论 一 下 。 


] 于 输出 正 负 整数 ， 关 于 正 负数 在 计算 机 中 的 表现 形式 














数 。 无 符号 数 不 关 心 数字 























的 正 负 ， 同 人 类 社会 中 的 上 

















自然 。 









































进 制 数 举例 ， 正 数 范围 











三 
息 








觉得 应 该 是 “- 0 一 -1277 


数 互 为 相反 数 ， 其 和 为 0， 

















表示 负 号 的 一 仅仅 是 个 字符 ， 所 有 源码 文件 都 是 文本 ， 
编译 器 分 析 代 码 时 会 将 字符 一 转换 成 计算 机 中 的 负数 形式 。 一 种 可 
解 的 方式 )， 当 编译 器 发 现 负 号 一 时 ， 它 将 一 后 面 的 数字 作为 了 














是 找到 说 服 自己 理 












































然 数 一 样 。 对 于 无 


上 可 分 为 正 负 两 种 ， 计 算 机 为 了 表示 这 两 类 数字 , 将 数字 分 为 无 符号 数 和 有 符 


Ar 口 





付 祥 


号 

数 来 说 ， 它 与 正 负 无 关 ， 看 上 
去 是 多 少 就 是 多 少 ， 显 得 非常 直观 。 拿 8 位 二 进 制 举 例 , “00000000~11111111” 表 示 的 数字 用 十 进 制 表 
示 是 “0 一 255”， 没 什么 值得 怀疑 的 ， 无 比 自 外 
有 符号 数 关心 数字 的 正 负 ， 但 是 计算 机 中 只 有 二 进 制 0 和 1 两 种 数字 ， 没 有 加 号 '+' 和 减 号 一 ， 























因而 无 法 























直接 表示 数字 的 正 负 ， 只 能 用 间接 的 方式 ， 所 以 对 于 有 符号 数 来 说 ， 其 表示 形式 有 些 “ 怪 异 ” 还 是 拿 8 位 二 











“00000000~-01111111”， 用 十 进 制 表示 是 “0 一 127” 似乎 看 上 去 也 很 直观 ， 然 而 
负数 范围 是 “10000000~11111111”， 用 十 进 制 表示 却 是 “-128 一 -1”， 这 显得 很 不 直观 〈 不 知道 有 没有 同学 











哈哈 ， 这 是 错觉 ， 


因此 我 们 可 以 





























大 















































赶紧 忘掉 吧 )， 这 个 负数 范围 是 怎样 得 到 的 呢 ? 我 们 知道 ， 正 负 
] 0 减 去 正 数 来 得 到 负数 形式 ， 所 得 的 结果 就 是 补 码 。 咀 们 源码 中 
此 对 编译 器 来 说 ， 源 码 就 
能 的 情况 是 〈 我 猜 的 ， 学 习 知 识 本 质 上 就 














是 个 长 长 的 文本 字符 串 ， 





















































个 差 来 表示 负数 。 拿 十 进 制 数 -1 来 说 ， 


即 十 进 制 -1 用 二 进 制 111 
问题 来 了 ， 二 进 制 的 











不 过 无 论 它 是 什么 ， 都 不 影响 结果 的 正确 











1 等 于 0 减 去 1， 因 此 可 以 执行 下 对 
00000000 
- 00000001 
11111111 


11111 来 表示 。 


日 





E 数 ， 用 





























0 减 < 该 正 数 ， 上 








4 人 这 














11111111 到 底 是 无 符号 数 255， 还 是 有 符号 


























数 -1 呢 ?” 这 取决 于 计算 机 的 视角 
性 。 比 如 对 二 进 制 数 11111111 用 指令 


ij 的 二 进 制 减法 做 转换 。 








dec 执行 减 1 操作 ， 结 果 




















为 11111110， 如 果 把 11111110 看 成 是 无 符号 数 的 话 ， 它 表示 无 符号 数 254， 如 果 把 11111110 看 成 有 符号 











数 的 话 ， 





它 又 表示 -2。 








过 话说 回来 了 ,大 部 分 指令 对 有 符号 





























数 和 无 符号 























无 符号 数 ， 因 
除法 指令 idiv 





此 对 于 这 两 


1 
只 | 
































是 第 57 行 的 


2 


是 老 样 子 ， 更 新 指针 和 索 














printf 的 相关 改进 到 这 就 结束 了 ， 不 过 在 它 的 后 盏 
字符 串 输 出 到 标准 输出 ， 而 是 写 到 字符 串 buf 中 ， 原 到 


类 似 ， 区 别 是 sprintf 并 不 



































j 于 处 理 有 符号 数 ， 而 指令 div 
在 第 54 行 获取 了 参数 后 ， 要 判断 其 
代码 “arg int=0-arg int” 的 
60 行 的 代码 “itoa(arg_int, &buf ptr 10)” 














种 情况 需要 单独 的 指令 ,通常 它们 在 名 称 







































































值 是 正 还 是 负 ， 如 果 是 负数 的 话 ， 
j 途 ， 然 后 在 其 前 添加 个 负 号 一 ， 也 就 


此 ， 参 与 运算 的 操作 数 类 型 要 统一 ， 要 么 都 是 无 符号 数 ， 要 么 都 是 有 符号 数 。 不 
数 都 适 配 , 但 还 有 极 少数 的 指令 不 能 通 
上 就 能 区 分 操作 数 类 型 
只 处 理 无 符号 数 的 除法 。 好 啦 ， 








Ar 


处 里 有 们 号 数 和 
4， 比 如 带 符号 数 






































瑟 


们 继续 说 代码 。 






































们 要 将 其 转换 为 相反 数 ， 就 
是 第 58 行 的 代码 “*buf ptr++ 














az A 久 人 


引 字 符 。 





























咱们 在 main.c 中 测试 一 下 ， 见 代码 12-18。 





代码 12-18 


oid* arg) { 


tr(" I am thread b, my pid:0x"); 
nt (sys_getpid()); 
harc(" Vn) 


stdio.c 就 修改 完了 ， 
… 略 
42 /* 在 线程 中 运行 的 函数 */ 
43 void k thread bl(lv 
44 char* para = arg; 
45 console put s 
46 console put i 
47 console put c 
48 while (1); 
49 } 
50 
51 /* 测试 用 户 进 程 */ 
52 void u prog a(lvoid) { 


544 


将 数字 转换 为 十 进 外 





1 





岂 的 字符 后 写 入 buf ptr。 第 61 行 还 





| 连带 着 把 sprintf 一 块 加 进去 了 ， 此 函数 的 功能 与 printf 








( project/c12/c/kernel/main.c ) 

















也 和 printf 一 样 ， 不 再 袭 述 。 








管理 











3 char* name = "prog a"; 

54 printf(" I am %s, my pid:%d%sc", 
35 while(1); 

56 } 

57 

58 /* 测试 用 户 进 程 */ 














59 void u prog b(void) { 








name, getpid(),'\n'); 


60 char* name = "prog b"; 

61 printf(" I am %s, my pid:%d%sc", name, getpid(), '\n'); 
62 while(1); 

63 


























行 结果 如 











cE 


框框 中 的 








这 里 只 更 新 了 了 
图 12-12 所 示 。 





天 个 用 




















户 进 程 ! 

















的 printf 函数 ， 每 个 printf 都 用 到 了 %s、 


Bochs x86 emulator, http://bochs.sourceforge.net/ 





1 容 是 此 次 各 任务 的 输 H 











换行 符 也 起 作 














有 关 printf 











| 























验证 通过 。 














一 二 里 
USER Copy Pg 
































nel_pool_phy_addr_sta 
pool_phy_addr_start:1 






























































%d、%c 这 三 种 输出 格式 ， 


运 


各 字符 串 输 出 正常 ， 用 户 进 程 pid 是 按照 十 进 制 输出 的 ， 结 尾 的 











到 这 了， 兄弟 们 下 节 再 


四》 完善 堆 内 存 管理 























12.4.1 


在 很 久 以 前 就 和 大 伙 儿 说 过 ,1 
函数 用 于 程序 运行 时 动态 从 堆 
然 有 一 套 完善 的 内 存 管理 系统 在 文 
及 在 memory.c 中 增加 




































































中 





























请 内 存 ， 























sy 


malloc 仅仅 是 堆 内 存 的 接 









































们 的 内 存 管理 系统 要 大 改 一 次 ,这 事 就 发 生 在 今天 。 我 们 知道 , malloc 
， 能 够 动态 分 配 内 存 ， 底 层 必 





撑 。 因 此 实现 malloc 的 前 提 是 咱们 先 得 把 底层 系统 搭 起 来 。 这 主要 涉 
一 些 数据 结构 及 管理 机 制 ， 兄 弟 们 ， 开 工 啦 。 











malloc 底层 原理 














之 前 我 们 虽然 已 经 实现 





























了 内 存 管理 ， 





As 














旧 显 得 过 于 粗糙 ， 分 配 的 内 存 都 是 以 4KB 大 小 的 页 框 为 单位 的 ， 当 





我 们 仅 需 要 几 十 字 节 、 几 百 字 节 这 样 的 小 内 存 块 时 ， 显 然 无 法 满足 这 样 的 需求 了 ， 为 此 必须 实现 一 种 小 内 存 块 


























的 管理 ， 可 以 满足 任意 内 存 大 小 的 分 配 ， 这 就 是 我 们 为 实现 malloc 要 做 的 基础 工作 。 

















这 里 要 引用 


人 


wy 


为 arena。 给 大 


个 新 的 名 词 :“arena”， 该 单词 的 意思 是 
将 一 大 块 内 存 划分 成 多 个 小 内 存 块 ， 每 个 小 内 存 块 之 间 互 不 干涉 ， 可 以 分 别管 理 
的 大 妈 们 非常 喜欢 ) 








火 举 个 例子 ， 现 在 


















































看 台 。arena 是 很 多 开源 项 目 中 都 会 用 





到 的 内 存 管理 概 


















































体会 磁 到 其 他 舞 者 而 动作 放 不 开 ， 
格子 里 跳 ， 这 样 大 家 就 不 月 























场 舞 





， 当 广场 上 跳舞 的 人 越 来 越 多 时 











为 此 ， 领 队 给 每 个 舞 者 画 


























田 





























时 


E， 这 样 众多 的 小 内 存 块 就 称 
， 舞 者 担心 跳舞 
了 个 大 大 的 方 格子 ， 规定 每 个 舞 者 只 允许 在 自己 的 方 
担心 碰 到 对 方 ， 从 而 跳 得 很 舒展 ， 这 个 大 大 的 方 格子 ， 就 是 每 个 舞 者 的 “舞台 ”。 





胶 


545 


arena 是 日 
上 实现 arena， 


是 通过 malloc_ page 获 


让 





格 的 arena， 比 如 一 种 arena 上 


arena 中 全 是 3 


同 规格 的 内 存 块 。 
岂 许 arena 不 太 好 懂 ， 哄 
备 了 小 碗 面 和 大 矿 面 《价格 当然 也 就 不 同 了 ， 不 过 这 不 重要 )， 我 们 只 要 知道 有 大 碗 条 
时 且 同时 供应 这 两 利 
也 是 一 样 。 


准 
面 。 面 馆 的 49 
锅 同时 考 痢 
专用 





























条 

















-十 
局 


于 供应 小 克 








| 
人 日 











大 伙 儿 知道 ， 原 有 系统 


4 旦 
守 


























2 字 节 的 内 存 块 ， 故 它 只 1 











因此 ， 为 文 
人 


持 多 利 
] 拿 


容量 内 存 块 















































分 配 4KB 粒度 的 内 存 页 框 ， 
的 以 4KB 为 粒度 的 内 存 ， 根 据 请 求 的 内 存 
攻 ， 也 许 是 多 个 页 框 ， 随 后 再 将 它们 平均 拆 分 成 多 个 小 内 存 块 。 按 内 存 块 的 大 小 ， 可 以 划分 出 多 种 不 同 ]} 


所 
日 
































六 且 右 


， 总 是 有 顾客 排队 等 面 ， 孝 画 


























[的 归 


日 
| 

















的 分 配 ， 我 们 要 提前 建立 好 多 种 不 


用 馆 举 例子 ， 有 的 人 饭量 小 ， 有 的 人 饭量 大 ， 重 





malloc 





“一 大 块 内 存 ” 被 划分 成 无 数 “ 小 内 存 块 ” 的 内 存 仓库 ， 我 们 在 原 有 内 存 管理 系统 的 基础 
因此 arena 的 这 “一 大 块 内 存 ” 
的 大 小 ，arena 的 大 小 也 许 是 1 个 页 


也 





鞠 


Pp 全 是 16 字 节 大 小 的 内 存 块 ， 故 它 只 响应 16 字 节 以 内 的 内 存 分 配 ， 另 一 种 
向 应 32 字 节 以 内 的 内 存 分 配 。 我 们 平时 调用 
操作 系统 返回 的 地 址 其 实 就 是 某 个 内 存 块 的 起 始 地 址 ， 操 作 系 统 会 根 和 














请 内 存 时 ， 





中 malloc 申请 的 内 存 大 小 来 选择 不 


同 容 量 内 存 块 的 arena。 
































i 馆 就 为 这 两 类 顾客 分 别 
小 碗 两 种 


3 二 内 


1 合 旱 





的 

















站 傅 为 了 大 和 


























竺 别 火 
大 锅 的 容量 是 一 样 的 ， 煮 的 画 














9 





条 数量 














这 两 量 是 
本 ， 它 被 平均 分 成 30 份 小 碗 面 ， 第 2 
































面 ， 


这 样 同 时 可 以 满足 30 位 买 小 碗 五 
同 规格 的 arena， 第 ] 口 





口 大 锅 专用 于 

















的 顾客 和 20 位 买 大 碗 | 


H 














的 顾客 。 这 里 的 两 




















供应 20 碗 大 碗 面 
于 各 自 内 存 块 规格 容 
等 于 arena 内 存 池 区 域 








容量 ， 但 由 了 


arena 是 个 


[S| 


屋 


内 存 块 数 





旦 ， 


这 
规格 大 小 ， 此 部 分 占用 的 空间 是 固定 的 ， 约 为 12 
块 ， 此 部 分 占用 arena 大 量 的 空间 。 我 们 把 每 个 内 存 块 命名 为 mem_block， 
源 ， 最 终 为 用 户 分 配 的 就 是 这 其 
存 ， 除 了 元 信息 外 的 剩 下 的 内 存 被 习 











， 如 同 另 一 种 只 








E 
里 











- 肚 . 
旦 ' 。 


的 大 小 /内 存 块 规格 容 











有 者 熟 之 后 ， 











第 1 
































锅 只 供应 30 碗 小 碗 面 ， 如 同一 种 只 供应 16 字 节 大 小 内 存 块 的 arena,， 第 2 
供应 32 字 节 大 小 内 存 块 的 arena, 这 两 利 





harena 的 总 大 小 都 是 一 口 














二- 

















提供 内 存 分 配 的 数 扩 
其 中 包括 内 存 块 描述 符 指针 (后 玫 











> 




















时 结 构 ， 它 分 为 两 部 分 ， 


部 分 是 元 信息 ，| 
介绍 )， 通 过 它 可 以 间接 获 和 





Ph 碗 面 ， 
口 大 4 
供应 大 碗 面 ， 它 被 平均 分 成 20 份 大 碗 
大 锅 可 以 到 

















大 
用 条 


和 了 两 
员 中 的 























E 解 为 两 种 不 
锅 只 


大 锅 的 




















的 不 同 ， 两 个 arena 各 自 容纳 的 内 存 块 数量 也 是 不 同 的 ， 内 存 块 的 数量 





来 




















FP 的 一 个 内 存 块 。 在 








咱们 的 实现 9 
































于 库房 管理 员 
还 得 继续 
难 满足 供 
说 提供 了 多 
是 有 限 的 ， 总 


块 全 部 分 配 出 




















化 过 
| 























的 arena 组 合 为 一 个 “大 的 仓库 ” 
锅 供 应 大 碗 ,根据 实际 销售 














只 











mem_block_desc 





， 内 存 块 相 当 了 
说 




















要 ， 此 时 大 师 传 就 会 在 后 厨 增加 
大 锅 来 为 大 碗 面 供 货 。arena 也 是 一 
会 有 内 存 块 供不应求 的 时 
去 时 , 必须 再 增加 新 的 同 
























































规格 





























情 冰 





























block size=64 








free list 


AAA 








图 如 图 12-14 所 示 。 





们 间 





受 | 





A 








12-14 ”内 存 块 描述 符 简 
超级 大 仓库 ， 分 配 小 块 内 存 时 ， 





受 | 








内 存 块 描述 符 ; 
必须 先 经 过 此 入 




















， 系 














是 说 ， 最 终 所 分 配 的 内 存 忆 





昌 于 此 类 arena 集 知 








馆 的 售 面 窗 
少 种 ， 内 存 块 
内 存 块 规格 不 


546 
































， 顾 客 从 该 窗口 就 能 拿 到 面 ， 而 不 用 关 , 






































字 节 。 另 一 部 分 就 是 内 存 池 


PF， 针对 小 内 


用 馆 的 事 ， 大 碗 面 的 性 价 比 高 ， 供 不 应 求 ， 一 口 大 锅 很 
新 的 大 锅 来 者 
样 的 , 它 容纳 的 内 存 块 
候 。 当 某 一 规格 arena 中 的 内 存 
的 arena,， 由 多 个 同一 


田 ， 也 就 是 











， 为 同一 规格 的 内 存 块 提供 货源 。1 
况 才 增加 供 货 规模 。arena 也 是 一 样 的 , 起 始 为 某 一 类 型 内 存 块 供 
有 1 个 ， 当 此 arena 中 的 全 部 内 存 块 都 被 分 配 完 时 ， 系 统 再 创建 一 个 同 规格 
的 内 存 块 , 当 此 arena 又 被 分 配 完 时 , 再 继续 创建 出 同 规格 的 arena, arena 规模 逐渐 增 大 , 逐步 形成 arena 
集群 。 既 然 同 一 类 内 存 块 可 以 由 多 个 arena 提供 ， 为 了 跟踪 每 个 arena 中 的 空闲 内 存 块 ， 分 别 为 每 一 种 
规格 的 内 存 块 建立 一 个 内 存 块 描述 符 ， 即 mem_block desc， 在 其 中 记录 内 


存 块 规格 大 小 ， 以 及 位 于 所 有 同类 arena 中 的 空闲 内 存 块 链表 。 内 存 块 描述 





























统 从 它 








心 这 碗 四 














H 








竹 所 有 同类 arena 中 空 闪 内 存 块 汇 
的 空闲 内 存 块 链表 free list 中 挑选 一 块 内 存 ， 
中 某 个 arena 的 某 个 内 存 块 。 内 存世 
i 是 从 哪个 大 钢 
述 符 就 有 多 少 种 ， 因 此 各 种 内 存 块 描述 符 的 区 别 就 是 block_size 不 同 ，free_list 中 指向 的 


ny 


已 





1 








上 本 arena 


述 





自己 
所 包含 内 存 块 的 





内 存 池 中 空闲 


区 域 ， 这 里 面 有 无 数 的 内 存 





] 是 内 存 分 配 粒 度 更 组 
存 块 的 arena 
F 均 分 成 多 个 小 内 存 块 。 整 个 arena 就 像 个 仓库 一 样 ， 元 
F 库 中 物品 ， 如 图 12-13 所 示 。 


的 资 
占用 1 页 框 内 
言 息 部 分 相当 























内 存 块 规格 为 64 字 节 的 arena 





arena 元 信息 
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四 有 











馆 开 始 卖 














12-13 arena 简 


， 起 初 也 只 是 用 一 


的 arena 继续 ] 





大 小 为 64 的 mem_block 
大 小 为 64 的 mem_block 


受 | 





冬 | 











口 
的 arena 


该 规格 


化 
内 

















提供 








、 
总 
[TE 





[Ls 









































同 。 




















于 有 了 内 存 块 描述 符 ，arena 中 就 没有 必要 再 克 


全 


小 





因此 它 相 当 了 








六 内 存 块 





描述 符 的 作用 如 同 面 
J 存 块 规格 有 多 








记录 本 arena 中 内 存 块 规格 信 ) 





息 ， 而 




















危 























属 的 内 存 块 描述 符 ， 间 接 获 得 本 arena 中 内 存 块 的 规格 大 小 ， 
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A 
忆 arena / 

























































































小 内 存 块 来 满足 小 内 存量 的 分 配 , 但 实际 上 ，arena 为 
申请 的 内 存量 是 多 大 ， 都 可 以 




















内 存 块 描 





内 存 分 配 提供 了 统一 的 入 口 ， 无 论 




















j 同 一 个 arena 来 分 配 内 存 。 小 内 存 块 的 容量 虽然 有 几 种 规格 ， 但 毕竟 是 为 




















































































































































































































































































































满足 “小 ”内 存量 分 配 的 , 最 大 内 存 块 容量 不 会 超过 1024 字 节 ， 如 果 申 请 的 内 存量 较 大 , 超过 1024 字 节 ， 
单独 的 一 个 小 内 存 块 无 法 满足 需求 时 ， 这 时 候 您 可 能 想 ,将 多 个 内 存 块 组 合 到 一 起 ， 肯 定 能 满足 需求 ， 团 
结 力量 大 嘛 。 方 法 虽 具 有 可 行 性 ,但 还 是 太 麻烦 了 ,动态 维护 内 存 块 的 信息 会 增加 编程 复杂 性 ， 这 似乎 有 
些 像 Linux 的 buddy 系统 啦 。 其 实 咱们 的 应 用 很 简单 ， 根 本 用 不 着 那么 麻烦 ， 处 理 大 内 存 请 求 时 也 会 创建 
个 arena， 日 个 会 再 将 已 拆 分 成 小 内 存 志 ， 而 是 直接 将 整 块 大 内 存 分 配 出 去 ， 申请 的 内 存 大 于 1024 字 节 时 
确实 有 些 简单 粗暴 , 但 很 有 效 。 故 此 类 arena 没有 对 应 的 内 存 块 描 述 符 , 元 

言 乱 中 的 内 存 块 描述 符 指针 为 室 ， 其 arena 简 图 如 图 12-15 所 示 。 arena 

您 看 ， 图 12-15 是 为 了 解释 大 内 存 时 的 arena 结构 ， 图 最 上 面 有 这 样 一 mem_block_desc 指 针 =NULL 

句 ， 当 申请 的 内 存 大 于 1024 字 节 时 ， 因 此 我 们 对 大 内 存 的 定义 就 是 大 于 














1024 字 节 。 为 什么 要 以 1024 为 界限 呢 ? 有 这 样 一 个 提前 ， 就 是 用 于 


小 内 存 块 时 ， 我 们 为 arena 分 配 1 页 框 也 就 是 4KB 大 小 的 内 存 ， 我 们 已 经 





介绍 过 了 ,每 个 arena 都 分 为 两 部 分 ,一 部 分 是 占用 空间 很 少 的 元 信息 ， 除 
元 信息 外 的 剩余 部 分 才 上 寻 此 , 真 1 


所 以 最 大 的 内 存 块 肯定 要 小 于 2KB， 这 里 我 











一 整 块 内 存 




































































处 理 

















冬 | 冬 | 








12-15 大 内 存 arena 简 








A 





























于 内 存 块 的 划分 ， 






































E 用 于 内 存 块 的 部 分 不 足 4KB.。 内 存 块 是 平均 划分 的 ， 
门 以 2 为 底 的 指数 方程 来 划分 内 存 块 ， 


因此 最 大 的 内 存 块 是 





1024 字 节 ， 也 就 是 说 对 内 存 块 规格 为 1024 字 节 的 arena 来 说 ， 它 只 有 3 个 内 存 块 ， 每 个 都 是 1024 字 节 ， 


剩余 的 部 分 就 ; 
字 节 、512 字 节 、1024 字 节 ， 总 共 7 种 规格 ， 因 此 ， 内 存 块 描述 符 也 就 这 7 种 。 
有 一 种 规格 的 内 存 块 ， 





中 只 





arena 中 的 


(4096-12)/128。 
总 结 


心 \ 引 ， 























图 


在 把 整个 逻辑 贯穿 起 来 ， 如 图 




















费 了 。 













































































在 内 存 管理 系统 ! 






































存 块 。arena 是 个 内 存 仓库 ， 并 不 直接 对 外 提供 内 存 分 配 ， 只 
首 述 符 将 同类 arena 中 的 空闲 内 存 块 汇聚 到 一 起 ， 作 为 某 一 大 
与 arena 是 一 对 多 的 关系 ,每 个 arena 都 要 与 唯一 的 内 存 块 描 














们 这 里 的 内 存 块 以 16 字 节 为 起 始 , 向 上 依次 是 32 字 节 、64 字 节 、128 字 节 、256 





























再 次 强调 一 下 ， 每 种 arena 

















并 不 是 同时 包含 多 种 规格 ， 比 如 要 么 该 arena 中 全 是 16 字 节 大 小 的 内 存 块 ， 
要 么 全 是 512 字 节 的 内 存 块 。 对 于 小 内 存 块 来 说 ， 系 统 为 arena 分 配 的 内 存 总 共 为 4KB， 
内 存 块 数量 也 是 不 同 的 ,举例 来 说 ,假设 arena 元 信息 大 小 为 12 字 节 ， 对 于 内 存 块 规格 16 字 节 
的 arena， 其 包括 的 内 存 块 数量 是 (4096-12)16， 对 二 

















大 





此 ， 不 同 规格 














内存 块 规格 128 字 节 的 arena， 其 包括 的 内 存 块 数量 是 





，arena 为 任意 大 小 内 存 的 分 配 提 
的 小 块 内 存 的 分 配 , 又 支持 大 于 1024 字 节 以 上 


VE 


的 大 块 内 存 , malloc 函数 实际 上 就 是 通过 arena 











了 统一 的 接口 





， 它 既 支 持 1024 字 节 以 下 
请 这 些 内 





AAA 
































有 内 存 块 描述 符 才 对 外 提供 








内 存 块 ， 内 存 块 











二 > 














见 格 内 存 块 的 分 配 入 口 。 因 








此 ， 内 存 块 描述 符 









































规格 的 内 存 块 描述 符 供应 内 存 块 , 它们 各 自 的 元 信息 中 




















12-16 所 示 。 





12-16 中 左上 角 是 图 例 , 表示 了 arena 和 mem block desc 元 信息 及 逻辑 结构 , 右上 角 的 A 
于 处 理 大 于 1024 字 节 的 大 内 存 的 arena， 其 大 小 是 1 页 框 以 」 
内 存 块 ， 因 此 arena 元 信息 中 ， 
































成 64KB 小 内 存 块 的 arena， 其 指针 mem block d 


At 


人 





的 空闲 内 存 块 链 表 free_list 将 
时 ， 需 要 用 多 个 arena 为 同一 规格 内 存 块 “ 
格 是 16 字 节 ， 


























可 用 内 存 


arena : 























大 





此 与 其 关联 “ 供 











内 存 块 ， 当 它 的 











块 “ 货 源 充足 ”。 


好 啦 ， 不 知道 大 伙 儿 是 否 理解 了 arena， 其 实 只 要 





























就 可 以 了 ， 本 节 到 此 结束 ， 下 节 讨 论 代码 。 


Es 


内 存 块 








SC 指 











符 关 联 起 来 ， 多 个 同一 规格 的 arena 为 同一 
i 述 符 指针 指向 同一 个 内 存 块 描述 符 。 现 












































名 








是 用 





上 ， 其 中 的 内 存 池 部 分 并 没有 划分 成 多 个 小 
内 存 块 描述 符 指针 mem block desc 值 为 NULL。 左下 角 
向 规格 为 64 字 节 的 内 存 块 描述 符 
块 汇总 。 我 们 说 过 ， 当 
具 货 ”图 C 描述 的 就 是 这 种 情 
货 ” 的 arena 规格 也 必须 是 16 字 节 。 起 初 是 左边 那个 
内 存 块 分 配 耗 尽 时 ， 系 统 又 创建 右边 的 arena (虚线 表示 的 )， 从 而 保证 该 规格 的 内 存 


的 图 B 是 被 拆 分 

， 内 存 块 描述 
一 个 arena 中 的 内 存 块 不 够 用 
况 。 此 例 的 内 存 块 描述 符 规 
提供 










































































arena 为 



































在 后 面 代码 





知道 是 在 做 什么 
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mem_block: arena A 
用 于 分 配 的 内 存 块 arena 元 数据 申请 的 内 存 大 于 1024 字 节 时 
arena 中 的 
Oe 内 存 池 arena( 大 小 为 1 页 框 以 上 ) 


例 














mem_block_desc 指 针 =NULL 





























block_size: mem block d 
内 存 志 大 小 OY 整 块 内 存 
free list: 还 符 
空闲 内 存 块 链表 元 
申请 的 内 存 小 于 等 于 16 字 节 时 


B 申请 的 内 存 小 于 等 于 64 字 节 时 


arena (大 










mem_block_desc 


mem_block_desc 指 针 
大 小 为 64 的 mem_block 


大 小 为 64 的 mem_block 


arenal( 大 小 为 1 页 框 ) 


mem_block_desc 指 针 





小 为 1 页 框 ) 














arena( 大 小 为 1 页 柜 








| 大 小 为 16 的 mem_block 














大 小 为 16 的 mem_block| | ， 

















mem_block_desc 











block _size=64 








> < 
block size=16 





free list 











12.4.2 ”底层 初始 化 


本 节 我 们 要 完成 上 一 节 中 介绍 的 基 





free list 












































时 ， 若 发 现 缺 失 内 存 块 时 再 











础 ， 构 建 7 种 规格 的 内 存 块 描述 


A 图 12-16 arena 与 mem_block_desc 的 逻辑 关系 








述 符 ， 














创建 相应 的 arena， 请 见 代 人 码 12-19。 





代码 12-19 
… 略 
28 /* 内 存 块 */ 
29 struct mem block { 
30 struct list elem free elem; 
31 3} 
32 


33 /* 内 存 块 描述 符 */ 


34 struct mem block desc { 


35 uint32 t block size; 

36 uint32 t blocks per arena; 
37 struct list free list; 

38" }» 

39 


40 #define DESC CNT 7 


LO 


在 memory.h 中 最 先 定义 的 是 内 存 块 














结构 ， 将 来 可 以 从 arena 








mem block desc 来 描述 。 

















按 有 


由 内 存 块 规格 来 拆 分 














( project/c12/d/kernel/memory.h ) 





// 内 存 块 大 小 


// 本 are 





na 中 可 容纳 此 mem_block 的 数量 




















// 目 避 可 


的 mem_ block 链表 











// 内 存 块 








划 述 符 个 数 














省 。 结 构 中 只 有 一 个 成 员 struct list_elem， 
格 内 存 块 描述 符 的 free_list 中 。 内 存 块 mem_block 所 占用 的 内 存 是 从 arena 中 拆 分 出 来 的 ， 其 相关 属性 用 














结构 struct mem_block， 由 于 内 存 块 有 7 个 规格 , 这 里 提供 一 种 通用 


这 就 够 了 ， 以 后 在 实际 malloc 



































用 来 添加 到 同 规 





接 下 来 定义 的 是 内 存 块 描述 符 结构 struct mem block desc， 有 3 个 成 员 ，free list 是 空闲 内 存 块 链表 ， 
block_size 是 本 描述 符 的 规格 ， 它 的 free_list 中 只 能 添加 规格 为 block_size 的 内 存 块 。blocks_per arena 是 


告诉 本 arena 中 可 容纳 规格 为 block_size 的 内 存 块 的 数量 。 注 意 




















等 于 blocks_per_arena 个 元 素 。 因 为 blocks_ per arena 
可 以 由 多 个 arena 提供 内 存 块 。 





最 后 的 宏 DESC_CNT 表示 内 存 块 描 述 符 的 数量 ， 其 值 为 7， 原 因 是 
为 底 的 指数 方程 来 设计 的 ， 从 16 字 节 起 ， 
内 存 块 。 对 于 小 内 存 的 arena 来 说 ，] 

















用 的 内 存 外 ，arena : 





是 1024 字 节 。 当 申请 的 内 存 大 小 超过 1024 时 就 直接 返回 一 个 页 框 ， 不 再 从 arena 中 划分 ， 
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不 能 同时 容纳 








分 别 是 16、32、64、128、256、512、1024 字 节 ， 共 有 7 利 
其 中 的 内 存 块 是 大 小 一 致 的 。 除 了 元 信息 
2048 下 一 级 内 存 规格 就 是 1024， 故 最 大 的 内 存 块 就 


其 大 小 是 一 页 框 4096 字 节 ，] 
大 个 2048 的 内 存 块 ， 























4 












































， 链 表 free_list 的 长 度 是 无 限 大 的 ， 并 不 
只 是 一 个 arena 能 够 提供 的 内 存 块 个 数 , 而 此 free list 


3 们 的 内 存 块 规格 大 小 是 以 以 2 
规格 的 











因为 意义 不 大 。 





喇 








12.4 完善 堆 内 存 管理 


下 面 再 看 下 最 新 的 memory.c， 如 代码 12-20 所 示 。 





代码 12-20 (project/c12/d/kernel/memory.c ) 


… 略 
32 /* 内 存 仓库 */ 


33 struct arena { 





34 struct mem block desc* desc; // 此 arena 关联 的 mem block desc 





35 /* large 为 ture 时 ，cnt 表示 的 是 页 框 数 。 
36 * 否则 cnt 表示 空间 mem block 数量 */ 


过 汉 uint32 tcnt; 
38 bool large; 
39 7 

40 


41 struct mem block desc k _ block descs[DESC CNT]; 





// 内 核 内 邓 块 描述 符 数组 





























42 struct pool kernel pool, user pool; YY 和 池 和 























43 struct virtual addr kernel vaddr; // 此 结构 es 


44 

… 略 

308 /* 为 malloc 做 准备 */ 

309 void block desc _ init (struct mem block desc* desc _ array) { 












































310 uint16 t desc idx, block size = 16; 

3T1 

312 /* 初始 化 每 个 mem_block_desc 描述 符 */ 

343 for (desc idx = 0; desc idx < DESC CNT; desc idx++) { 
314 desc arrayl[ldesc idx] .block size = block size; 
315 

316 /* 初始 化 arena 中 的 内 存 块 数量 */ 

汪汪 学 qesc_array[dqesc_ idx] .blocks per arena = \ 

(PG _SIZE - sizeof(struct arena)) / block size; 

318 

号 于 人 list init(&desc arrayl[ldesc idx] .free list); 
320 

321 block size *= 2; // 更 新 为 下 一 个 规格 内 存 块 
322 } 

3237 小 

324 

325 /* 内 存 管 理 部 分 初始 化 入 口 */ 

326 void mem init() { 

327 put_str("mem init start\n"); 

328 uint32 七 mem bytes total = (*(uint32 t*) (0xb00)); 
329 mem pool init (mem bytes total); // 初始 化 内 存 池 
330 /* 初始 化 mem block desc 数组 descs， 为 malloc 做 准备 */ 

431 block desc init(k block descs); 

332 put_str("mem init done\n"); 

333 1} 























memory.c 中 最 先 定义 的 是 arena 结构 struct arena， 此 结构 仅 有 3 个 成 员 ， 























占 12 字 节 的 空间 ， 它 就 是 


我 们 所 说 的 arena 元 信息 。 一 直 都 说 arena 用 来 提供 内 存 块 ， 这 么 小 的 空间 怎样 提供 大 量 的 内 存 呢 ? 答案 











是 这 取决 于 arena 的 创建 方式 。 将 来 我 们 会 从 堆 中 创建 它 ， 我 们 会 给 arena 乡 

















吉 构 体 指针 赋予 1 个 页 框 以 上 


的 内 存 ， 那 时 候 的 arena 就 是 个 名 符 其 实 的 内 存 仓库 了 ， 页 框 中 除了 此 外 结构 体外 的 部 分 都 将 作为 arena 的 
内 存 池 区 域 ， 该 区 域 会 被 平均 拆 分 成 多 个 规格 大 小 相等 的 内 存 块 ， 即 mem _ block， 这 些 mem block 会 被 
添加 到 内 存 块 描述 符 的 free_list。 结 构 中 第 1 个 成 员 是 dese， 它 指向 本 arena 中 的 内 存 块 被 关联 到 哪个 内 
存 块 描述 符 ， 同 一 规格 的 arena 只 能 关联 到 同一 规格 的 内 存 块 描述 符 ， 比 如 本 arena 中 的 内 存 块 规格 为 64 
它 的 意义 要 取决 于 第 3 个 成 员 large 
的 值 。 当 large 为 ture 时 ，cnt 表示 的 是 本 arena 占用 的 页 框 数 ， 否 则 large 为 false 时 ，cnt 表示 本 arena 中 







































































字 节 ，desc 只 能 指向 规格 为 64 字 节 的 内 存 块 描述 符 。 第 2 个 成 员 是 cnt， 


















































还 有 多 少 空间 内 存 块 可 用 ， 将 来 释放 内 存 时 要 用 到 此 项 。 























接 下 来 定义 的 是 内 核 内 存 块 描述 符 数 组 k_block_descs[DESC_CNT], 共 











也 有 自己 的 内 存 块 描 述 符 数组 ， 将 来 定义 在 pcb 中 。 
最 后 是 内 存 块 初始 化 函数 block_desc_init， 此 函数 接受 1 个 参数 ， 
功能 是 初始 化 数组 内 7 个 描述 符 。 前 面 介 绍 的 内 存 块 描述 符 就 是 底层 纪 




































































内 



































za 





存 块 描 述 各 
4 构 ， 在 此 主要 就 是 初始 化 它 ， 其 他 


口 




















共有 7 种 描述 符 规 格 。 用 户 进程 


数组 指针 desc_array， 




















的 arena 及 arena 中 的 mem_block 都 是 “ 按 需 分 配 ” 将 来 通过 malloc 分 





C 内 存 块 时 
































创建 。 这 里 就 是 通过 
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for 循环 将 7 种 规格 的 内 存 块 描述 符 初 始 化 ， 分 别 初始 化 内 核 内 存 块 描述 符 的 block_size、blocks_per_arena 
和 free_list。block size 起 始 值 为 16，desc_idx 起 始 值 为 0， 循环 体 的 最 后 会 将 其 乘 以 2， 因此 下 标 desc_idx 
越 低 ，block size 越 小 ， 也 就 是 说 ， 内 核 和 用 户 内 存 块 描述 符 数组 中 ， 下 标 越 低 的 内 存 块 描述 符 ， 其 表示 的 
内 存 块 容量 越 小 ， 我 们 在 将 来 会 用 到 此 结论 。 对 blocks_per arena 初始 化 时 ， 减 去 arena 的 大 小 后 再 向 下 整 












































除 ， 这 样 保证 内 存 块 数量 不 会 越过 此 arena 
始 化 内 存 块 描 述 符 的 free_list。 
















































































占用 的 页 框 边界 ， 不 过 会 浪费 一 部 分 内 存 。 最 后 调用 list_init 初 





最 后 在 第 331 行 把 block_desc_init 添加 到 mem init 中 调用 。 








本 布 主 要 是 基础 部 分 的 构建 ， 还 没 到 具 





12.4.3 ”实现 sys_malloc 
































体 功 能 验证 的 阶段 ， 因 此 本 节 到 这 就 结束 了 ， 下 节 再 见 。 











上 节 中 咱们 已 经 把 后 台 基 础 设施 构建 完成 , 哈哈 , 其 实 只 是 初始 化 了 内 存 块 描述 符 。 也 许 有 同学 质疑 ， 
内 存 块 是 由 arena 提供 的 ，arena 还 没有 创建 ， 怎 么 能 说 基础 构建 完成 了 呢 ? 对 计算 机 来 说 ， 内 存 资源 再 大 
也 不 嫌 多 , 它 是 个 宝贵 的 玩意 , 不 能 浪费 , 必须 本 着 按 需 分 配 的 原则 合理 使 用 , 因此 内 存 块 并 不 是 提前 “ 盲 












































































































































的 子 功能 处 理 函 数 sys_malloc，sys_malloc 





















































代码 12-21 














76 /* 进程 或 线程 的 pcb， 程 序 控制 块 */ 
£1 St ruct. task Struct :1 



























































目 ” 准 备 好 的 ， 它 在 需要 时 由 程序 动态 创建 ， 创 建 它 的 函数 就 是 sys_malloc， 您 懂 的 ， 它 就 是 malloc 对 应 











的 功能 是 分 配 并 维护 内 存 块 资源 ， 动 态 创 建 arena 以 满足 内 存 
块 的 分 配 ， 似 乎 离 完成 系统 调用 malloc 不 远 了 。 
为 了 完成 sys_malloc， 咱 们 这 里 对 pcb 还 做 了 些小 改动 ， 请 看 代码 12-21。 




















( project/c12/e/thread/thread.h ) 




























































































78 uint32 t* self kstack; // 各 内 核 线程 都 用 自己 的 内 核 栈 
了 9 pid t pid; 

… 略 

95 uint32 tx pgdir; // 进程 自己 页 表 的 虚拟 地 址 
96 

97 struct virtual addr userprog vaddr; // 进程 的 虚拟 地 址 
98 struct mem block desc u block desc[DESC CNT]; 

LA 进程 内 存 块 描述 符 
… 略 

于 人 才学 

.. 略 











为 了 实现 用 户 进程 的 堆 内 存 管 理 ， 在 pcb 中 增加 了 内 存 块 描述 符 数组 u_ block desc[DESC_CNT]。 另 外 ， 
该 数组 在 使 用 前 必须 要 初始 化 ， 我 们 是 在 process.c 中 的 函数 process_execute 中 完成 初始 化 工作 的 ， 如 代 















































码 12-22 所 示 。 


代码 12-22 (project/c12/e/userprog/process.c ) 


… 略 
96 /* 创建 用 户 进程 */ 


























97 void process execute(void* filename, char* name) { 


0O 


103 thread->pgdir = create page dir(); 








104 block desc init (thread->u block desc); 
ODO 
413: 7 















































初始 化 工作 。 好 了 ， 下 面 正式 说 内 存 管 理 方面 的 改进 ,i 





























代码 12-23 
… 略 








在 函数 process_execute 中 调用 block desc init(thread->u block desc) 完 成 了 用 户 内 存 块 描述 符 数组 的 














见 代 码 12-23 。 


( project/c12/e/kernel/memory.c ) 


323 /* 返回 arena 中 第 idx 个 内 存 块 的 地 址 */ 
324 static struct mem block* arena2block (struct arena* a, uint32 t idx) { 














325 return (struct mem block*)\ 


((uint32 t)a + sizeof (struct arena) + idx * a->desc->block size); 


550 


12.4 ”完善 堆 内 存 管理 








328 /* 返回 内 存 块 b 所 在 的 arena 地 址 */ 

329 static struct arena* block2arena(struct mem block* pbp) { 
人 30 return (struct arena*) ((uint32 t)b & Oxfffff000); 
331 } 

332 

333 /* 在 堆 中 申请 size 字 节 内 存 */ 

334 void* sys malloc(uint32 t size) { 





































































































































































































































































































335 enum pool flags PF; 
336 struct pool* mem pool; 
37 uint32 七 Pool size; 
338 struct mem block desc* descs; 
339 struct task struct* cur thread = running thread(); 
340 
341 /* 判断 用 哪个 内 存 池 */ 
342 if (cur thread->pgdir == NULL) { // 若 为 内 核 线程 
343 PF = PF KERNEL; 
344 pool size = kernel pool.pool size; 
345 mem pool = &kernel pool; 
346 descs = k block descs; 
347 } else { // 进程 pcb 中 的 pgdir 会 在 为 其 分 配 页 表 时 创建 
348 PF = PF_USER; 
349 pool size = user pool.pool size; 
350 mem pool = &user pool; 
351 descs = cur thread->u block desc; 
352 } 
353 
354 /* 若 申请 的 内 存 不 在 内 存 池 容 量 范围 内 ， 则 直接 返回 NULL */ 
汪 与 区 if (!(size > 0 && size < pool size)) { 
356 return NULL; 
357 } 
358 struct arena* a; 
359 struct mem block* b; 
360 lock acquire(&mem pool->lock); 
361 
362 /* 超过 最 大 内 存 块 1024， 就 分 配 页 框 */ 
363 if (size > 1024) { 
364 uint32 t page cnt = \ 
DIV_ROUND UP (size + sizeof (struct arena), PG SIZE); 
// 向 上 取 整 需要 的 页 框 数 
365 
366 a = malloc page (PF, page cnt); 
367 
368 if (a != NULL) { 
369 memset (a, 0, page cnt * PG SIZE); // 将 分 配 的 内 存 清 0 
370 
371 /* 对 于 分 配 的 大 块 页 框 ， 将 desc 置 为 NULL, 
cnt 置 为 页 框 数 ，Large 置 为 true */ 
372 a->desc = NULL; 
3 了 3 a->cnt = page cnt; 
374 a->large = true; 
3 lock release(&mem pool->lock); 
376 return (void*) (a + 1); // 跨 过 arena 大 小 ， 把 剩 下 的 内 存 返 区 
377 } else { 
378 lock release(&mem pool->lock); 
37.9. return NULL; 
380 } 
381 } else { // 若 申 请 的 内 存 小 于 等 于 1024 
// 可 在 各 种 规格 的 mem _ block_desc 中 去 适 配 
382 uint8 t desc idx; 
383 
384 /* 从 内 存 块 描述 符 中 匹配 合适 的 内 存 块 规格 */ 

385 for (desc idx = 0; desc idx < DESC CNT; desc idx++) { 
386 if (size <= descs[desc idx] .block size) { 
// 从 小 往 大 后 ， 找 到 后 退出 

387 break; 

388 } 

389 } 

390 

391 /* 若 mem block desc 的 free list 中 已 经 没有 可 用 的 mem block， 
392 * 就 创建 新 的 arena 提供 mem block */ 














551 
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第 12 章 进一步 完善 内 核 
393 if (list empty(&descs[desc idx] .free list)) { 
394 a = malloc page (PF, 1); // 分 配 1 页 框 作为 arena 
395 if (a == NULL) { 
396 lock release(&mem pool->lock); 
397 return NULL; 
398 } 
399 memset (a, 0, PG SIZE); 
400 
401 /* 对 于 分 配 的 小 块 内 存 ， 将 desc 置 为 相应 内 存 块 描述 符 ， 
402 * cnt 置 为 此 arena 可 用 的 内 存 块 数 , large 置 为 false */ 
403 a->desc = &descs[desc idx]; 
404 a->large = false; 
405 a->cnt = descsl[ldesc idx] .blocks per arena; 
406 uint32 t block idx; 
407 
408 enum intr status old status = intr disable(); 
409 
410 /* 开始 将 arena 拆 分 成 内 存 块 ， 并 添加 到 内 存 块 描述 符 的 free_1ist 中 */ 
411 for (block idx = 0; \ 
block idx < descs[desc idx] .blocks per arena; block idx++) 
412 b = arena2block(a, block idx); 
413 ASSERT (!elem find(&a->desc->free list, &b->free elem)); 
414 list append(&a->desc->free list, &b->free elem); 
415 } 
416 intr set status(old status);} 
417 
418 
419 /* 开始 分 配 内 存 块 */ 
420 b = elem2entry(struct mem block, \ 
free elem, list pop(& (descs[desc idx] .free list))); 
421 memset (pb, 0, descsl[desc idx] .block size); 
422 
423 a = block2arena(b); // 获取 内 存 块 b 所 在 的 arena 
424 a->cnt——; // 将 此 arena 中 的 空闲 内 存 块 数 减 1 
425 lock release (&mem pool->lock); 
426 return (void*)b; 
427 } 
428 } 
… 略 











代码 开头 定义 了 两 个 sys_malloc 中 会 用 到 的 函数 ， 它 们 是 有 关 arena 和 mem block 互相 转换 的 功能 。 


arena2block 接受 两 个 参数 ，arena 指针 a 和 内 存 块 mem block 在 arena 








中 第 idx 个 内 存 块 的 首 地 址 。 
使 arena 结构 体 指针 指向 从 









































和 











会 儿 我 们 介绍 sys_malloc 时 您 就 会 明 


索引， 函数 功 


能 是 返回 arena 











， arena 是 从 




















E 中 返回 的 一 个 或 多 个 页 框 的 内 存 ， 





arena 的 大 小 ， 结 构 体 中 仅 有 

















理 是 在 arena 指针 指向 的 页 














元 信息 外 的 部 分 才 被 用 于 内 存 块 的 

















块 大 小 ， 


最 终 的 地 址 便 是 arena : 
存 块 大 小 记录 在 由 desc 指向 的 内 存 块 描 



































大 























mem block*)((uint32_t)a + sizeof(struct arena) + idx * a->desc->block size)”。 








存 块 所 在 的 arena， 由 于 此 类 内 存 块 所 在 的 arena 
很 简单 ， 内存 块 的 高 20 位 地 址 便 是 arena 所 在 的 











1 页 市 因此 函数 原理 





内 











匡 之 








占据 1 个 完整 的 


第 2 个 函数 block2arena 接受 一 个 参数 ， 内 存 块 指针 b。block2arena 


EE 












































然 页 











arena*) 后 返回 即 可 ， 对 应 代码 “return (struct arena*)((uint32_t)b & 0xfffff000)”。 





下 面 要 介绍 的 是 今天 
j 紧张。 


sys_malloc 























只 有 一 个 参数 size，size 是 





pool size 和 descs， 它 们 的 值 











内 存 上 











342 一 352 行 针 对 这 7 








552 


而 种 情况 为 它们 赋值 
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的 内 存 字 节 数 。 函 数 帮 




















请 者 来 决定 ， 这 是 


的 内 存 日 











o 

















此 arena 结构 体 struct arena 并 不 是 全 


中 创建 的 ， 方 法 是 














全 部 








3 个 成 员 ， 它 就 是 我 们 所 说 的 arena 的 元 信息 。 在 arena 指针 指向 的 页 框 中 ， 除 去 
F 均 拆 分 ， 每 个 内 存 块 都 是 相等 的 大 小 且 
匡 中 ， 跳 过 元 信息 部 分 ， 即 struct arena 的 大 小 ， 再 用 idx 乘 以 该 arena 中 内 存 
第 idx 个 内 存 块 的 首 地 址 ， 最 后 将 其 转换 成 mem_block 类 型 后 返回 。 内 
述 符 的 block _ size 中。 转换 过 程 对 应 的 代码 是 “retum (struct 


连续 挨 着 ， 因 此 arena2block 的 原 














于 将 7 种 规格 的 内 存 块 转换 为 内 
医 ， 所 以 arena 中 的 内 存 块 都 属于 这 
也 址 ， 将 出 





上 地址 转换 成 (struct 


的 主角 sys_malloc， 这 个 函数 有 点 长 了 , 不 过 原理 还 是 很 简单 的 , 收 起 志 起 的 心 ， 





























F 头 定义 了 一 些 变量 : PF、mem_pool、 
请 者 包括 内 核 线程 和 用 户 进程 两 种 ， 第 




















接 下 来 定义 了 arena 指针 a 和 mem block 指针 b， 指 针 a 月 


中 的 mem_ block。 如 前 EH 时 所 述 ，arena 既 可 处 理 大 于 1024 字 节 的 大 内 存 分 配 ， 也 文 持 1024 字 节 以 


介绍 原理 





















































内 的 小 内 存 分 配 ， 各 上 





的 实现 还 是 有 些 




















区 别 的 ， 

















下 面 要 分 这 两 种 情况 来 处 到 
































已 经 熟悉 了， 除法 向 


























page_cnt)” 就 是 从 


存 中 并 没有 struct arena 和 struct mem block 静态 实例 


让 
的 意愿 。 之 后 3 











首先 判断 如 果 申 请 的 内 存量 大 于 1024 字 节 ， 先 计算 内 
上 取 整 ， 计 算出 的 页 框 数 存 入 变量 page_cnt。 
中 创建 arena， 也 就 是 把 malloc page 返回 的 页 


EE 为 粒度 ， 前 12 字 节 始终 是 元 信息 结构 。 之 后 调用 memset 
开始 初 始 化 arena 的 元 信息 。 对 大 内 存 的 处 理 





将 











占用 的 页 框 数 ， 医 


























此 a->cnt = page_cnt。“a->large =true” 表 示 此 arena | 


存量 size 需要 的 页 村 
下 
甘地 址 
中 的 指针 
其 




















， 只 














有 指向 











将 arena 清 0， 


我 们 直接 返回 
























































其 拆 分 成 小 内 存 块 , 因此 没有 对 应 的 内 存 块 描述 符 , 故 “a->desc = NULL”。a->cnt 此 时 的 意义 是 出 


明 来 指向 新 创建 的 arena， 


arena 的 内 存 区 就 好 ， 


间 针 b 用 来 指向 arena 





数 ， 宏 DIV_ ROUND UP 大 伙 儿 
大 的 代码 “a = malloc page(PF， 
赋值 给 arena 指针 a。 所 以 ， 


内 
的 内 存 以 页 


< 


。 此 时 指针 a 指向 
实 也 可 以 不 清 0， 























站 目 





Kes 
洲 : 


上 
































击 妇 髓 





L arena 












































j 于 处 至 


大 于 1024 字 节 以 上 的 内 存 




















分 配 。arena 中 可 被 ) 





用 “(a+1)” 跨 过 arena 元 信息 ， 也 就 是 跨 过 一 个 struct arena 的 大 小 。 最 后 通过 “return (void*)(a 
arena 中 的 内 存 池 起 始 地 址 返回 ， 此 地 址 便 是 为 
内 存 小 于 1024 字 节 的 情况 。 我 人 
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第 381 行 处 到 














j 户 使 





j 的 部 分 是 内 存 池 部 分 ， 也 就 是 要 跨 过 arena 前 面 

















到 合适 的 内 存 块 。 
标 越 低 ，j 














Sa 


F 面 用 


























for 循环 排查 所 有 的 内 存 块 
其 block size 的 值 越 小 ，desc_idx 初始 为 0， 从 低 容量 的 内 存 块 癌 ] 


























总 有 一 球 内 存 块 最 接近 size 字 节 。 比 如 








后 退 晶 


找到 








通 i 












































! 请 的 内 存量 size 为 
循环 ，desc_idx 便 是 最 合适 的 内 存 块 索引 。 在 分 配 之 前 
过 内 存 块 描述 符 中 的 free_list 是 否 为 空 判 断 的 ， 具体 功能 代码 是 “if (list_empty (&descs[desc_idx].free_list))”。 

















j 户 分 配 的 内 存 地 址 。 

















i 述 符 ， 注 

















上 找 ， 
120 字 节 ， 规 格 为 


站 有 7 种 规格 的 内 存 块 描述 符 ， 把 它们 都 壳 历 一 次 ， 
FE 意 啦 ， 我 们 上 节 在 初始 化 内 存 块 





的 元 信息 部 分 ， 故 在 第 392 行 ， 





和 1) 2 把 





TIE z 公 已 


肯定 能 找 
述 符 时 ， 下 
lock size 都 遍历 一 遍 ， 
的 内 存 块 是 最 适合 的 。 




















把 7 种 b 
128 字 节 






































如 果 free_list 为 空 ， 表 示 目 前 的 供 














陡 包 


0, PG 















































向 具体 的 内 存 块 描述 
置 为 false， 表 示 ] 























SIZE) 清 0。 下面 为 新 的 arena 初始 化 元 信息 ， 这 次 的 arena 用 于 
符 , 代码 “a->desc = &descs[desc idx];” 使 desc 指向 上 





货 商 arena 已 经 被 分 配 光 了 ， 此 规格 大 小 的 内 存 块 
| 建新 的 arena。 在 第 394 行 代码 “a = malloc_page(PE, 1)” 分 配 1 页 内 存 来 创建 新 的 arena， 
内 存 块 分 配 ， 所 以 其 desc 指针 必须 指 
下 找到 的 内 存 块 描述 符 。a->large 





FF 小 



























































表示 此 arena 现在 





在 创建 新 的 arena 后 ， 下 一 步 是 将 它 拆 分 成 内 存 块 ， 此 部 
是 descs[desc_idx].blocks_per arena， 这 表示 此 arena 将 被 拆 分 成 的 内 存 块 数量 。 拆 分 内 存世 
函数 完成 的 ， 它 在 arena 中 按照 内 存 块 的 索引 block idx 拆 分 日 
来 的 内 存 块 ， 然 后 将 其 添加 到 内 存 块 描 述 符 的 free_list 中 。 以 后 每 次 发 现 目 














空 时 ， 就 重新 为 这 样 block size 大 小 的 块 创建 arena， 将 arena 折 





到 内 存 块 描述 符 下 


的 desc 都 指向 同一 个 内 存 块 描述 


的 free list 中 。 这 样 





= 


A 全 


符 。 








下 面 开始 分 配 内 存 块 ， 内 存 块 被 
个 内 存 块 ， 此 时 得 到 的 仅仅 是 内 存 块 mem_block 中 list_elem 的 地 址 ， 因 此 要 用 到 elem2entry 宏 将 3 





成 mem_block 的 地 址 。 
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第 423 行 通过 











块 少 了 一 个 。 此 项 是 人 












































分 














要 判断 是 否 有 6 


是 在 第 411 行 的 for 循环 j 


上 相应 的 内 存 块 。 指 针 


J 用 的 内 存 块 ， 这 里 是 

















已 经 没有 了 ， 此 时 需要 
之 后 


























j memset(a, 





比 arena 不 用 于 处 理 大 于 1024 字 节 的 大 内 存 。a->cnt 置 为 descs[desc idx].blocks per arena， 
有 的 空 闪 内 存 块 数量 。 后 面 会 看 到 ， 随 着 以 后 的 分 配 ， 会 将 a->cnt 的 值 减少 。 























开始 的 ， 循 环 次 数 


是 通过 arena2block 


指向 每 次 新 拆 分 出 


























| 散 成 block . 








思 山 
标 内 存 块 描述 符 的 free_list 为 
size 大 小 的 内 存 块 ， 继 续 添加 




















来 , 为 同一 内 存 块 描述 符 提 供 内 存 块 的 arena 将 越 来 越 多 , 这 些 arena 


[总 在 内 存 块 描述 符 



































的 free_list 中 ， 我 们 














j list pop 从 free list 中 弹出 
其 转换 








函数 block2arena(b) 获 取 内 存 块 b 所 在 的 arena 地 址 ， 然 后 将 a->cnt 减 1， 表 示 空 闲 内 存 


t 将 来 释放 内 存 使 用 的 ， 释 放 内 存 时 会 参考 cnt 的 值 ， 用 来 判断 是 将 mem_block 回收 











到 内 存 块 描述 符 的 
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> 总 经 


一 口 





性 地 
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0q AI 














AS 





点 ， 而 list elem : 


426 行将 内 存 块 b 的 
多 说 两 句 ， 在 各 种 list 中 的 结 点 是 list_elem 
t 说 清楚 问题 )， 比 如 在 














构 ”( 这 个 词 是 我 自己 杜撰 的 ， 仅 化 
eneral tag 的 地 址 ，pcb 便 是 general tag 的 宿主 数 
存储 的 是 前 身 

















区 和 














free_list 中 ， 还 是 直接 释放 内 存 块 所 在 的 arena。 
也 址 转换 成 void* 后 返 





口 






































届 结 构 。 宿 主 数据 结构 中 











后 继 结 


， 此 地 址 便 是 用 户 进程 得 
的 地 址 ， 并 不 是 list_elem 所 在 的 “宿主 数据 
就 绪 队 列 thread ready list 中 的 是 pcb 的 
list_elem 的 地 址 才 是 链表 


到 的 内 存 地 址 。 

















的 

















;点 的 地 址 ， 也 就 是 其 他 宿主 数 和 


居 结 构 的 list_elem 的 地 址 。 当 
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结 点 从 链表 中 脱离 时 ， 要 将 其 还 原 成 宿主 数据 结构 才能 使 用 ,还 原 工作 是 通过 宏 
是 通过 该 宏 得 到 内 存 块 的 起 始 地 址 。 内 存 块 地 址 被 返 





存 块 分 配 便 





然 也 会 把 此 内 存 块 中 的 list_elem 型 变量 
懂 的 ，free_list 中 的 元 素 是 list_elem 的 


























































































































elem2entry 完成 的 ， 本 节 的 内 
可 给 用 户 后 ， 用 户 可 以 自由 使 用 此 内 存 块 ， 
free_elem 和 窗 盖 ， 不 过 没关系 ， 它 并 不 影响 该 内 存 块 的 回收 和 分 配 ， 您 

















到 








也 址 ， 地 址 是 不 变 的 ， 将 来 回收 或 再 次 分 配 时 依然 可 以 正常 使 用 。 


























好 啦 ，sys_malloc 现在 可 用 

















了 ， 昌 








们 该 进行 功能 测试 了 ， 还 是 修改 main.c， 见 代码 12-24。 





代码 12-24 (project/c12/e/kernel/main.c ) 
17 int main(void) { 
18 put_str("I am kernel\n"); 
19 于 机 
20 intr enable(); 
21 thread start ("k thread a", 31, k thread a, "I am thread a");} 
必 之 thread start ("k thread b", 31, k thread b, "I am thread b ");} 
之 仿 while(1); 
24 return 0; 
25 } 
26 
27 /* 在 线程 中 运行 的 函数 */ 
28 void k thread a(lvoid* arg) { 
29 Char* para = arg; 
30 void* addr = sys malloc (33); 
3 console put str(" I am thread a, sys malloc(33), addr is Ox"); 
32 console put int((int)addr); 
33 console put char('\n'); 
34 while(1); 
SS 
36 
37 /* 在 线程 中 运行 的 函数 */ 
38 void k thread b(void* arg) { 
39 char* para = arg; 
40 void* addr = sys malloc (63); 
41 console put str(" I am thread b, sys malloc(63), addr is 0x"); 
42 console put int((int)addr); 
43 console put char('\n'); 
44 while(1); 
45 } 





目前 sys_malloc 是 内 核 级 函数 ， 因 此 这 次 只 添加 了 两 个 内 核 线程 来 调用 它 ， 线 程 k_thread a 中 调用 























sys_malloc(33): 


Bochs x86 emulator, http://bochs 















































请 33 字 节 的 内 存 ， 然 后 将 返回 地 址 转换 成 整 型 后 再 打印 出 来 ， 也 就 是 代码 “console_ 
put int((inbaddD”。k thread b 的 功能 类 似 ， 只 是 申请 的 内 存 大 小 是 63 字 节 。 





如 























吉 果 如 图 








运行 12-17 所 示 。 





sourceforge.net 
USER pogt 


st 
Resetsuspeno rouer 

















国 JAD ob 由 











c_init done 


t done 


idt_init done 
em_init start 
mem_pool_init 


kernel_poo 
user_pool_bi 


start 


kernel_pool_phy addr_sta 
er_pool phy _addr_ start:11009000 


mem_ _pool_ init dt 


rd init 
init start 


done 


ltr done 















































IPS; 28.843M | | | jn:o-H| | | | | | 
4 图 12-17 sys_malloc 功能 测试 
图 下 面 框 出 来 的 是 两 个 线程 的 输出 , 我 们 注意 各 线程 获得 的 内 存 地 址 , 分 别 是 0xc010200c 和 0xc010204c， 
下 面 分 析 下 这 两 个 地 址 背后 的 “故事 ”。 这 两 个 线程 申请 的 内 存 字 节 一 个 是 33， 一 个 是 63， 它 们 与 规格 为 
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64 字 节 的 内 存 块 最 接近 ， 


目 乞 5 
生 中 














1 于 














因此 sys_malloc 会 创建 规格 为 64 字 节 的 arena， 然 后 把 它 拆 分 成 64 字 节 的 





1 次 申请 内 存 且 只 申请 了 一 种 内 存 块 ， 故 系统 中 只 存在 这 











内 存 块 ， 
thread a 获得 的 内 




















个 arena。 把 线程 











存 地 址 0xc010200c 拆 分 成 0xc0102000+0xc 来 看 ， 其 中 0xc0102000 是 arena 的 首 地 址 ，0xc 是 arena 元 信 


息 大 小 ， 故 返回 





0xc010204c， 它 与 0xc010200c 相 
字 节 的 内 存 块 ，thread_b 申 i 

目测 验证 通过 ， 本 节 到 此 结束 ， 
后 一 块 加 上 吧 ， 赶 紧 休 ) 


12.4.4 内 存 的 释放 





的 0xc010200c 是 arena 
差 为 0x40， 眼 

















第 1 个 64 字 节 





内 存 块 的 地 址 。 线 程 thread b 获得 的 内 存 地 址 是 
十 进 制 64 字 节 ， 这 证 明 thread a 申请 的 33 字 节 也 占用 了 64 












































口 














的 63 字 节 占 | 





的 是 arena 中 第 2 个 64 字 节 内 存 块 。 



































也 许 有 同学 说 还 没有 添加 系统 调 
筷 吧 ，IT 人 很 辛苦 ， 洗 洗 睡 中 


























jj malloc 呢 ， 以 后 咱们 连同 实现 free 





























中 。 
































内 存 管理 系统 不 仅 和 

















存 的 使 用 都 是 只 借 不 还 ， 这 种 情况 一 直到 本 节 结 束 。 
L 一 块 复习 一 下 : 内 存 的 使 用 
中 的 相应 位 ， 者 





跟 大 伙 】 





质 上 都 是 在 设置 相关 位 
清 0， 无 需 将 该 4KB 物理 页 框 逐 字 节 


已 
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配 内 存 ， 还 应 该 











多 









































台 已 
用 旧 


收 内 存 ， 这 是 最 基本 的 内 存 管 理 





机 制 。 一 直 以 来 我 们 对 内 
































况 都 是 通过 位 图 来 管理 的 ， 因 








此 , 无 论 内 存 的 分 配 或 释放 ， 本 






































口 






































月 0。 











是 相反 的 ， 也 就 是 将 位 








图 : 








回想 一 下 ， 我 们 分 














“kernel pool->pool bitmap” 或 用 户 物理 



























































(3) 在 页 表 : 





以 上 三 个 步 又 








完成 虚拟 地 址 到 物 到 


























是 在 读 写 位 图 。 


相应 位 置 为 1 即 可 。 
配 内 存 时 的 一 般 步 又 如 下 。 
(1) 在 虚拟 地 址 池 中 分 配 虚拟 地 址 ， 相 关 的 函数 是 vaddr_get， 此 函数 操作 的 是 内 核 虚 拟 内 存 
“kernel vaddr.vaddr bitmap ”或 月 
(2) 在 物理 内 存 池 中 分 配 物 理 地 二 


有 户 虚 拟 内 存 池 位 
止 ， 相 关 的 函数 是 palloc， 此 函数 操作 的 是 内 核 物理 











图 。 回收 物 
收 虚 拟 地 址 就 是 将 虚拟 内 存 池 位 


里 地 址 就 是 将 物理 内 存 池 位 图 中 的 相应 位 
图 中 的 相应 位 清 0。 分 配 则 


























回 





























也 位 图 





区 











“pcb->userprog vaddr.vaddr bitmap ”。 




















内 存 池 位 图 

















内 存 池 位 


攻 | 








“user pool->pool bitmap ”。 





EE 地 址 的 上 映射， 相关 的 函数 是 page_table_add。 


封装 在 函数 malloc_page 中 。 














释放 内 存 是 与 分 配 内 存 相反 的 过 程 ， 咱 们 对 照 着 设计 一 套 释 放 内 存 的 方法 。 














(1) 在 物理 











地 址 








pte_remove。 


(3) 在 虚拟 地 址 池 中 释放 虚拟 地 址 ， 相 关 的 函数 是 vaddr remove， 操 作 的 位 

















中 释放 物理 页 地 址 ， 
(2) 在 页 表 中 去 掉 虚拟 地 址 的 














映射 ， 原 理 是 将 虚拟 地 址 对 应 pte 的 P 位置 








攻 | 








相关 的 函数 是 pfree， 操 作 的 位 图 同 palloc。 


0， 相 关 的 函数 是 page_table_ 






































入 | 





同 vaddr_get。 





我 们 将 以 上 三 个 功能 封装 到 函数 mfree_page 中 。 
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虚拟 地 址 如 











一 一 
芋 贝 衣 : 





该 页 表 的 数据 


占用 1 个 物 



































框 中 ，CPU 


些 “ 粗 暴 ”， 只 要 
只 要 检测 到 P 















































也许 您 对 上 面 的 步 又 (2〉 感到 好 奇 ， 为 什么 “去 除 虚拟 地 址 映射 ”的 函数 名 是 page_table_pte_ remove， 似 
乎 名 称 page_table remove 与 page_table add 显得 更 “ 门 当 
对 应 两 个 数据 项 : 页 目录 项 pde 和 页 表 项 pte。 
里 页 框 的 空间 ，1 个 pte 是 4 字 节 ， 
的 是 最 终 与 虚拟 地 址 映射 的 物理 页 框 。 如 何 清 除 虚 拟 地 址 ? 把 整个 pte 清 0? 行 是 行 ， 简 单 4 








三 


是 这 样 的 ， 咱 们 使 用 的 是 二 级 页 表 ， 
一 个 pde 记录 一 个 页 表 的 物理 地 址 ， 
因此 页 表 中 包含 1024 个 pte， 每 个 pte 记录 
+ 事 ， 但 显 佑 








户 对 原 大 

















































































































巴 pte 中 的 P 位置 为 0 就 可 以 了 ， 该 位 表示 pte 指向 的 物理 页 框 的 数据 是 否 
立 为 0， 就 会 认为 该 pte 无 效 ， 根 本 不 会 关 , 











昭 





属于 可 访问 的 物 到 
中 的 数据 转 储 到 外 存 上 ， 这 样 就 4 






































己 在 该 物理 
心 pte 所 指向 的 物理 页 框 的 地 址 是 


古 
























































内 存 的 范围 。P 位 的 实 





























出 了 4KB 的 物理 内 存 














际 意义 是 当 可 用 物理 内 存 较 少 时 ， 可 以 将 pte 指向 的 物理 页 框 
空间 。 将 物理 页 中 的 数据 存储 到 外 存 的 同时 ， 需 



























































要 将 pte 的 P 位 置 为 0。 这样 1 
缺 页 异常 ， 我 们 可 以 在 处 理 



































理 内 存 ! 














， 该 物理 














内 存 可 以 
然后 把 目标 物理 页 地 二 





[更 








新 到 | pte 中 ， 并 将 





在 下 次 访问 该 pte 对 应 的 虚拟 
pagefault 异常 的 中 断 处 理 程序 中 将 之 




















bh 址 时 ， 由 于 pte 的 P 位 为 0，CPU 会 抛 出 pagefault 
前 保存 到 外 存 的 页 框 数 据 再 次 载 入 到 物 





















































是 原 来 的 物理 





页 





























， 也 可 以 是 新 的 物理 页 ， 这 取决 于 实际 物理 内 存 的 使 用 情况 ， 
P 位 置 为 1。pagefault 中 断 处 理 程序 退出 后 ，CPU 自动 会 再 次 












































访问 引起 此 pagefault 的 虚拟 地 址 ， 这 次 发 现 pte 的 P 位 为 1， 从 而 访问 正常 ， 这 就 是 CPU 原生 支持 的 页 
式 虚 拟 地 址 管理 策略 ， 话 说 Linux 虚拟 地 址 管理 也 是 利用 P 位 和 pagefault 异常 实现 的 。 总 之 ， 只 要 pte 的 
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P 位 为 0，CPU 就 认为 该 虚拟 地 址 未 做 映射 ， 从 而 达到 删除 虚拟 地 址 的 目的 。 
























































































































































































































































































































































































































































按理 说 ， 当 页 表 中 所 有 的 pte 都 无 效 时 ， 就 可 以 将 页 表 所 在 的 4KB 页 框 回收 了 ， 然 后 在 页 表 所 属 的 pde 
中 清除 pde 的 P 位 。 但 是 大 伙 儿 知道 ，1 个 页 表 的 容量 是 4MB 内 存 ， 程 序 使 用 的 内 存 一 般 不 超过 几 十 MB， 
也 就 是 只 使 用 的 几 个 页 表 ,， 操 作 系统 想 在 页 表 上 节省 内 存 ,， 也 项 多 是 回收 这 几 个 页 表 占 据 的 几 个 物理 页 框 
的 空间 ， 而 且 页 表 中 的 pte 很 难 一 下 子 全 部 无 效 ， 这 种 情况 通常 只 在 程序 退出 时 才 出 现 。 再 者 ， 进 程 生命 
周期 往往 较 短 ， 在 这 短暂 的 时 间 内 还 要 修改 页 表 ， 似 乎 得 不 偿 失 ， 即 使 是 那些 生命 周期 较 长 的 守护 进程 ， 
程序 在 退出 时 操作 系统 也 会 回收 为 进程 分 配 的 一 切 资 源 , 这 当然 包括 页 表 本 身 占据 的 空间 ， 因 此 不 值得 只 
为 节省 一 两 个 页 框 的 内 存 而 在 程序 运行 中 频繁 操作 页 表 。 如 上 所 述 ， 我 们 对 于 删除 虚拟 地 址 的 处 理 方法 仅 
仅 是 将 pte 中 的 P 位 清 0， 为 了 显 式 说 明 该 函数 的 特点 ， 命 名 为 page_table_pte_remove， 请 大 伙 儿 知晓 。 

罗 哩 罗 唆 地 为 个 函数 名 解释 了 这 么 多 ， 想 必 大 伙 儿 也 困惑 了 ， 我 总 是 担心 说 得 不 清楚 ， 因 此 会 贯穿 一 
些 周边 的 内 容 以 求 “ 融 会 贯通 ”。 按 照 咱 们 设计 的 释放 内 存 的 3 个 步骤 ， 请 见 代 码 12-25-1。 

代码 12-25-1 (project/c12/f/kernel/memory.c ) 

. 略 

346 /* 将 物理 地 址 pg_phy_addr 回收 到 物理 内 存 池 */ 

347 voidq pfree (uint32 t pg phy adqqr) { 

348 struct pool* mem pool; 

349 uint32 t bit idx = 0; 

350 if (pg phy addr >= user pool.phy addr start) { // 物理 内 存 池 

5 mem pool = &user pool; 

352 bit idx = (pg phy addr - user pool.phy addr start) / PG SIZE; 

353 } else { // 内 核 物理 内 存 池 

354 mem Pool = &kernel pool: 

355 bit idx = (pg phy addr - kernel pool.phy addr start) / PG SIZE; 

356 } 

357 bitmap_set (&mem pool->pool bitmap，bit idx，0); // 将 位 图 中 该 位 清 0 

358 } 

359 

360 /* 去 掉 页 表 中 虚拟 地 址 vaddr 的 映射 ， 只 去 掉 vaddr 对 应 的 pte */ 

361 static void page table pte remove (uint32 七 vaddr) { 

362 uint32 t* pte = pte ptr(vaddr); 

3:63 *pte &= ~PG_P 1; // 将 页 表 项 pte 的 P 位 置 0 

364 asm volatile ("invlpg %0"::"m" (vaddr) :"memory"); // 更 新 七 Lb 

365 } 

366 

367 /* 在 虚拟 地 址 池 中 释放 以 _vaddr 起 始 的 连续 pg_cnt 个 虚拟 页 地 址 */ 











static void vaddr remove (enum pool flags pf, \ 
void* vaddr, uint32 t pg cnt) { 



























































369 uint32 t bit idx start = 0, vaddr = (uint32 t) vaddr, cnt = 0; 
370 
371 if (pf == PF_KERNEL) { // 内 核 虚 拟 内 存 池 
3.722 bit idx start = (vaddr - kernel vaddr.vaddr start) / PG SIZE; 
373 while(cnt < pg cnt) { 
374 bitmap set (&kernel vaddr.vaddr bitmap, \ 
bit idx start + cntt+; Qs 
B35 } 
376 } else { // 虚拟 内 存 池 
和 struct task struct* cur thread = running thread() 
378 bit idx start =\ 
(vaddr - cur thread->userprog vaddr.vaddr start) / PG SIZE; 
379 while(cnt < pg cnt) { 
380 bitmap_ set (&cur thread->userprog vaddr.vaddr bitmap, \ 
bit.idx start. + cnti+t+; 0)s 
381 } 
382 } 
3835 9 
函数 pfree 接受 一 个 参数 ， 即 物理 页 框 地 址 pg_phy addr， 功 能 是 将 物理 页 框 回收 到 相应 的 物理 内 存 池 ， 

















也 就 是 只 回收 一 个 物理 页 。 函数 实 现 还 是 很 简单 的 ， 用 的 都 是 以 前 的 思路 及 函 











数 ， 先 根据 物理 地 址 池 的 起 始 地 






































址 判断 pg phy addr 属于 哪个 物理 内 存 池 ， 用 变量 mem pool 指向 物理 内 存 池 ，bit idx 为 物理 























和 址 在 相应 物理 





























内 存 池 中 的 偏 移 量 ， 最 后 通过 代码 “bitmap_set(&mem pool->pool bitmap, bit idx, 0)” 在 位 图 : 
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回收 该 位 。 








中 的 P 位 置 0。 函 数 体 中 ， 多 
“*pte &=~PG P 1” 
经 被 修改 ， 因 此 咱们 要 


函数 page_table_pte_remove 接受 一 个 参数 ， 即 虚拟 地 址 vaddr， 功 能 就 是 如 前 “醉人 ”的 解释 ， 将 pte 









































器 提供 的 、) 











于 加 速 虚拟 地 址 到 和 














E 调 用 pte_ptr(vaddr) 获 取 虚 拟 地 址 所 在 的 pte 指针 ， 然 后 在 下 一 行 ， 通 过 代码 
使 pte 中 的 P 了 位 取 反 为 0。 除 此 之 外 ， 此 函数 还 多 做 了 一 件 事 ， 就 是 刷新 tlb。pte 已 
巴 此 pte 更 新 到 tb 中 ,还 记得 好 吗 ? 它 是 页 表 的 高 速 缓存 , 俗称 快 表 ,tlb 是 处 理 












































更 新 ， 






































匆 班 








地 址 的 转换 过 程 。 当 页 表 发 生变 化 时 ，tlb 中 缓存 的 数据 也 应 该 及 时 


























否则 程序 会 运行 出 错 。 更 新 TLB 有 两 种 方式 ， 一 是 用 invlpg 指令 更 新 单条 虚拟 地 址 条 目 ， 另 外 一 
个 是 重新 加 载 cr3 寄存 器 ， 这 将 直接 清空 TLB， 相 当 于 更 新 整个 页 表 。 咱 们 这 
































HH 





有 只 更 新 了 虚拟 地 址 vaddr 























对 应 的 pte， 因 此 不 至 于 大 动 干戈 针对 整个 TLB， 咱 们 采用 温柔 一 点 的 invlpg 指令 去 单独 更 新 vaddr 对 应 
的 缓存 。invlpg 的 指令 格式 为 “invlpg m”， 其 中 m 是 操作 数 ， 表 示 虚 拟 地 址 内 存 ， 注 意 ，m 并 不 是 立即 
数 形式 的 虚拟 地 址 ， 它 必须 是 实 实在 在 的 内 存 地 址 的 形式 。 比 如 更 新 虚拟 地 址 0x12345678 的 缓存 ， 指 令 
是 invalpg [0x12345678]， 而 不 是 invalpg 0x12345678。invalpg 是 汇编 指令 ， 因 此 用 下 面 的 一 行内 联 汇编 代 
人 码 “asm volatile ("invlpg %0"::"m" (vaddr):"memory")” 来 更 新 虚拟 地 址 vaddr 在 tlb 缓存 中 的 条 目 ， 也 就 是 


把 页 表 中 vaddr 所 在 的 pte 习 
入 部 中 的 vaddr,， 


pg_cnt 是 连续 的 虚拟 页 框 数 。 函 数 功 
函数 的 实现 很 简单 ， 虚 拟 内 存 地 址 的 管 



































































































































EE 新 写 入 tlb。 注 意 ，invlpg 的 操作 数 m 是 内 存 地 址 ， 因 此 位 于 内 联 汇编 代码 输 
其 约束 是 内 存 约束 m。 











下 一 个 函数 是 vaddr _ remove, 它 接受 3 个 参数 , pf 是 虚拟 内 存 池 标志 ，vaddr 是 竺 释放 的 虚拟 地 址 ， 





























能 是 在 虚拟 地 址 池 中 释放 以 _vaddr 起 始 的 连续 pg_cnt 个 虚拟 页 地 址 。 
里 是 在 虚拟 内 存 池 的 位 图 中 ， 因 此 先 根 据 pf 判断 是 处 理 哪个 虚 









































HH 























拟 内 存 池 ， 然 后 再 用 位 图 函数 bitmap_set 将 虚拟 地 址 在 虚拟 内 存 池 位 图 中 相应 的 位 清 0。 如 果 是 内 核 ， 


就 针对 
中 的 偏 移 量 
针对 用 











获 述 。 
下 面 是 代码 第 二 部 分 ， 见 代码 12-25-2。 


代码 12-25-2 (project/c12/f/kernel/memory.c ) 











内 核 的 虚拟 内 存 池 kernel vaddr 操作 ， 先 在 第 372 行 计算 虚拟 地 址 vaddr 在 位 图 kernel vaddr 











， 存 入 变量 bit_ idx_start 中 ， 然 后 循环 pg_cnt 次 ， 依 次 将 虚拟 内 存 池 位 图 中 的 相应 位 清 0。 






























































户 虚 拟 内 存 池 的 处 理 与 此 同 理 ， 只 是 虚拟 内 存 池 位 图 是 当前 用 户 进 程 pcb->userprog_vaddr， 不 目 





/* 释放 以 虚拟 地 址 vaddr 为 起 始 
void mfree page (enum pool flags pf, void* vaddr, uint32 t pg cnt) { 


uint32 t pg phy addr; 
uint32 t vaddr = (int32 七 ) vaddr, page cnt = 0; 


ASSE 





























Ge 








的 cnt 个 物理 页 框 */ 





RT (pg cnt >=1 && vaddr % PG SIZE == 0) ; 


pg_phy addr = addr v2p (vaddr); 


/* 确保 待 释放 的 物理 内 存在 
MB+1KB 大 小 的 页 目录 +1KB 大 小 的 页 表 地 址 范围 外 */ 


低 端 


























// 获取 虚拟 地 址 vaddr 对 应 的 物理 地 址 

















ASSERT( (pg phy addr % PG SIZE) == 0 && pg phy addr >= 0x102000); 


/* 判断 pg_phy addr 属 


EE 






































' 物 理 内 存 池 还 是 内 核 物理 内 存 池 */ 





(Pg _ phy addr >= user pool.phy addr start) { 


vaddr -= PG SIZE,; 
while (page cnt < 





// 位 于 user_pool 内 存 池 


pg cnt) { 


vaddr += PG SIZE; 
pg_phy addr = addr v2p (vaddr); 














/* 确保 物理 地 址 属 








' 物 理 内 存 池 */ 





ASSERT( (pg phy_ addr $ PG SIZE) == 0 &&\ 
pg_ phy addr >= user pool.phy addr start); 

















/* 先 将 对 应 的 物理 页 框 归还 到 内 存 池 */ 





pfree (Pg_ phy adqdqr) 


























/* 再 从 页 表 中 清除 此 虚拟 地 址 所 在 的 页 表 项 Pte */ 


page table pte remove (vaddr) ; 














page_cnt++; 
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第 12 章 进一步 完善 内 核 
412 } 
413 /* 清空 虚拟 地 址 的 位 图 中 的 相应 位 */ 
414 vaddr _ remove (pf, vaddr, pg cnt); 
415 
416 } else { // 位 于 kernel pool 内 存 池 
417 vaddr -= PG _ SIZE， 
418 while (page cnt < pg cnt) { 
419 vaddr += PG SIZE; 
420 pg_phy_ addr = addr v2p (vaddr); 
421 /* 确保 待 释放 的 物理 内 存 只 属于 内 核 物理 内 存 池 */ 
422 ASSERT( (pg phy addr 当 PG SIZE) == 0 && \ 
423 pg_phy addr >= kernel pool.phy addr start && \ 
424 pg_phy addr < user pool.phy addr start); 
425 
426 /* 先 将 对 应 的 物理 页 框 归 还 到 内 存 池 */ 
427 pfree (pg phy addr); 
428 
429 /* 再 从 页 表 中 清除 此 虚拟 地 址 所 在 的 页 表 项 pte */ 
430 page table pte _ remove (vaddr); 
431 
432 page_cnt++; 
433 } 
434 /* 清空 虚拟 地 址 的 位 图 中 的 相应 位 */ 
435 vaddr remove (pf, vaddr, pg cnt); 
436 } 
437 } 
… 略 
此 部 分 代码 只 

















拟 地 址 ，pg_cnt 是 连续 的 页 框 数 ， 此 函数 的 功 





台 已 四 
用 十 


上 部 分 代码 12-25-1 中 三 个 函数 的 封装 。 


内 存 回收 工作 分 为 三 大 步骤 ， 先 
I 除 页 表 中 此 地 址 的 pte， 最 后 调用 
周 用 addr_v2p(vaddr) 获 取 虚 拟 


pte_remove 珊 
直接 说 第 
中 ， 然 后 根 

















390 行 ， 先 1 
届 pg_phy_addr 的 值 





周 用 pfree 、 



































上 它 























kernel pool 的 地 址 


果 pg_phy addr 大 了 





于 上) 
过 代码 “if (pg_phy_addr >= use 

















理 内 存 池 的 处 理 

















pte_remove(vaddr) 清 


地 址 池 位 图 中 清 0 














通过 while 循环 处 理 
的 物理 地 址 pg_ phy addr， 然 后 
除 pte，pg_cnt 个 页 下 

















j 户 物理 





内 存 池 user pool 的 
r pool.phy addr start 
的 起 始 物理 























User pool 上 

















青空 物 表 





有 mfree page 这 一 个 函数 ， 它 接受 3 个 参数 ，pf 是 内 存 池 标志 ，_vaddr 是 待 释放 的 虚 
释放 以 虚拟 地 址 vaddr 为 起 始 的 cnt 个 物理 














匡 ， 





E 页 框 ， 它 是 























vaddr remove 清除 虚拟 地 刀 
也 址 vaddr 对 应 的 物理 地 址 ， 将 
属于 内 核 的 物理 内 存 池 还 是 用 户 物 理 
， 即 kernel pool 的 地 址 在 低 ] 
I 断 物 理 
EE 地址 , 说明 pg_phy addr 属于 用 户 内 存 ; 

















出 由 
)” 学 











E pg_cnt 个 页 机 











EE， 每 个 








地 址 位 图 中 的 相应 位 ， 再 调用 
止 位 图 中 的 相应 位 。 














page table 


























内 存 ; 























地 二 








上 pg phy addr 所 





属 的 物理 


保存 在 pg_phy addr 
!。 内核 物理 
节 址 处 ， 所 以 可 














内 存 池 
以 通 
。 如 








内 存 ; 





0 



































也 。 























循环 中 ， 都 是 调 





接 下 来 是 针对 用 
addr v2p(vaddm 得 到 vaddr 


户 物 











HH 














内 存 池 位 图 ! 














周 用 pfree(pg_phy_addr) 在 物理 




















匡 处 到 








丁 完成 了 


口 














用 free 不 远 了 ， 感 谢 大 伙 儿 ， 下 节 见 。 


12.4.5 实现 sys_free 


我 们 之 前 实现 的 mfree_page 只 能 释放 页 


i 


放任 意 字 
们 的 用 户 进 程 
mfree_ page 和 are 




















区 
己 




















na， 因 | 
sys_free 是 内 存 释 放 











Ee 


比 本 节 并 没有 新 增 的 内 容 。 
的 统一 接口 

















此 ，sys_free 针对 这 

















而 种 内 存 的 处 理 有 各 自 的 方法 ， 
































存 池 和 物理 内 存 ; 





证 
的 
2 























图 中 将 相应 


V. 


























AR 











放 回 到 内 存 块 描述 


I 








不 
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中 


， 无 论 是 页 框 级 别 


立 置 0。 对 于 小 内 存 站 
块 链表 free_list。 好 啦 ， 





匡 级 别 的 内 存 块 ， 这 当 
节 大 小 的 内 存 ， 而 这 就 是 sys_free 的 使 命 。sys_free 是 系统 调 
上 就 能 使 用 free 函数 啦 。 之 前 我 们 所 做 的 基础 了 














清 0 相应 位 。 再 调 
完成 后 ， 再 调用 函数 vaddr_remove(pf,vaddr, pg_cnt) 在 虚拟 
相应 位 。 后 面 针 对 内 核 内 存 池 的 逻辑 是 一 样 的， 不 再 袭 述 。 
收 内 存 的 基础 工作 ， 下 一 节 我 们 将 实现 sys_free， 用 它 来 释放 内 存 ， 您 懂 的 ， 离 系统 调 


然 不 能 满足 我 们 的 需求 ， 必 须 支 持 释 

















j page table_ 








下] 

















加 


[作者 











了 是 为 了 实现 sys_free 








对 


的 内 存 
六 大 内 存 的 处 到 





仁和 小 的 


]j free 对 应 的 内 核 功 外 


内 存 块 ， 都 统一 用 sys_free 处 理 。 











函数 ， 因 此 我 
，Sys_free 基于 














因 














称 之 为 释放 ， 就 是 





























的 处 得 
具体 还 是 看 代码 








口 

















吧 ， 见 代码 12-26。 











巴 页 框 在 虚拟 内 








收 ” 是 将 arena 中 的 内 存 块 重新 


代码 12-26 (project/c12/g/kernel/memory.c ) 

























































































… 略 
440 /* 回收 内 存 ptr */ 
441 void sys free(void* ptr) { 
442 ASSERT (ptr != NULL); 
443 if (ptr != NULL) 
444 enum pool flags PF; 
445 struct pool* mem pool; 
446 
447 /* 判断 是 线程 ， 还 是 进程 */ 
448 if (running thread()->pgdir == NULL) { 
449 ASSERT ( (uint32 t)ptr >= K_HEAP_ START); 
450 PF = PF_ KERNEL; 
451 mem pool = &kernel pool; 
452 } else { 
453 PF = PF_USER; 
454 mem pool = &user pool; 
455 } 
456 
457 lock acquire(&mem pool->lock); 
458 struct mem block* b = ptr; 
459 struct arena* a = block2arena (b); 
// 把 mem_block 转换 成 arena， 获 取 元 信息 
460 ASSERT (a->large == 0 || a->large == 1); 
461 if (a->desc == NULL && a->large == true) { // 大 于 1024 的 内 存 
462 mfree page (PF, a, a->cnt); 
463 } else // 小 于 等 于 1024 的 内 存 块 
464 /* 先 将 内 存 块 回收 到 free list */ 
465 list append(&a->desc->free list, &b->free elem); 
466 
467 /* 再 判断 此 arena 中 的 内 存 块 是 否 都 是 空间 ，\ 
如 果 是 就 释放 arena */ 
468 if (++a->cnt == a->desc->blocks per arena) { 
469 UTNE32 t BLOCKk: Ta 
470 for (block idx = 0; \ 
block idx < a->desc->blocks per arena; block idx++) { 
471 struct mem block* b = arena2block(a, block idx); 
472 ASSERT (elem find(&a->desc->free list, &b->free elem 
473 list remove (&b->free elem);} 
474 } 
475 mfree page (PF, a, 1); 
476 上 
477 } 
478 lock release(&mem Pool->1Lock) ; 
479 } 
480 } 
… 略 


sys_free 只 接受 1 个 参数 ， 内 存 指 针 ptr， 函 数 功 能 是 释放 ptr 指向 的 内 存 。 












































随后 在 第 458 行将 ptr 赋值 给 内 存 块 指 针 b， 然 后 通过 “struct arena* a = block2arena(b)” 获 









































arena 指针 , 此 目的 是 获取 arena 中 的 元 信息 , 通过 元 信息 中 的 变量 desc 和 large 的 值 分 别 进行 下 一 步 处 理 。 
如 果 a->desc 的 值 为 NULL 并 且 a->large 的 值 为 tue， 这 说 明 待 释放 的 内 存 〈 也 就 是 ptr 指向 的 内 存 

并 不 是 在 arena 中 的 小 内 存 块 , 而 是 大 于 1024 字 节 的 大 内 存 ,， 其 大 小 是 1 个 或 多 个 页 框 , 页 框 的 数量 是 

arena 元 信息 中 的 变量 cnt 记录 的 。 这 是 我 们 在 sys_malloc 中 进行 内 存 分 配 时 约定 好 的 ,“a->desc 为 NULL， 






















































































且 a->large 为 true” 表 示 此 arena 只 被 用 于 大 内 存 分 配 ， 并 不 是 被 拆 分 成 多 个 内 存 块 ， 











被 多 次 共享 的 情况 ， 完 全 可 以 释放 。 如 果 代码 “if (a->desc == NULL && a->large == true)” 条 件 成 立 的 话 ， 
就 调用 “mfree_page(PF, a, a->cnt)” 释 放 a->cnt 个 页 框 。 如 果 不 成 立 的 话 ， 表 示 待 释放 的 内 存 是 小 内 存 块 ， 流 























)); 


在 函数 体 前 部 ， 判 断 调 用 者 是 内 核 线程 ， 还 是 用 户 进程 ， 并 初始 化 内 存 池 标 记 PF 和 内 存 池 指针 mem _pool。 


取 内 存 块 b 所 在 的 















































因此 不 存在 此 arena 








程 就 进入 了 第 465 行 代码 “list_ append(&ca->desc-> free_list, &b->free_ elem)”， 将 此 内 存 块 

















回收 到 此 内 存 块 描 














述 符 的 free_list 中 。 接 下 来 在 第 468 行将 “++a->cnt” 后 的 结果 与 内 存 块 描述 符 中 的 blocks_per_arena 比较 ， 
























































如 果 相 等 ， 这 表示 此 arena 中 的 空闲 内 存 块 已 经 达到 最 大 数 ， 说 明 此 arena 已 经 没 人 使 























] 了， 可 以 释放 。 
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过 for 循环 , 将 此 arena 中 的 
过 “mfree page(PF, a, 1)” 释 放 此 arena。 至 此 ， 内 存 
对 于 





























为 什么 不 先 类 

了 ， 用 不 着 将 内 存 块 b 放 回 free_list。 听 上 去 很 有 
您 看 ， 我 们 在 for 循环 中 

后 , 再 调 

前 必须 跳 过 
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代码 12-27 


int main(void) { 
put str("I am kernel\n"); 
init all(); 

intr enable();} 








遍历 此 arena 所 有 内 存 块 
j list remove 从 free list 中 去 掉 内 存 块 。 如 果 之 前 
该 内 存 块 ， 因 此 还 要 判断 从 arena2block 返回 














be 












































thread start("k thread a", 31, k thread ay 
thread start("k thread b", 31, k thread b, "I am 
while(1); 
return 0; 
} 
/* 在 线程 中 运行 的 函数 */ 
void k thread al(lvoid* arg) { 
char* para = arg; 
void* addrl; 
void* addr2; 
void* addr3; 
void* addr4; 
void* addr5; 
void* addr6; 
void* addr7; 
console put str(" thread a start\n"); 
int max = 1000; 
while (max-- > 0) { 
int size = 128; 
addrl = sys malloc (size); 
size *= 2; 
addr2 = sys malloc (size); 
size *= 2; 
addr3 = sys malloc (size); 
sys_free (addr1);} 
addr4 = sys malloc (size); 
Size *= 2; size *= 2; Size *= 2; size *= 2，; 
size *= 2; size *= 2; size *= 2; 
addr5 = sys malloc (size); 
addr6 = sys malloc (size); 
sys_free (addr5);} 
size *= 2; 
addr7 = sys malloc (size); 


} 


} 





sys_free (addr6); 
sys_free (addr7);} 
sys_free (addr2); 
sys_free (addr3); 
sys_free (addr4); 





console put str(" thread a end\n"); 
while(1); 


/* 在 线程 中 运行 的 函数 */ 
void k thread b (voidqx arg) { 





char* 





para = arg; 


void* addrl; 





所 有 内 存 块 从 内 存 块 描述 符 的 free_list ! 
收工 作 完 成 。 
第 465 行 的 “list_append(&a->desc->free_ list, &b->free elem)”， 或许 您 有 些 疑 惑 ， 
存 块 b 放 回 free_list, 后 面 



































想 ， 





去 掉 ,， 遍历 结束 后 , 通 


心 想 ， 刚 把 内 


若 释 放 arena 的 话 , 还 要 将 内 存 块 b 从 free list 中 去 掉 , 似乎 多 余 将 它 放 回 链表 中 ， 

j 靳 〈a->cnt) 是 否 等 于 (a->desc->blocks_per arena-1) 昵 ? 如 果 相 等 , 这 说 明 马 上 就 要 释放 arena 
道理 ， 这 样 看 似 效率 高 ， 但 转念 
时 ， 用 “b =arena2block(a, block idx)” 来 获得 内 存 块 地 址 








似乎 更 麻烦 了 。 





























未 将 该 内 存 块 放 回 free_list, 这 里 在 执行 list_remove 
的 地 址 是 


否 等 于 ptr， 效 率 反而 更 低 了 。 
好 了 ，sys_free 就 完成 了 ， 我 们 赶紧 在 main.c 中 测试 一 下 ，main.c 代码 如 代码 12-27 所 示 。 


( project/c12/g/kernel/main.c ) 


thread b 


"I am thread a"); 


ey 





12.4 完善 堆 内 存 管理 














69 void* addr2; 
70 void* addr3; 
71 void* addr4; 
72 void* addr5; 
人 void* addr6; 
74 sb ea bod 
75 void* addr8; 
76 void* addr9; 
77 int max = 1000; 
78 console put str(" thread b start\n"); 
79 while (max-- > 0) { 
80 int size = 9; 
81 addrl = sys malloc (size); 
82 size *= 2; 
83 addr2 = sys malloc (size); 
84 size *= 2; 
85 sys_free (addr2); 
86 addr3 = sys malloc (size); 
87 sys_free (addr1); 
88 addr4 = sys malloc (size); 
89 addr5 = sys malloc (size); 
90 addr6 = sys malloc (size); 
91 sys_free (addr5); 
92 size *= 2; 
93 addr7 = sys malloc (size); 
94 sys_free (addr6); 
95 sys_free (addr7); 
96 sys_free (addr3); 
97 sys_free (addr4); 
98 
99 size *= 2; size *= 2; Size *= 2; 
100 addrl = sys malloc (size); 
1 福生 addr2 = YS aT To.(S Te 
102 addr3 = sys malloc (size 
103 addr4 = sys malloc(size 
104 addr5 = sys malloc (size 
105 addr6 = sys malloc(size 
106 addr7 = sys malloc(size 
0 addr8 = sys malloc (size 
108 addr9 = sys malloc (size 
109 sys_free (addr1); 
下 全 个 sys_free (addr2); 
和 sys_free (addr3); 
112 SYS_free (addr4); 
113 sys_free (addr5);} 
114 sys_free (addr6); 
sys_free (addr7);} 
116 sys_free (addr8); 
117 sys_free (addr9); 
It8 } 
9 console put str(" thread b end\n"); 
于 之 这 while(1); 
1 这 和 

















这 里 创建 了 两 个 线程 ， 各 线程 中 分 别 循环 1000 次 ， 每 个 循环 中 多 次 调 
请 和 释放 不 同 大 小 的 内 存 。 循 环 开始 前 ， 各 线程 打印 出 
下 是 有 些 “残酷 ”的 ， 


























“thread [ab] end”。 相 对 来 说 此 测试 用 例 还 
言 息 了 ， 咱 们 改 为 查看 内 存 池 位 图 。 





























按理 说 ,循环 体 中 sys_malloc 和 sys_free 是 成 对 








“thread [ab] start” 




















匹配 的 ， 





ey 















































致 的 ， 这 里 咱们 查看 的 是 内 核 物 理 内 存 池 























地 址 如 图 12-18 中 的 框 

















用 sys_malloc 和 sys free， 分 别 申 
， 当 循环 结束 后 ， 各 线程 打印 出 














天 ee 前 后 ， 


















































在 框框 中 的 是 内 核 物理 内 存 池 位 图 








位 图 的 状态 》 在 此 以 水 数 k thread a 的 地 














kehe b 执行 ， 因 此 可 以 看 到 在 内 存 分 配 与 释放 之 
图 12-14 中 第 一 行 执行 “lb0xc0001569” 设 置 断 点 ， 接 着 命令 c 连续 执行 ,直到 断 点 处 。/ 
查看 位 图 ， 为 了 让 大 伙 儿 看 到 位 图 的 变化 ， 我 在 循环 执行 











bh 址 ， 即 0xc009a000。 另 外 ， er 
址 0xc0001569 为 断 点 (此 地 址 是 用 nm 查看 的 )， 此 函数 先 于 














于 执行 的 次 数 较 多 ， 故 不 在 屏幕 上 输出 

















位 图 的 情况 应 该 是 一 

















加， 需要 在 循环 前 获得 
































前 的 原始 位 图 。 调 试 过 程 如 图 12-19 所 示 。 


“x/10 0xc009a000” 


过 程 中 按 下 了 “ctrlte”， 又 查看 了 几 次 位 图 ， 
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位 图 的 状态 都 在 框框 中 标 出 了 。 当 循环 执行 完成 后 ， 也 就 是 在 图 12-13 的 最 下 面 出 现 “thread a end” 和 
“thread b end” 后 ， 图 12-14 中 最 下 面 的 框框 便 是 位 图 的 最 终 状 态 ， 它 与 最 开始 时 的 值 都 是 0x00000003， 
0x3 的 二 进 制 是 11， 这 表示 用 了 2 个 页 框 ， 原因 是 创建 两 个 线程 时 各 用 了 1 个 页 框 做 其 pcb， 因 此 位 图 的 
使 用 情况 与 预期 相符 。 
























































































































































Bochs x86 emulaton http://bochs.sourceforge.net/ 


Reset susPeno Pouer 


WO) 












































nit done 
one 
done 


rnel_pool_phy 


it done 
thread_init start 
thread_init done 
timer_init start 
ti init done 
ke rd init start 

rd init done 

it start 

it and ltr done 





IP5: 28.655H mH cnL | | | | | | | | 
4 图 12-18 ”内 核 物理 内 存 池 位 图 地 址 


<bochs:1> lb Oxc0001569 

<bochs:2> < 

(9) Breakpoint 1, Oxc0001569 in ?? () 

Next at t=18193999 

(9) [Ox000000001569] 06608:c9601569 (unk. ctxt): push ebp 
EB] 





























<bochs:3> x/3 90xc909a000 
9>: Qx00000003 Ox00000000 Qx00000000 


^CNext at t=344280000 

(9) [Ox000000001567] 060608:c06901567 (unk. ctxt): jmp .-2 (Oxc0001567) 

ebfe 

<bochs:5> x/3 Qxc009a000 

[bochs]: 

6xc909a066 <bogus+ 9>: Qxffffffff 9x900000Tf Qx000009000 
<bochs:6> c 

^CNext at t=1815564000 

(9) [Ox00600060003a7a] 0008:c9003a7a (unk. ctxt): sub dword ptr ss:[ebp+16], 
x9006066001 ; 836d1001 

<bochs:7> x/3 60xc909a060 


0>: QOxffffffff 9x007fffff QOx00000000 


人 ^CNext at t=8456972000 

(0) [Ox00600060004526] 0008:c0004526 (unk. ctxt): mov edx, dword ptr ds:[edx+4 
] ; 8b5204 

<bochs:9> x/3 90xc909a000 


90x006000063 Ox00000000 QOx00000600 











A 图 12-19 ”位 图 调试 


本 节 到 此 结束 了 ， 下 节 打 算 完 成 malloc 和 free 的 系统 















































ei 
: 
o 


12.4.6 ”实现 系统 调用 malloc 和 free 


兄弟 们 ， 本 节 的 工作 很 轻松 ， 按 照 添加 系统 调用 的 3 个 步 又， 添加 malloc 系统 调用 和 free 系统 调用 。 
在 Linux 中 执行 man 3 malloc 回 车 ， 屏 幕 显 示 malloc 和 free 的 原型 是 : 

“void *malloc(size tsize);” 和 “void free(void *ptr);” 

它们 所 属 的 头 文件 是 stdlib.h。malloc 的 功能 是 分 配 size 字 节 大 小 的 内 存 ， 并 返 
的 功能 是 释放 ptr 所 指向 的 内 存 。 

Linux 中 系统 调用 很 多 , 它们 的 接口 分 布 在 很 多 头 文件 中 , 我 也 没 想 过 兼容 所 有 Linux 系统 调用 接口 ， 
为 图 省 事 ， 咱 们 所 有 系统 调用 的 接口 原型 都 放 在 syscall.h 中 。 好 ， 现 在 依照 此 标准 接口 实现 自己 的 版 本 。 
先 在 syscall.h 中 添加 malloc 和 free 的 系统 调用 号 及 接口 ， 如 代码 12-28 所 示 。 












































如 





所 分 配 的 地 址 ，free 
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12.4 完善 堆 内 存 管理 





代码 12-28 (project/c12/h/lib/user/syscall.h ) 


enum SYSCALL NR { 
SYS_GETPID, 
SYS_WRITE, 
SYS_ MALLOC, 
SYS_FREE 


uint32 七 getpidl(void); 
uint32 七 write(char* str); 
void* malloc(uint32 t size); 


略 
4 

5 

6 

2 

8 

9 1}; 
工 9 
让 二 
于 用 
13 void free(void* ptr); 


“LO 


接着 在 syscall.c 中 完成 malloc 和 free 的 实现 ， 如 代码 12-29 所 示 。 


代码 12-29  ( project/c12/h/lib/user/syscall.c ) 





… 略 

61 /* 申请 size 字 节 大 小 的 内 存 ， 并 返回 结果 */ 

62 void* malloc(uint32 t size) { 

63 return (void*) syscalll (SYS MALLOC, size); 
64 } 


66 /* 释放 pt 指向 的 内 存 */ 

67 void free(void* ptr) { 

68 _syscalll (SYS FREE, ptr); 
69.°} 

































































最 后 在 syscall-init.c 中 完成 系统 调用 号 与 子 功能 处 理 函 数 的 关联 ， 也 就 是 更 新 数组 syscall_table， 
如 代码 12-30 所 示 。 

















代码 12-30 (project/c12/h/userprog/syscall-init.c ) 
.… 略 
25 /* 初始 化 系统 调用 */ 
26 void syscall init (void) { 




















2:7 put_ str("syscall init start\n"); 

28 syscall table[SYS GETPID] = sys_ getpid; 
29 syscall tablel[lSYS WRITE] = sys write; 
30 syscall tablel[lSYS MALLOC] = sys malloc; 
3 syscall table[SYS_FREE] = sys free; 

32 put_ str("syscall init done\n"); 

337 了 

… 略 


到 了 测试 的 时 候 了 ， 在 main.c 中 加 入 相应 代码 ， 如 代码 12-31 所 示 。 
代码 12-31 (project/c12/h/kernel/main.c ) 





… 略 

17 int main(void) { 

18 put str("I am kernel\n"); 

19 init all(); 

20 intr enable ();} 

2 process execute(u prog a, "u prog a"); 

22 process execute(u prog b, "u prog b"); 

23 thread start("k thread a", 31, k thread a, "I am thread a"); 
24 thread start("k thread b", 31, k thread b, "I am thread b");} 
25 while(1); 

26 return 0; 

27.-.F 

28 


29 /* 在 线程 中 运行 的 函数 */ 
30 void k thread al(lvoid* arg) { 








3 void* addrl = sys malloc (256); 

32 void* addr2 = sys malloc (255); 

33 void* addr3 = sys malloc (254); 

34 console put str(" thread a malloc addr:0x"); 
号 六 console put int ((int)addr1l); 

36 console put char(','); 
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37 console put int ((int)addr2); 

38 console put char(','); 

39 console put int((int)addr3); 

40 console put char('\n'); 

41 

42 int cpu delay = 100000; 

43 while(cpu delay-—- > 0); 

44 SYS_free (addr1);} 

45 sys_free (adqdr2) ; 

46 SYS_free (adqdr3) ， 

47 while(1); 

48 } 

49 

50 /* 在 线程 中 运行 的 函数 */ 

51 void k thread b (voidqx arg) { 
代码 同 k thread a 

69 } 

70 





























71 /* 测试 用 户 进程 */ 
72 void u prog a(lvoid) { 


了 3 void* addrl = malloc (256); 

74 void* addr2 = malloc(255); 

对 导 void* addr3 = malloc(254) ; 

76 printf(" prog a malloc addr:0x%x, Ox%sx, Oxsx\n", \ 
(intyaddril; (int}yaddr2, (int})addr3})y 

77 

78 int cpu delay = 100000; 

79 while(cpu delay-—- > 0); 

80 free (addr1);} 

81 free (addr2);} 

82 free (addr3); 

83 while(1); 

84 

85 

86 /* 测试 用 户 进 程 */ 





























87 void u prog pl(void) { 
代码 同 u_prog a 

99 

本 次 main.c 中 启 了 4 个 任务 ， 分 别 是 2 个 用 户 进程 和 2 个 内 核 线 程 。 它 们 分 别 都 申请 了 256、255、 

254 字 节 大 小 的 内 存 ， 因 此 它们 对 应 的 内 存 块 规格 都 应 该 是 256 字 节 。 所 有 内 核 线程 共享 内 存 空 间 ， 因 此 
线程 函数 k_thread a 和 k thread b 所 申请 的 内 存 应 该 会 有 地 址 累加 的 情况 。 用 户 进程 拥有 独立 的 内 存 空 间 ， 
因此 在 申请 内 存 时 ， 都 会 从 自己 的 堆 空 间 从 头 算 起 ， 并 不 会 产生 地 址 累加 的 情况 。256 的 十 六 进 制 形式 是 
0x100， 比 较 方便 查看 地 址 累加 的 情况 ， 这 就 是 我 们 选择 规格 为 256 字 节 内 存 块 的 原因 。 各 任务 中 都 有 代 
码 “while(cpu_delay-- > 0)” 它 被 插入 在 内 存 释放 之 前 ， 目 的 是 让 CPU 空 忽 一 段 时 间 以 延迟 释放 内 存 的 
操作 ， 这 样 方便 大 伙 儿 看 到 内 核 线程 地 址 累加 的 情况 。 好 啦 ， 运 行 结 果 如 图 12-20 所 示 。 









































































































































































































































IT| Bochs x86 emulator, http://bochs.sourceforge.net sx 


USER Shet ResetsuspEnDPCKe， 


CEO) 
































init done 
nit done 


mem_pool_init 
kernel_pool_h _star 9A000 kernel_pool_phy_addr_start 
ool_hbi art:C 1EQ user_pool_phy_addr_start :1199 





CTRL + 3rd button enables nouse Nu | | | 1 | 1 | 


A 图 12-20 户 进 程 和 内 核 线 程 的 内 存 分 配 
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在 图 下 面 的 框框 中 ， 用 户 进程 prog a 三 次 malloc 调用 ， 返 回 的 地 址 分 别 是 0x804800c、0x804810c、 
0x804820c， 它 们 各 相差 0x100， 也 就 是 差 256 字 节 ， 用 户 进程 prog_b 与 它 相 同 ， 原 因 是 用 户 进程 独 享 内 
存 空间 , 虚拟 地 址 并 不 冲突 。 线程 thread a 调用 sys_malloc 后 返回 的 地 址 分 别 是 0xc013400c、0xc013410c、 
0xc013420c， 地 址 之 间 也 是 相差 0x100， 即 256 字 节 。 下 面 的 线程 thread_b 同样 调用 sys_malloc， 返 回 的 
地 址 出 现 了 累加 的 现象 ， 在 k_thread a 地 址 分 配 的 基础 上 ， 从 0xc013430c 开始 ， 然 后 依次 是 0xc013440c 
和 0xc013450c， 原 因 是 内 核 线程 共享 内 存 空间 ， 虚 拟 地 址 必须 唯一 。 

以 上 测试 符合 我 们 的 预期 ,因此 有 关内 存 分 配 的 工作 暂时 各 一 段落 ， 感谢 大 伙 儿 的 陪伴 ， 学 习 的 道路 
上 有 你 们 真 好 。 
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13.1.1 
千里 之 行 始 了 
门 的 内 核 。 这 
的 命令 bximage， 此 命令 在 bochs 安装 


面 是 咱 


提示 ， 
盘 的 配置 参数 ， 

先 不 着 急 
话 还 不 是 瞎 4 














生生 

















要 实现 文件 系统 ， 必 须 先 有 个 磁盘 介质 ， 昌 然 咱们 
有 来 存储 内 核 ， 是 个 没有 文件 系统 的 裸 盘 (raw disk)。 














盘 的 作 月 





]， 仪 月 














es ee 


在 很 久 很 久 以 前 ， 我 们 在 加 载 loader.bin 的 时 候 ， 已 经 接 侧 
日 们 为 了 实现 文件 系统 ， 必 须 建 立 好 一 套 完整 的 方法 ， 这 套 方法 就 是 磁盘 驱动 程序 ， 本 章 

















里 打算 把 文件 系统 安装 到 另 一 块 硬盘 | 
创建 从 盘 及 获取 安装 的 磁盘 数 

















13 羡 














上 。 这 一 工作 涉及 到 硬盘 的 





























图 上 已 经 对 重点 内 容 配 上 中 文 说 明 ， 
有 到 。 
创建 完 硬盘 ， 当 前 目录 下 便 会 生成 文人 





区 时 会 月 

















站， 为 编写 引 

































































、 


F 不 是 咱 
它 配 置 到 bochs : 




















区 动 和 














序 ， 咱 们 需要 再 





























录 /bin/ 下 ， 之 前 


[work@localhost bochs]$ bin/bximage 


mm | 
已 经 























编号 硬 扣 驱 动 程序 





了 硬盘 基本 操作 。 但 那 时 的 操作 方法 还 不 成 体 




















们 要 完成 它 o 








已 经 有 个 虚拟 磁盘 hd60M.img， 但 它 只 充当 了 启动 














为 了 省 事 ， 这 块 硬盘 




















次 从 头 做 起 ， 创 建 硬 盘 。hd60M.img 是 我 们 的 主 盘 ， 上 
EE 咱们 再 创建 一 个 80MB 的 硬盘 作为 从 盘 ， 在 其 上 安装 文 
用 过 此 命令 了 ， 这 次 的 创建 过 程 如 








bximage 


Disk Image Creation Tool for Bochs 


$Id: bximage.c 11315 2012-08-05 18:13:38Z vruppert $ 





Do you want to create a floppy disk image or a hard disk ;image? 选择 磁盘 类 型 


Please type hd or fd. [hd] 回 车 


What kind of image should I create? 


Please type flat, sparse or growing. [flat] 回 车 


Enter the hard disk size in megabytes，between 1 and 8257535 以 MB 为 单位 的 磁盘 容量 


[10] 80 回 车 


Fr will create a 'flat' hard disk image with 
cyl=162 柱 面 数 


heads=16 


sectors per track=63 


每 磁道 扇 区 数 


total sectors=163296 ”总共 扇 区 数 
total size=79.73 megabytes 总 大 小 (MB) 


What should I name the image? 
[c.img] hd86M.img 回 车 


Writing: 口 Done. 


I wrote 83607552 bytes to hd80M.img. 


The following line should appear in your bochsrc: 

















? 在 物理 地 址 0x475 处 存储 着 3 














HH 


有 下 面 线 的 部 分 是 键入 的 内 容 , 方 忆 




















将 下 面 这 行 写 入 bochsrc， 也 就 是 bochs 的 配置 文件 


为 映像 文件 命名 





选择 映像 类 型 ， 黑 认 是 大 小 固定 不 变 的 flat 


磁盘 
参数 


将 下 面 这 行 写 入 bochs 配 置 文件 
ata0-master: type=disk, path="hd80M.img", mode=flat, cylinders=162, heads=16, spt=63 
work@localhost bochs]$ 





图 13-1 ”bochs 创建 虚拟 硬盘 





F hd80M.img， 这 就 是 我 们 刚刚 创建 的 硬盘 。 不 过 医 








些 基 而 











们 就 不 动 了 ， 
节 给 大 伙 儿 介绍 下 。 














上 租 还 是 利用 bochs 




















图 13-1 所 示 。 








中 的 磁盘 参数 我 们 在 创建 














最 下 面 的 一 行 



































羽 此 应 该 








门 所 说 的 从 盘 ， 
. a 





门 得 





ph。 大 伙 儿 要 沪 









































FE 机 上 安装 的 硬盘 的 数 


Et 找 个 方法 证 明 人 磁盘 确实 被 安 六 J 


主意 了 ， 最 下 面 的 这 # 











三 























英文 是 针对 主 


巴 “ata0-master” 修 改 为 “ata0-slave”， 其 他 的 参数 不 变 。 
则 bochs 未 识别 的 
1 BIOS 检测 并 写 入 的 ， 





咱们 本 着 拿 来 主义 直接 用 。 安 装 新 硬盘 之 前 咱们 来 查看 一 

下 ， 如 图 13- 2 所 示 。 (0) [0x9006000600158f] 0008:c000158f (unk. ctxt): 
图 13-2 所 示 为 在 bochs 中 用 xp 命令 查看 物理 地 址 0x475 WE :2> xp/b 9x475 

处 的 1 字 节 ， 其 值 是 框框 中 的 0x01， 这 表示 硬盘 数 是 1， 与 

目前 仅 有 的 一 块 硬盘 hd60M.img 相符 。 咱 们 bochs 的 配置 文 

件 是 bochsrc.disk， 下 面 将 参数 写 入 其 中 ， 如 图 13-3 所 示 。 






























































































































































三 























4 图 13-2 ”bochs 中 获取 安装 的 硬盘 数 





















































ata0: enabled=1，ioaddr1=0Ox1f0，ioaddr2=0x3f0，irq=14 
aota0-master: type=disk，path= ， mode=flat, cylinders=121, heads=16, spt=63 
ata0-slave: type=disk, path= ，» Mode=flat, cylinders=162, heads=16, spt=63 














4 图 13-3 ”在 配置 文件 中 添加 从 盘 


下 面 再 从 bochs 中 验证 下 是 否 安 装 成 功 了 ， 如 图 13-4 所 示 。 


<bochs :1> < 

^CNext at t=16883678 

(0) [0x0000000039ce] 0008:c00039ce (unk. ctxt): 
<bochs:2> xp/b 0x475 





























[bochs]: 
Ox00000475 <bogus+ 0>: QOx02 
<bochs :3> 








和 图 13-4 ”bochs 中 获取 安装 的 硬盘 数 
果然 ， 框 框 中 的 数字 现在 是 0x02， 这 说 明 安 装 成 功 了 ， 首 战 告捷 ， 下 一 步 准备 为 它 创 建 分 区 ， 下 节 再 见 。 
13.1.2 ”创建 磁盘 分 区 表 


什么 是 文件 系统 ?曾经 有 人 这 样 告诉 我 :“ 给 磁盘 创建 文件 系统 相当 于 在 空白 纸 上 打 好 格子 ， 这 样 帮 
小 格子 中 书写 文字 就 不 会 乱 了 ” 因此， 小 弟 曾 一 度 误 以 为 文件 系统 仅仅 是 有 关 文 件 存储 格式 的 静态 数据 
结构 ， 其 实 不 然 。 

文件 系统 是 运行 在 操作 系统 中 的 软件 模块 , 是 操作 系统 提供 的 一 套 管 理 磁盘 文件 读 写 的 方法 和 数据 组 
织 、 存 储 形式 ， 因 此 ， 文 件 系统 = 数据 结构 + 算法 ， 哈 哈 ， 所 以 它 是 程序 。 它 的 管理 对 象 是 文件 ， 管 辖 范围 
是 分 区 ， 因 此 它 建立 在 分 区 的 基础 上 ， 每 个 分 区 都 可 以 有 不 同 的 文件 系统 。 但 咱们 刚 创 建 了 磁盘 而 已 ， 磁 
盘 还 是 裸 盘 ， 即 传说 中 的 raw disk， 本 节 的 任务 是 把 刚 创 建 的 磁盘 hd80M.img 分 区 。 这 里 用 的 是 fdisk 工 
， 在 分 区 过 程 中 会 用 到 图 13-1 中 的 磁盘 参数 。 为 了 让 大 伙 儿 理解 fdisk 的 分 区 过 程 ， 咱 们 先 从 物理 结构 
上 理解 磁 竹 ， 以 下 内 容 可 以 参考 图 3.28， 没 销 ， 就 是 很 久 很 久 以 前 的 那 张 机 械 式 硬盘 示意 图 。 
盘 片 : 类 似 光 盘 中 的 一 个 圆 盘 ， 上 面 布 满 了 磁性 介质 。 
扇 区 : 扇 区 是 硬盘 读 写 的 基本 单位 ， 它 在 磁道 上 均匀 分 布 ， 与 磁头 和 磁道 不 同 ， 扇 区 从 1 开始 编号 。 扇 区 的 
大 小 字 节 数 =256XN,， NN 为 自然 数 。 通 常 取 N 为 2， 因 此 扇 区 大 小 为 $12 字 节 。 也 许 有 读者 会 说 ， 我 怎么 听 说 的 
文件 存储 都 是 以 簇 或 块 为 单位 的 ? “和 艇 ” 或 “ 块 ”这 些 是 操作 系统 中 读 写 数据 的 单位 ， 并 不 是 磁盘 原生 支持 的 ， 
一 个 簇 或 块 等 于 1 个 以 上 的 扇 区 。 因 为 磁盘 本 身 就 是 整个 机 器 的 瓶颈 ， 它 是 速度 较 低 的 设备 ， 若 操作 系统 总 去 1 
问 这 些 低速 设备 就 太 浪费 时 间 了 ， 因 此 操作 系统 不 可 能 一 次 只 写 一 个 扇 区 ， 为 了 优化 IJO， 操 作 系 统 把 数据 积攒 
到 “多 个 扇 区 ”时 再 一 次 性 写 入 磁盘 ， 这 里 的 “多 个 扇 区 ”就 是 指 操作 系统 的 复 或 块 。 通 常 标准 库 函 数 还 进行 了 
二 次 优化 ， 数 据 可 以 积攒 到 多 个 族 或 块 时 才 写 入 ， 不 过 标准 库 中 还 提供 了 控制 选项 ， 可 以 立即 把 数据 刷 进 硬盘 。 

磁道 盘 片 上 的 一 个 个 同心 圈 就 是 磁道 ， 它 是 扇 区 的 载体 ， 每 一 个 磁道 由 外 向 里 从 0 开始 编号 。 同 一 盘 片 
上 的 每 一 个 磁道 上 都 由 扇 区 组 成 ， 即 磁道 其 实 是 一 圈 扇 区 。 磁 盘 上 的 磁道 数 取决 于 制作 工艺 。 有 的 同学 又 说 了 ， 
离 圆心 近 的 磁道 与 最 外 圈 的 磁道 周 长 肯 定 不 一 致 , 那 这 两 种 磁道 上 的 扇 区 数 一 样 吗 ? 答案 是 : 老 便 盘 是 一 样 的 ， 
新 式 便 盘 中 已 经 改进 了 ， 外 圈 磁 道 会 容纳 更 多 的 扇 区 ， 在 新 硬盘 中 有 个 地 址 转换 器 来 兼容 老人 硬盘 的 扇 区 寻 址 ， 
因此 咱们 依然 可 以 认为 硬盘 中 每 个 磁道 上 的 扇 区 数 一 样 多 。 

磁头 : 就 是 磁头 ， 哈 哈 ， 可 以 粗略 理解 为 磁带 中 的 磁头 。 毕 竟 需 要 某 个 设备 来 读 盘 片上 的 数据 ， 这 个 设 
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和 总: 
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567 





地 ~ 





二 这 TS 
i AT 





江 


备 就 是 磁头 。 一 个 盘 片 分 为 
时 所 说 的 盘面 号 就 是 磁头 号 。 昌 然 单个 盘 片 的 容量 不 断 在 增长 ,但 其 潜力 
， 便 盘 中 必须 由 多 个 盘 片 来 组 成 。 既 然 有 多 个 盘 片 ， 两 个 磁头 就 











上 下 两 个 














HH， 各 而 都 有 






































磁头 编号 由 上 到 下 从 0 开始 。 








这 个 3 


式 。 





ee 


F 行 


柱 面 : 硬盘 是 整个 计算 机 系统 中 很 大 的 
就 是 指 多 个 磁头 同时 
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同 的 盘 夯 











的 编 





到 到 赂 由 福 光 占 到 
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通 心 
成 的 





i 中 编号 位 置 相同 的 磁道 上 ， 




















下 脆 了 ， 如 何 才能 让 硬盘 的 读 写 更 快 ， 
写 入 。 也 就 是 通常 我 们 在 写 一 个 文件 时 ， 是 
































毕竟 是 有 限 日 



























































自然 不 够 用 了 ， 肯 定 要 有 



































v7 
不/ 





有 并行 的 方式 ， 读 写 速度 是 单 盘 的 (磁头 数 ) 倍 。 

















此 柱 责 











的 
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环 ， 并 不 是 








像 


所 有 磁道 号 都 术 
区 : 是 由 多 个 编 
“但 图 


号 相同 的 磁道 (这些 编号 相同 的 同心 圆 


大 小 一 致 ) 从 上 到 下 所 组 成 的 








ij 的 大 小 等 于 盘面 数 〈 磁 头 数 ) 乘 以 每 磁道 





圆柱 体 的 回转 本 


个 碰头， 因此 一 个 盘 片 包括 两 个 磁头 ， 磁 头号 就 表示 盘 
的 。 为 了 实现 大 
盘 片 X2 个 磁 


程 师 们 想到 了 并 行 写 


1 多 个 磁头 同时 写 入 











这 些 
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昌 同 ， 所 以 磁道 号 就 称 为 柱 


用 写 。 

































































圆柱 体 。 分 


区 不 能 跨 柱 盏 











号 连续 的 柱 二 
” 那 种 逻辑 表示 ， 当 然 若 整个 硬盘 只 有 1 个 分 


， 也 前 用 不 能 包含 两 个 分 





起 始 和 终止 都 落 在 完整 的 柱 面 上 ， 


因此 ， 分 区 大 小 等 于 “每 柱 面 上 的 








实际 大 小 不 同 的 原因 


硬盘 


是 79.73MB 。 这 是 了 
16=83607552 字 节 ， 将 其 


如 图 





与 计算 4H 








eg = 











n 个 柱 玫 























介绍 这 些 就 够 用 





[组 成 的 ， 因 上 


UL 





上 的 表现 是 由 某 段 范围 








分 区 在 物理 























区 ， 那 这 个 分 

















是 同一 个 柱 








区 ， 一 个 柱 面 只 























并 不 会 出 现 多 个 分 区 共享 
区 数 ” 乘 以 “ 柱 面 数 ” 这 就 是 我 们 实际 分 











| 











同一 柱 面 的 情况 ， 这 就 是 所 谓 























区 数 。 既 然 一 组 编号 相同 的 磁道 是 柱 本 








不 同 
就 称 为 柱 
1|， 而 且 柱 
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了 ， 现 在 得 





























(1) 硬盘 容量 











> 分 区 大 小 总 
1 一 10 柱 面 是 a 分 
时 公式 。 


会 是 “每 柱 二 











义 ， 





= 单 片 容量 义 磁 头 数 。 


| 上 的 扇 
11 一 23 是 b 分 区 ， 这 两 个 分 


区 数 ” 的 整数 倍 ， 也 就 是 会 以 柱 硬 

















(2) 单 片 容量 = 每 磁道 扇 区 数 久 磁道 数 X512 字 节 。 

















磁道 数 又 等 于 柱 二 


| 数 ， 医 





























硬盘 容量 = 每 磁道 
大 伙 再 回头 看 下 图 13-1 白色 框框 
[ 具 bximage 为 











扇 区 数 X 柱 





























13-5 所 示 。 


图 中 框框 中 的 83607552 便 是 hd80M.img 的 字 节 大 小 ， 
来 的 大 小 相 
一 般 情 况 下 ， 每 磁道 扇 
在 硬盘 容量 已 知 的 情况 下 : 柱 
了 。 比 如 本 例 中 ， 柱 国 
足 ， 如 “162 和 16 
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付 。 



























































”“324 和 8”， 

















数 和 磁头 数 ， 如 果 设 置 得 不 合适 ， 


似乎 





持 4 





568 





很 “稳定 ” 





且 






































个 分 








便 文件 管理 ， 必 须 想 办 法 文 























fdisk 分 














它 是 用 软件 虚拟 的 ， 并 非 物 至 
区 前 它 是 80MB 大 小 ， 如 果 在 
变 成 新 的 尺寸 。 因 此 ， 我 们 下 
按理 说 咱们 应 该 | 
点 分 区 的 基本 知识 ， 这 里 本 着 能 
当初 硬盘 制造 者 认为 ,一 台 机 器 
区 足 侨 。 想 想 也 是 ， 
这 么 做 的 人 也 不 多 (我 同时 装 过 3 个 系统 )。 可 那 时 限于 制造 工艺 ， 硬 盘 容 量 比较 小 ， 用 
硬盘 也 确实 够 用 了 〔 顶 多 几 MB 大 小 的 硬盘 ， 分 成 多 个 分 区 也 意义 不 大 )， 随 着 硬盘 


谁 没事 在 1 

















自 们 配置 好 


换算 成 MB 为 79.734375MB， 约 等 于 79.73MB。 验 订 





i 数 X 磁 头 数 =83607552/63/512=2592.000000， 
“216 和 12”,，“ 
岂 许 您 在 想 ， 介 绍 这 些 干吗 ? 是 这 样 的 ， 我 们 马上 要 使 用 的 fdisk 工 
这 将 改变 虚拟 硬盘 的 大 小 。 所 以 ， 尽 管 hd80M.img 
人 硬盘，fdisk 会 根据 实际 参数 将 其 尺寸 “扩张 >。 在 未 分 














此 将 公式 2 代入 公式 1 后 : 

四 数 X512 字 节 XX 磁头 数 
的 磁盘 参数 ， 柱 面 数 =162， 磁 头 数 =16， 每 磁道 扇 区 数 =63， 总 大 小 
的 硬件 参数 ， 将 它们 代入 公式 3， 硬 盘 容 量 =63 X162 X512X 
E 下 hd80M.img 的 真实 大 小 ， 











[work@localhost bochs]$ 11 hd80M.img 


-rwW-rw-r--。1 work work|836067552 | 5 月 



















































































因此 以 下 的 柱 画 
144 和 18” 等 ， 不 再 列举 。 





























kt， 在 分 











2 07:54 hd80M,img 



































































































































































































































持 更 多 的 分 





区 。 
















































































4 个 分 区 管理 4 








?9 


光 





内 的 所 有 柱 面 组 成 的 
区 就 是 个 所 有 柱 站 
属于 一 个 分 区 ， 分 区 的 
区 粒度 ” 
区 时 ， 键 入 的 大 小 往往 与 
| 向 上 取 整 。 假 如 
区 不 共享 11 号 柱 面 。 


| 组 





A 图 13-5 hd80M.img 字 节 大 小 
区 数 都 是 63， 扇 区 大 小 都 是 512， 柱 面 数 和 磁头 数 取 决 于 实际 配置 的 。 因 此 ， 
再 数 X 磁头 数 = 硬盘 容量 /63/$12， 我 们 只 要 凌 出 合适 的 柱 面 数 和 磁头 数 就 行 


数 和 磁头 数 都 可 以 满 


区 过 程 中 需要 设置 柱 面 
已经 制造 出 来 了 


fdisk 分 区 过 程 中 磁头 数 和 柱 面 数 设置 不 合适 ，hd80M.img 就 会 按照 公式 3 
机 使 用 fdisk 时 ， 最 好 按照 bximage 配置 的 硬件 参数 来 设置 。 
区 了 ， 但 不 知道 大 伙 儿 是 否 对 分 区 都 熟悉 ， 为 了 分 区 过 程 顺利 进行 ， 还 得 介绍 
顺利 完成 fdisk 就 行 ， 下 节 咱 们 再 对 照 实 际 的 分 区 详细 说 明 。 
上 顶 多 安装 4 个 操作 系统 ， 每 个 操作 系统 各 占 1 个 分 区 ， 所 以 硬盘 文 
台电 脑 上 不 断 重启 机 器 只 为 来 回 切换 4 个 操作 系统 呢 ? 即使 现在 


、 


容量 越 来 越 大 ， 为 方 


分 区 是 逻辑 上 划分 磁盘 空间 的 方式 ， 归 根 结 底 是 人 为 地 将 硬盘 上 的 柱 面 扇 区 划分 成 不 同 的 分 组 ， 每 个 








分 组 都 是 单独 的 分 区 。 各 分 区 都 有 “ 描 





MBR 中 有 个 64 字 节 “ 



































Ar 9 


述 符 


的 “描述 符 ” 表 项 大 小 是 16 字 节 ， 因 此 64 














持 4 个 分 区 的 原因 。 也 许 有 同学 会 说 ， 把 分 区 表 改 














持 更 多 的 分 区 了 吗 ? 道理 确 












































固定 大 小 ”的 数据 结构 ， 这 
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字 节 


来 描述 分 























pea 








区 本 身 所 在 硬盘 上 的 起 止 界限 等 信息 ， 在 硬盘 的 
就 是 车 名 的 分 区 表 ， 分 区 表 中 的 每 个 表 项 就 是 一 个 分 区 
的 分 区 表 总 共 可 容纳 4 个 表 项 ， 这 就 是 为 什么 硬盘 仅 文 

















实 是 这 样 ， 但 别 忘 了 ， 





谨 
之 





EE 义 的 大 一 些 ， 只 要 能 够 容纳 更 多 的 表 项 ， 不 就 是 文 















































时 也 必须 要 兼容 现 有 的 这 套 分 区 表 方 案 。 其 
置 限制 的 ， 它 必须 存在 于 MBR 引导 扇 区 或 EBR 引导 扇 






































数 和 引导 程序 ， 然 后 才 是 64 字 节 的 分 区 表 ， 最 后 是 2 字 节 的 魔 数 55aa。 随 着 讨 
真 别 小 看 这 个 扇 区 ， 很 多 程序 已 经 对 它 有 依赖 了 ， 


























512 字 节 中 的 固定 位 置 读 取 关 键 数据 ， 如 果 更 改 了 此 扇 区 中 的 数 : 
































厂商 准备 在 分 区 “描述 符 ” 
为 支持 更 多 的 分 区 ， 专 门 增加 一 种 id 属性 值 (id 为 5)， 用 来 表示 该 分 
因为 只 是 在 分 区 表 项 中 通 


























就 是 逻辑 分 区 。 











动 动手 朋 














实 分 





上 。 在 这 个 6 二 册 









































扩展 分 


[x 








EE 





























区 表 的 长 度 并 不 是 由 结构 本 映 限 制 和 
区 中 。 在 这 512 字 节 中 ， 前 446 字 节 是 硬盘 的 参 
| 算 机 天 长 地 久 的 发 展 ， 还 


bn za 


述 符 ”中 有 个 属性 是 文件 系统 id， 它 
区 可 被 再 次 划分 出 更 多 的 子 分 区 ， 这 
性 来 判断 分 区 类 型 ， 所 以 这 4 个 分 区 中 的 任意 一 个 都 可 以 作为 



































王 何事 物 的 发 展 都 离 不 开 兼容 ， 在 文 持 更 多 的 分 区 的 同 








的 ， 而 是 由 其 所 在 的 位 















































尤其 是 一 些 引 导 型 程序 (如 BIOS)， 都 会 在 该 扇 区 的 


























据 结构 长 度 ， 江 湖 必 然 大 乱 。 为 此 ， 硬 盘 





表示 文件 系统 的 类 型 ， 


















































扩展 分 区 ， 因 此 1 个 扩展 分 区 足够 了 。 六 
分 区 数量 也 变 得 有 限 ， 比 如 ide 硬盘 只 支持 63 个 分 
的 概念 ， 为 了 突破 4 个 分 区 的 限制 才 提 
为 了 支持 任意 数量 的 分 区 , 1 

















发 明 扩 展 分 区 的 目 








的 是 


























。 扩 展 分 区 是 可 选项 ， 有 没有 都 行 ， 但 最 多 只 有 1 个 ，1 个 扩展 分 
FE 意 了 ， 这 里 所 说 的 是 理论 上 支持 无 限 多 的 划分 ， 由 于 硬件 上 的 限制 ， 
区 ，scsi 人 硬盘 只 支持 15 个 分 区 。 硬 盘 本 来 没有 扩展 分 区 


















































B 了 扩 





展 分 


又 ， 为 了 区 别 这 一 概念 ， 将 剩 下 的 























加 














区 在 理论 上 可 被 划分 出 任意 多 的 子 





























3 个 区 称 为 主 分 区 。 

















L 体 划分 出 多 少 分 区 ， 完 全 是 由 用 户 决 定 的， 所 























以 ， 扩 展 分 区 是 种 抽象 、 不 具 实 体 的 分 区 ， 它 类 似 于 一 种 “宣告 ” 告诉 大 家 此 分 区 需要 再 被 划分 出 子 分 






























































区 中 的 第 1 个 逻辑 分 区 
一 不 小 心 就 多 说 了 


























区 , 也 就 是 所 谓 的 逻辑 分 区 ,逻辑 分 
它 属于 扩展 分 区 的 子 集 。 
综 上 所 述 ， 分 区 表 中 共 4 个 分 




















余 的 都 是 主 分 区 。 在 过 























的 纺 
， 我 








号 从 5 开始 。 














区 才 可 以 像 其 他 主 分 区 那样 使 用 。 因此 , 逻辑 分 


































































































区 ， 哪 个 做 扩展 分 区 都 可 以 ， 扩 展 分 区 是 可 选 的 ， 
没有 扩展 分 











区 时 ， 这 4 个 分 区 都 是 主 分 区 ， 为 了 兼容 4 个 3 

















门 开 始 分 区 吧 ， 过 程 如 图 13-6 一 图 13-12 所 示 。 





目前 虚拟 硬盘 
的 分 区 表 为 空 


4 图 13-6 fdisk 过 程 1 





Command (m for help): n 键入 n 创 建 分 区 


Command Cm for help): x ”键入 X 进 入 extra func 


Command action 
b move beginning of data in a partition 
c_change number of cylinders 
d print the row dota in the partition table 
e list extended partitions 
f fix partition order 
g create an IRIX (SGI) partition table 
h __change number of heads 
i change the disk identifier 
m print this menu 
p print the partition table 
q quit without saving changes 
r return to main menu 
s change number of sectors/track 
v verify the partition table 
W write table to disk and exit 


Number of heads (1-256, default 255): 16 


Epert comand (n for help): r OE 

















区 只 存在 于 扩展 分 区 ， 




















但 最 多 只 有 1 个 ,其 
分 区 的 情况 ， 扩 展 分 












































You must set cylinders. 提示 必须 在 extra functions 
You con do this from the extra functions menu. 菜单 中 设置 柱 面 


tions 菜 单 


Expert commond (m for help): m ”键入 m 显 示 子 功能 显示 菜单 


Expert command (m for help): < 键入 C 设 置 柱 面 数 为 162 


Number of cylinders (1-1048576): 162 


Expert comand (m for help): h 键入 h 设 置 磁头 数 为 16 


一 级 菜单 


4 图 13-7 fdisk 过 程 2 


569 





Command (m for help): n 
Command action 

e extended 

p primary partition (1-4) 


Portition nunber (1-4) yr 4 皆 可 ) 
Partition n " (1-4): 1 此 号 ~4 毕 万 
First cyliinder (1-162，defoutt 1); 为 分 区 指定 起 始 柱 面 ,使 用 默 值 


Using default value 1 
Last cylinder，+cytinders or +sizefK,M,G 〈(1-162，defautt 162): 32 


为 分 区 指定 结束 柱 面 号 这 里 设置 32 
Comoand oction 键入 n 创 建 分 区 
pprimary partitio (1-4) 键入 e 创 建 扩展 分 区 
Portition nurber (1-4): 4 指定 扩展 分 区 号 为 4(2~4 皆 可 ) 
st oinden G9-192, defoult 33); 为 分 区 指定 起 始 柱 面 号 ， 使 用 默认 值 
为 分 区 指定 


Last cylinder, +cylinders or +size{K,M,G} (33-162, default 162): 
结束 柱 面 号 ， 


Using default value 162 
使 用 默认 值 ， 


键入 n 创 建 分 区 


Cormand (m for help): n 


Command (m for help): p 键入 P 显 示 目 前 分 
Disk ./hd80M.img: © M8, 0 bytes 

16 heads, 63 sectors/track, 162 cylinders 

Units = cylinders of 1008 * 512 = 516096 bytes 
Sector size (logical/physical): 512 bytes / 512 bytes 
I/0 size (minimm/optimal): 512 bytes / 512 bytes 
Disk identifier; gxfdf67f62 


全 部 为 扩展 分 区 


Device Boot Stort 
hd8OM.imgl 1 
./hd80M. img4 33 


Blocks Id System 
16096+ 83 Linux 
[er 5 Extended 
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Pp 
测 











Comand (m for help): 1 


键入 | 查看 已 知 文件 系统 id 


NEC DOS 81 
Plan 9 82 


Minix / old Lin bf 
Linux swoap / So cl 
Linux c4 


Solaoris 
DRDOS/sec (FAT- 


Empty 
FAT12 


XENIX root 83 


扩展 分 区 ld 为 5 


Command Cm for help): n 
Command action 
1 logical (5 or over) 
p ”primary partition (1-4) 
1 键入 | 创建 逻辑 分 
First cylinder (33-162，defoult 33): 
Using default value 33 
Last cylinder, +cylinders or +size{K,M,G} (33-162, defoult 162): 50 


键入 n 继 续 创建 分 区 


Command (m for help): n 
Command action 
1 logical (5 or over) 
p primary partition (1-4) 
1 
First cylinder (51-162, defoult 51): 


Using default value 51 第 2 个 逻辑 分 区 的 柱 面 


Last cylinder, +cylinders or +size{K,M,G} (51-162, default 162 


键入 P 显 示 分 区 


Disk ./hd86M.img: 0 M8, 0 bytes 

16 heads, 63 sectors/track, 162 cylinders 

Units = cylinders of 1008 * 512 = 516096 bytes 
Sector size (logical/physicol): S12 bytes / 512 bytes 
LI/0 size (minimm/optimal): S12 bytes / S12 bytes 
Disk identifier: Oxfdf67f62 


Command (m for help): p 


过 程 相 同 


Device Boot Start 
./hd80M. imgl 1 
./hd80M. img4 33 
./hd80M. img5 33 
./hd80M. img6 51 
./hd80M. img7 76 
./hd80M. img8 91 
./hd80M. img9 121 


End 
] 
162 
50 
75 


Blocks 
16096+ 
65520 

9040+ 
12568+ 
7528+ 
15888+ 
21136+ 


fdisk 过 程 4 


System 
Linux 
Extended 
Linux 
Linux 
Linux 
Linux 
Linux 





la 
网 











Command (m for help): t 


键入 t 设 置 分 区 id 
Portition number (1-9): 5 


lHex code (type L to list codes): 66 
Chonged system type of partition 5 to 66 (Unknowm) 


把 第 5 个 分 区 id 
(第 1 个 逻辑 分 区 ) 
设置 为 0x66 


把 第 6 个 分 区 id 
(第 2 个 逻辑 分 区 ) 
设置 为 0x66 


(Command (m for help): 

Partition number (1-9): 6 

IHex code (type L to list codes): 66 

Changed system type of partition 6 to 66 (Unknown) 


Command (m for help): t 

Partition number (1-9): 7 

Hex code (type L to list codes): 66 

(Chonged system type of partition 7 to 66 (Unknown) 


Command (m for help): t 
Partition number (1-9): 8 

Hex code (type L to list codes): 66 

Changed system type of partition 8 to 66 (Unknonn) 


第 1 个 逻辑 分 区 的 柱 面 范围 是 33~50 


略 过 3 个 逻辑 分 区 的 创建 ， 


XENIX usr 
FAT16 <32M 
Extended 

FAT16 
HPFS/NTFS 

AIX 

AIX bootable 
0SV2 Boot Manog 
W95 FAT32 
We95 FAT32 
We5 FAT16 
Wo95 Ext'd 
OPUS 
Hidden FAT12 
Compoq diagnost 
Hidden FAT16 <3 
Hidden FAT16 
Hidden HPFS/NTF 
AST SmartSleep 
Hidden m95 FAT3 
Hidden W95 FAT3 
Hidden W95 FAT1 


CLBA) 
CLBA) 
CLBA) 


570 


PartitionMogic 
Venix 80286 
PPC PReP Boot 
SFS 

QNX4 .x 

QNX4.x 2nd part 
QNX4.x 3rd part 
OnTrack DM 
OnTrack DM6 Aux 
[a 

OnTrack DM6 Aux 
OnTrackDM6 
E-Drive 
Golden Bow 
Priam Edisk 
SpeedStor 

GNU HURD or Sys 
Novell Networe 
Novell Networe 
DiskSecure Mult 
PO 

Old Minix 





p 
讨 











84 
85 
86 
87 
88 
8e 
93 
94 
9f 
co 
oa5 
o6 
a7 
08 
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05/2 hidden C: 
Linux extended 
NTFS voLume set 
NTFS voLume set 
Linux plLaintext 
Linux LVM 


IBM Thinkpod hi 
FreeBSD 
OpenBSD 
NeXTSTEP 
Dorwin UFS 
NetBSD 


DRDOS/sec (FAT- 
DRDOS/sec (FAT. 
Syrinx 

Non-FS data 
CPM / CT0S / . 
Dell Utility 
BootIt 

DOS access 

DOS R/O 
SpeedStor 

Be0s fs 

GPT 

EFI (FAT-12/16/ 
LinuoVPA-RISC b 
SpeedStor 
SpeedSstor 


Commond (m for help): t 

[| 

lHex code (type L to list codes): 66 

Changed system type of partition 9 to 66 (Unknown) 


键入 p 打 印 分 区 表 ， 


[Command (m for help): p 


Disk 
16 heods, 63 sectors/track, 162 cylinders 

Units = cylinders of 1008 * 512 = 516096 bytes 

Sector size (logical/physical): S12 bytes / 512 bytes 
/0 size (minimm/optimal): 512 bytes / 512 bytes 
Disk identifier: 0xfdf67f62 


Blocks 


hd8eM.img: 9 Me, 9 bytes 扩展 分 区 中 的 全 部 逻辑 分 区 id 已 经 变 成 0x66 


Darwin boot 

HFS / HFS+ 
BSDI fs 

BSDI swap 
[| 
Solaris boot 


DOS secondary 
VMware VMFS 
VMware VMKCORE 
Linux raid outo 
LANstep 

BBT 


Command (m for help): w 
The partition table has been altered! 


Syncing disks. 
[| 
You must set cylinders. 

You con do this from the extra functions menu. 


查看 分 


Disk hd80M.img: 8 MB, 0 bytes 

16 heads, 63 sectors/track, 0 cylinders 

Units = cylinders of 1008 * 512 = 516096 bytes 
Sector size (logicol/physical): 512 bytes / 512 bytes 


LI/0 size (minimm/optimal): 512 bytes / 512 bytes 
Disk identifier: Oxfdf67f62 


Start Blocks 
16096+ 
65520 

9040+ 
12568+ 

.img7 7528+ 

.img8 15088+ 

.img9 21136+ 


Device Boot 
.imgl 
.img4 
.img5 
.img6 





Pp 
六 | 
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16696+ 
65520 
9640+ 
12568+ 
7528+ 
15088+ 
21136+ 








加 
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键入 w 将 分 区 表 写 入 硬盘 并 退出 fdisk 





fdisk 过 程 6 


按照 这 样 分 





给 出 的 参数 设置 的 ， 如 果 您 


hd80 


13.1 





M.img 的 











好 啦 ， 本 节 到 此 结束 ， 
.3 ”磁盘 分 区 表 浅 析 























分 区 





于 


万 。 





的 纪 











交 








磁盘 分 区 表 (Disk Partition Table) 简称 DPT， 是 


在 上 一 节 我 们 已 经 介绍 了 一 部 分 有 关 分 





应 一 


操作 
通常 
yA 
要 按 
数据 





了 到 
loader 
区 称 为 主 引 





个 分 


个 分 区 ， 主 要 记录 各 分 


分 区 表 是 由 分 区 工具 如 









































情 











况 


操作 系统 。 有 了 分 


























区 的 起 始 扇 
fdisk 创建 的 ， 但 却 是 给 操 
系统 很 “ 弱 ” 其实 操作 系统 也 可 以 创建 分 
下 操作 系统 直接 安装 在 某 个 分 区 上 ， 所 以 分 











照 表 项 中 的 信 | 
结构 一 致 ， 因 此 磁盘 分 
最 初 的 磁盘 分 
时 就 和 大 伙 儿 介绍 
导 户 


























是 硬 ; 


字 节 ， 


置 关 


是 做 


分 的 ， 那 这 些 空闲 的 扇 区 也 必然 是 
绍 分 区 的 时 候 ， 和 大 伙 儿 介绍 了 “分 区 粒度 ” 也 就 是 分 
此 从 定义 上 看 ， 柱 本 
区 占据 了 ， 因 此 MBR 所 在 的 磁道 不 能 划 入 分 区 了 ， 故 
i 是 一 般 为 63 局 


出 的 
由 不 
不 能 
分 区 

















盘 最 开始 








的 扇 区 ， 扇 
(1) 主 引导 记录 MBR。 
(2) 人 磁盘 分 区 表 DPT。 
(3) 























已 访问 磁盘 ， 就 不 会 出 现 分 
区 表 就 是 个 数组 ，| 
区 表 位 于 MBR 3 





区 ， 该 扇 区 位 于 0 盘 0 道 1 局 


区 后 ，hd80M.img 的 大 小 依然 是 83607552 字 节 ， 原 
咸 这 


人 心 /Ns 


分 


趣 ， 可 以 在 




















是 柱 国 














j 数 和 磁头 数 是 按照 bximage 








区 过 程 中 把 这 两 个 参数 改 为 其 他 较 大 值 ， 分 区 结束 后 





尺寸 将 按照 公式 3 变 大 。 
下 节 咱 们 再 细 说 分 





区 


o 


表 








区 的 知识 ,还 从 硬件 上 解 

















释 了 分 区 的 本 质 ， 本 节 在 软件 上 展开 




















区 地 址 ， 大 小 界 


! 
































区 表 ， 它 有 底层 硬件 的 一 切 操作 权限 ， 无 所 不 能 ， 


| 多 个 分 区 元 信 ， 
限 等 。 
系统 使 用 的 。 听 我 这 么 一 说 ， 大 伙 儿 不 要 误 以 为 


日 
只 是 在 


电汇 成 的 表 ， 表 中 每 一 个 表 项 都 对 






































又 表 要 在 内 核 安 装 之 前 建立 好 ， 





分 











因此 通常 独 








区 工 














区 表 ， 操 作 系统 《的 文件 系统 ) 可 以 根据 各 表 项 中 的 信息 对 硬盘 进行 分 区 管理 ， 只 
































区 越界 的 ! 








三 : 





比 数组 长 度 固定 为 4， 数组 元 素 是 分 











青 况 。 分 区 表 既 然 称 为 “ 表 ”， 这 表示 各 个 表 项 的 
区 元 信息 的 结构 。 




















文中 ， 引 








可 周 





们 先 看 看 原 汁 原味 的 MBR 引导 扇 区 的 逻辑 结构 。 早 在 加 载 
过 MBR，MBR (Main Boot Record) 即 主 引导 记录 ， 它 是 一 段 引 导 程 序 ， 其 所 在 的 扇 









































区 (9 





区 . 





勿 理 / 


而 








编号 从 1 开始， 逻辑 扇 区 地 址 LBA 从 0 开始 )， 也 就 














结束 魔 数 SSAA， 表 示 此 扇 


又 大 小 为 512 字 节 ， 这 512 字 节 内 容 由 三 部 分 组 成 。 








区 为 主 引导 扇 区 ， 里 画 





i 包含 控制 程序 。 























MBR 引导 程序 位 于 主 引 导 扇 区 中 偏 移 0 一 0xlBD 的 空间 ， 
及 部 分 指令 (由 BIOS 跳 入 执行 )， 它 是 


























已 





伺 盘 分 区 表 位 于 主 引 
因此 磁盘 分 








可 








届 
区 表 最 大 支持 4 








XX 中 





遍 移 0x1BE~0x1FD 


个 分 区 。 






































中 包括 硬盘 参数 





计 446 字 节 大 小 ， 这 


A 





分 区 工具 产生 的 ， 独 立 于 任何 操作 系统 。 











的 空间 ， 总 共 64 字 节 大 小 ， 每 个 分 区 表 项 是 16 























魔 数 55AA 作为 主 引导 
以 上 这 三 部 分 
在 硬盘 中 ， 最 开始 的 扇 
系 如 图 13-13 所 示 。 
这 个 位 于 引导 
什么 日 


日 




















| 
便 是 MBR 





区 的 














有 效 标 志 ， 位 于 扇 区 偏 





移 0x1FE~~0x1FF， 也 就 是 最 后 2 个 字 节 。 














的 主要 结构 。 


区 是 MBR 引导 


扇 区 后 的 “空闲 的 多 个 
的 ? 一 般 是 多 大 ? 分 区 既然 是 由 分 

















| 








扇 区 ”到 底 
区 工具 划 




















区 ， 接 着 是 空闲 的 多 个 局 


， 随 后 是 具体 的 分 区 。 


区 LBA 地 址 


它们 的 位 





区 
遍 


同 


总 扇 区 





0 1 





主 分 区 及 扩展 分 区 所 在 的 空间 





MBR 引导 扇 区 





空闲 的 多 个 扇 





区 























1 分 区 工具 有 意 空 





< 


。 前 四 
同 盘 再 





介 


在 























上 相同 的 磁道 组 成 的 ， 





= 





13-13 ”硬盘 布局 





全 | 全 




















又 都 要 占用 完整 的 柱 面 ， 柱 面 是 


















































肯定 不 能 跨 磁道 ( 近 而 得 出 结论 ， 同 一 个 磁道 也 























被 多 个 分 
起 始 

















即 63)。 总 之 ， 分 区 1 
| 好 的 。 小 总 结 : 对 于 不 够 一 个 柱 


万 
用 的 
有 能 
如 文 


侣 已 外 各 














1 扇 


文 配 它 。 




















区 共享 )。 而 第 0 块 又 被 MBR 引导 扇 
也 址 要 偏 移 磁盘 1 个 磁道 
高 移 MBR 所 在 














的 大 小 ， 也 高 
的 磁道 后 ， 分 
面 的 剩 














信 \ 

















区 的 起 始 地 址 便 会 是 柱 
的 空间 一 般 不 再 利用 ， 并 不 参与 分 











区 在 后 面 您 就 会 看 到 分 区 起 始 是 0x3F， 
四 的 整数 倍 ， 这 是 由 分 区 工具 规 
区 。 除 去 MBR 引导 扇 区 占 

三 1 


， 但 操作 系统 确实 是 
















































































区 ， 这 部 分 剩余 空间 是 62 个 局 











于 仅仅 是 62 个 局 





区 。 这 个 空间 按理 说 不 属于 操作 系统 的 范围 

















局 























区 的 空间 ， 能 上 




















用 2 此 


理 的 分 





书 














又 范围 




















j 它 做 的 事情 有 限 ， 
件 系统 中 的 块 位 图 大 小 是 与 分 区 大 小 成 正比 的 ， 若 将 块 位 图 存放 在 此 处 ， 
也 将 大 大 缩水 ， 因 此 很 少 有 操作 系统 会 用 到 这 个 磁道 ， 我 们 





大 








为 空间 太 小 会 使 扩展 性 很 差 ， 比 
受到 这 62 个 扇 区 的 限制 ， 


也 不 用 它 。 
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又 也 不 需要 太 多 ， 整 个 硬盘 使 用 1 个 分 
区 被 认为 是 整个 硬盘 最 开始 的 局 


最 初 的 硬盘 容量 小 ， 
环境 是 整个 硬盘 ， 
































此 对 最 初 的 分 区 表 来 说 ，， 
区 ， 这 么 说 吧 ， 站 



















































































的 
Cy 





















































计 分 区 表 的 角度 ， 就 我 这 一 个 分 区 表 ， 我 所 在 的 位 置 就 是 整个 硬盘 最 开始 的 
























































i 您 就 会 了 解 到 我 的 良 苦 用 心 。 
区 显然 不 够 用 了 ， 因 此 发 明了 扩展 分 区 ， 寄 望 以 
“分 区 表 的 长 度 因 
就 该 有 多 少 表 项 ， 可 是 人 
定 长 度 为 4 个 分 区 的 分 区 表 ， 又 要 突破 
美的 方案 是 视 这 个 扩展 分 区 为 


扇 区 ” 注意 ， 此 “观念 ”是 我 杜撰 的 ， 为 的 是 
随 着 磁盘 容 
此 来 解决 原来 所 支持 的 分 
理 来 说 ， 扩 
发 展 都 要 把 
数 的 限制 ， 这 似乎 有 点 为 难 ， 该 怎 相 













































































区 数 太 少 的 问题 。 大 伙 儿 知道 ， 
区 中 包含 多 少 个 逻辑 分 区 ， 扩 
当成 头等 大 事 ， 它 既 要 莱 
设计 扩展 分 区 的 分 



















































































区 表 呢 ? 一 个 两 全 
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。 按 
E 何 时 候 新 事物 的 
固定 分 区 











总 扩展 分 区 ， 将 它 划 分 成 多 个 子 扩展 分 区 ， 每 个 子 扩 





























又 “在 逻辑 上 ”相当 于 硬盘 ， 












































为 4， 但 是 允许 有 无 限 多 个 分 区 表 ， 分 区 
| 一 起 呢 ? 扩展 分 区 表 采 


总 
区 都 可 以 有 1 个 分 区 表 。 这 样 一 来 ， 各 个 分 区 表 的 长 度 依然 
表 项 多 了 ， 自然 支持 的 分 区 数 就 多 了 。 如 何 将 这 些 分 区 表 组 织 
有 


























] 链 式 结构 ， 将 所 














展 分 





























的 单 向 链表 。 链 表 是 要 有 结 点 的 ， 这 上 


的 每 个 














了 子 扩展 分 区 的 分 区 表 昌 成 可 容纳 无 限 个 分 















































分 区 表 就 是 结 点 , 一 般 的 链表 结 点 除了 包 
种 结构 , 其 表 : 


括 数据 外 ， 还 必须 要 包括 下 一 个 结 点 的 
部 分 是 描述 逻辑 分 区 的 信息 , 男 















































了 这 
h 址 oo 

















下 面 1 











] 顺 着 这 个 思路 分 析 。 扩 展 分 区 之 下 是 子 扩展 分 区 ， 那 这 里 所 说 的 逻辑 分 区 在 哪里 ? 















































边界 、 类 型 等 信息 ， 因 此 在 子 扩 











日 


要 想 使 用 























用 它 ， 也 需要 有 元 信息 来 描述 它 的 








于 分 区 表 , 逻辑 分 区 也 是 分 









































又 表 来 描述 这 些 逻 辑 分 区 。 分 区 表 本 身 也 要 在 子 扩 









































始 的 扇 区 《〈 剧 透 一 下 ，] 
























































此 扇 区 中 的 内 容 也 是 前 446 字 节 是 引导 条 
区 的 结构 相同 。 紧 随 其 后 的 是 空闲 的 








它 同 MBR 引导 扇 

























































































区 表 ， 
区 表 ， 后 2 字 节 是 0x55 和 0xAA， 您 看 ， 
扇 区 ， 其 余 剩 下 的 大 部 分 扇 区 才 被 用 作 存 储 































































































































































































































































































































































































































































































































































































































































































数据 的 分 区 , 民 区 ,一 会 咱们 跟踪 分 白 了 。 

为 什么 子 扩展 分 区 是 这 样 的 结构 呢 ? 也 到 我 之 前 杜撰 的 “观念 ”了 。 兼容 
性 考虑 ， 这 种 “观念 ”依然 被 传承 下 来 : 扩展 分 区 被 划分 出 多 个 子 扩展 分 区 ， 每 个 子 扩展 分 的 分 
区 表 ， 所 以 子 扩展 分 区 在 逻辑 上 相当 于 单独 的 硬盘 ， 各 分 区 表 在 各 个 子 扩展 分 区 同 
MBR 引导 扇 于 是 经 扩展 分 区 划 在 想 
想 看 ， 主 分 主 ”， 也许 是 与 其 分 区 表 项 位 于 MBR 引导 扇 区 中 有 关 吧 。) ，EBR 
理论 上 有 无 限 个 MBR 和 EBR 所 在 的 扇 区 统称 为 引导 扇 区 ， 它 们 的 结构 是 相同 的 ，MBR 中 有 的 EMR 中 
也 有 。 我 想 这 下 您 清楚 了 我 为 什么 要 把 子 扩展 分 区 视 为 硬盘 ， 区 的 结构 也 同 整个 硬盘 结构 一 
样 ， 最 开始 的 康 间 都 是 空闲 一 小 部 分 局 的 大 片 扇 区 空间 作为 数据 存储 的 分 区 。 

现在 大 伙 儿 知道 了 ， 由 于 扩展 分 区 采用 了 链 式 分 区 表 ， 理 ] 区 表 ， 文 持 无 限 个 逻 
辑 分 区 。 每 一 个 逻辑 分 的 子 扩 展 分 区 都 有 一 个 与 MBR 结构 相同 的 EBR, EBR 中 分 区 表 的 第 一 分 区 
表 项 用 来 描述 所 包含 的 逻辑 分 区 的 元 信息 ， 第 二 分 、 四 表 
项 未 用 到 。 位 了 相当 于 链表 中 的 结 点 ， 第 一 个 分 区 表 项 存 的 是 分 区 数据 ， 第 二 个 分 区 表 
项 存 的 是 后 继 分 区 的 指针 。 

值 和 区 表 项 都 是 指向 一 个 分 区 的 起 始 , 起 始 地 址 都 是 个 扇 二 人 分 
区 表 项 指向 的 是 该 逻辑 分 区 最 开始 的 扇 区 ， 此 扇 区 称 为 操作 系统 引导 三 个 分 
区 表 项 指向 

这 里 可 别 搞 混 了 ，OBR 引 区 不 是 EBR 引导 扇 E 的 范围 。 
而 OBR 引 ， 第 0 

中 有 介绍 过 OBR、DBR、EBR 站 忘记 的 同学 可 以 先 看 看 。 将 来 设计 文 从 比肩 区 。 
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0 
也 许 您 觉得 


构 了 ， 请 大 伙 儿 见 表 13-1。 


的 分 区 表 项 是 如 何 存 储 这 两 种 类 型 分 区 数据 的 , 是 时 候 介绍 分 区 表 项 的 结 














描 ” 述 





执行 加 载 执行 


标记 有 两 种 取 值 ，0x80 和 0。 




















0x80 表示 活动 分 区 ， 也 就 是 此 分 区 的 引导 扇 区 中 包含 引导 程序 ， 可 引导 。 只 要 是 可 
































的 程序 都 可 作为 引导 程序 ， 不 要 误 以 为 引导 程序 一 定 得 是 内 核 提供 的 














0 ! 程序 ， 尽 管 通 





























其 他 值 非法 


常情 况 下 都 是 内 核 加 载 器 。 





0 表示 非 活动 分 区 ， 不 可 引导 。 





分 区 起 始 磁头 











分 区 起 始 扇 区 


二 


号 











分 区 起 始 柱 面 


号 





文件 系统 类 型 


ID， 如 0 表示 不 可 识别 的 文件 系统 ，1 表示 FAT32 





分 区 结束 磁头 


号 























oo | 和 和 wm 上 DiP| 一 











四 
x 























和 | de | -| 
六 | 
xX | 区 | x 
玄 
刘 
本 
Xx 








— 
MD 


分 区 容量 扇 区 











为 了 介绍 清楚 活动 分 区 的 意义 ， 还 得 把 有 关 





ANS 




















的 内 容 还 是 以 第 0 章 的 答疑 为 主 。 





活动 分 区 是 指引 导 程 序 所 在 的 分 区 ， 活 动 分 
] 通 过 此 位 来 判断 该 分 区 的 引导 扇 区 中 是 否 有 可 执行 的 程序 ， 也 就 是 引导 程序 ， 这 个 引导 程序 通常 


的 ， 它 1 


是 操作 系统 内 核 力 
MBR 发 








MBR、EBR 和 OBR 的 内 容 再 说 说 ， 不 过 有 关 它 们 更 详 








区 标记 是 给 MBR 或 其 他 需要 移交 CPU 使 用 权 的 程序 看 




























































































分 区 工 












































其 加 载 器 ， 此 时 操作 系统 便 掌 握 了 CPU 使 用 权 ， 























导 届 区?” 
加 载 器 ， 


引导 扇 区 并 不 是 EBR 或 MBR 引导 扇 区 ， 它 们 虽 


























中 载 器 ， 故 此 引导 程序 通常 被 称 为 操作 系统 引导 记录 ， 即 OBR (OS Boot Record)。 如 果 
纲 该 分 区 表 项 的 活动 分 区 标记 为 0x80， 这 就 表示 该 分 区 的 引导 扇 区 中 有 引导 程序 (这 是 MBR 与 
或 操作 系统 约定 好 的 )，MBR 就 将 CPU 使 用 权 交 给 此 引导 程序 ， 如 果 此 引导 程序 是 操作 系统 或 
















































































也 就 是 大 家 平时 所 说 的 加 载 内 核 。 这 里 一 直 说 的 “分 区 引 























是 位 于 分 区 最 开始 的 扇 区 ， 是 分 区 引导 程序 所 在 的 扇 区 ， 由 于 此 引导 程序 通常 都 是 操作 系统 内 核 





























故此 扇 区 被 称 为 操作 系统 引导 扇 区 ， 也 就 是 OBR 所 在 的 扇 区 ， 即 OBR 引导 扇 区 。 注 意 啦 ，OBR 



































然 都 包含 引导 程序 ， 并 且 都 以 0x55 和 0xaa 结束 ， 但 它们 

















最 大 的 区 别 是 分 区 表 只 包含 在 MBR 和 EBR 中 ，OBR 中 可 没有 分 区 表 。MBR 和 EBR 所 在 的 扇 区 不 属于 分 







































































区 范围 之 内 ， 它 们 是 由 分 区 工具 创建 并 管理 的 ， 因 此 不 归 操 作 系统 管理 ， 操 作 系统 不 可 以 随意 往 里 面 写 数 



































据 ， 尽管 操作 系统 有 能 力 这 样 做 。 而 OBR 引导 扇 区 是 分 区 中 最 开始 的 扇 区 ， 归 操作 系统 的 文件 系统 管理 ， 





































































































因此 操作 系统 通常 往 OBR 引导 扇 区 中 添加 内 核 加 载 器 的 代码 ， 供 MBR 调用 以 实现 操作 系统 自 举 ， 总 


之 OBR 


文件 系统 类 型 是 指 NTFS、FAT32 

















引导 扇 区 中 绝对 不 包括 分 区 表 。 





























咱们 重点 关注 “分 区 起 始 偏 移 户 区 ”和 











这 是 





























“分 


数 , 各 分 区 的 绝对 肩 区 LBA 地 址 =“ 基 准 ”的 绝对 扇 区 起 始 LBA 地 址 + 各 分 区 的 起 始 偏 移 扇 区 , 这 个 “ 基 
准 ”是 指 分 区 所 依赖 的 上 层 对 象 ， 或 者 说 是 创建 该 分 区 的 父 对 象 。 我 知道 这 么 还 是 说 太 抽象 了 ， 有 必要 
再 深入 讨论 。 





























、EXT2 等 ， 我 们 在 fdisk 过 程 中 用 1 命令 列 出 的 便 是 。 














“分 区 容量 扇 区 数 ”。 




















区 起 始 偏 移 扇 区 ”是 个 相对 量 ， 它 表示 















































各 分 区 的 起 始 扇 区 地 址 是 相对 于 某 “ 基 准 ” 的 侦 移 扇 区 





















































先 书 
成 EBR 


对 了 


始 地 址 ， 















































引导 扇 区 、 空 闲 扇 区 和 逻辑 分 区 三 部 分 。 











生理 下 分 区 层次 关系 ,前面 已 述 ， 总 扩展 分 区 被 直接 拆 分 成 多 个 子 扩展 分 区 ， 子 扩展 分 区 又 被 拆 分 





























“基准 ”也 因 分 区 类 型 而 异 。 












































逻辑 分 区 而 言 ， 逻辑 分 区 是 在 子 扩展 分 区 中 拆 分 出 来 的 ， 其 具体 地 址 依赖 于 子 扩展 分 区 自身 的 起 



































因此 逻辑 分 区 的 基准 是 子 扩展 分 区 的 起 




















对 了 


子 扩展 分 区 而 言 , 子 扩展 分 区 是 在 总 扩 





始 扇 区 LBA 地 址 。 
展 分 区 中 拆 分 出 来 的 





























其 具体 地 址 依赖 于 总 扩展 分 区 自身 
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的 起 始 地 址 ， 因 此 子 扩展 分 区 的 基准 是 总 扩展 分 区 的 起 始 扇 区 LBA 地 址 。 

对 于 主 分 区 或 总 扩展 分 区 而 言 ， 这 两 类 分 区 本 身 是 独立 、 无 依赖 的 分 区 ， 因 此 基准 为 0。 此 概念 咱们 
在 实践 中 去 理解 。 

“分 区 容量 扇 区 数 ” 意 义 比 较 明 确 ， 就 是 表示 分 区 的 容量 扇 区 数 。 

以 上 两 项 用 来 确定 一 个 分 区 的 位 置 和 大 小 。 

以 上 介绍 的 内 容 不 多 , 不 知 您 是 不 是 感觉 有 点 尝 ? 觉得 有 些 概念 如 逻辑 分 区 、 扩 展 分 区 可 能 和 您 平时 
理解 的 不 一 样 ? 说 实话 ， 如 果 您 觉得 费解 的 话 ， 我 还 是 觉得 有 些 欣 慰 的 ， 如 果 这 些 概念 真 像 我 们 平时 所 想 
象 的 那样 , 我 还 真 不 值得 花 这 份 心思 写 这 一 节 。 虽 然 分 区 表 不 难 理解 , 但 把 它 的 结构 说 清楚 还 真 的 不 容易 ， 
主要 是 小 弟 我 实在 是 才 疏 学 浅 ， 有 一 些 内 容 我 没有 找到 对 应 的 术语 ， 不 知 该 怎样 去 表达 它们 ， 甚 至 我 自 创 
了 一 些 “ 观 念 ” 来 帮助 表达 ， 仅 这 一 小 节 我 都 用 了 3 天 时 间 还 没 写 完 。 个 人 觉得 ， 如 果 不 亲 自 跟 一 下 分 区 
表 的 话 还 是 会 觉得 云 里 筋 里 ,还 是 在 实践 中 理解 吧 ， 咱 们 跟 一 下 在 上 节 中 创建 的 分 区 表 ， 通过 逐 字 节 地 分 
析 ，, 我 想 大 伙 儿 一 定 会 弄 清楚 的 。 要 以 字 节 方式 查看 文件 内 容 ， 咀 们 要 借助 xxd.sh 脚本 了 ， 大 家 对 它 应 该 
很 熟悉 了 ， 它 只 是 xxd 命令 的 封装 ， 脚 本 用 法 是 : 

xxd.sh 待 查 看 的 文件 起 始 字 节 偏 移 查 看 的 字 节 数 

先 查 看 主 引导 扇 区 ， 也 就 是 硬盘 最 开始 的 扇 区 ， 如 图 13-14 所 示 。 

您 看 ， 地 址 0~0xlb0 之 间 的 数字 全 是 0，xxd 已 经 在 区 TI ZYTTTTTRTTTEY 

0000000: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 
输出 中 将 其 省 略 了 ， 在 偏 移 0xlbe 的 地 方才 是 分 区 表 ， 一 



















































































































































































































































































































































































































































































































































































:0%0%0%0%0%0%0%9%62FFP99%00 ,... 



































直到 0xlfd， 一 共 是 64 字 节 ， 最 后 才 是 魔 数 S$ AA。 在 分 : 01 00 83 OF 3F 1F 3F 00 00 00 C1 7D 00 00 00 0%0 
， Wn oe a :WWNWNWWMWNWWMWNMMMNW NW 
区 表 中 只 创建 了 2 个 分 区 ， 还 记得 吗 ? 第 1 分 区 咱们 用 来 : 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 











: 01 20 05 OF 3F A1 00 7E 00 00 EQ FF 01 00 55 AA ，,， 


创建 主 分 区 ， 第 4 分 区 用 来 创建 扩展 分 区 ， 第 2 一 3 分 区 咱 ” 哇 59 

们 没 占 用 ， 因 此 是 一 系列 的 0 值 。 第 1 分 区 和 第 4 分 区 的 4 图 13-14 主 引 导 扇 区 
元 信息 已 经 按照 分 区 表 项 结构 给 大 伙 儿 标 出 来 了 , 咱们 关注 的 重点 信息 是 分 区 类 型 ,分 区 起 始 偏 移 扇 区 ( 简 
称 偏 移 扇 区 )〉 和 分 区 容量 扇 区 数 〈 人 简称 扇 区 数 )， 将 它们 汇总 在 表 13-2 中 。 
























































































































































表 13-2 主 引导 扇 区 中 分 区 表 部 分 元 信息 
分 区 分 区 类 型 偏 移 扇 区 扇 区 数 
主 分 区 hd80M.img1 0x83 0x0000003F 0x00007DC1 
总 扩展 分 区 
要 分 区 Ox05 0x00007E00 0x0001FFE0 
hd80M.img4 




















第 1 分 区 是 主 分 区 hd80M.imgl1， 其 类 型 是 0x83， 属 于 Linux 文件 系统 类 型 ， 偏 移 鹿 区 是 0x3f， 扇 区 数 

是 0x7dcl。 第 4 分 区 是 总 扩展 分 区 hd80M.img4， 其 类 型 是 0x05， 这 说 明 它 确实 是 扩展 分 区 ， 偏 移 扇 区 是 
a gn 

0x7e00， 扇 区 数 是 0xlffe0。 这 两 个 分 区 在 硬盘 中 的 布局 如 

图 13-15 所 示 。 即 83607552 字 节 ，80MB 


图 13-15 中 的 分 区 属于 同一 个 分 区 表 ， 位 于 横向 实 线 





























































































主 分 区 

















箭头 上 的 是 主 分 区 ， 箭 头 下 的 是 扩展 分 区 。 约 定 下 ， 在 后 | 拘 ，hd80Mimg1 
面 的 分 区 布局 图 中 ,我 们 把 隶属 于 同一 个 分 区 表 的 分 区 用 0x3F | 0x7DC1 



































































































































横向 虚线 箭头 框 出 来 ， 只 要 在 两 个 横向 虚线 间 的 分 区 就 是 总 扩展 分 区 
同一 个 分 区 表 。 ee "和 区 数 
这 里 涉及 到 了 偏 移 扇 区 的 “基准 ” 主 分 区 和 总 扩展 | 《和 00 Es 
分 区 的 起 始 扇 区 是 以 0 为 基准 的 ， 比 如 主 分 区 偏 移 肩 区 是 『“”” 一 ri 
0x3f， 该 分 区 的 绝对 肩 区 LBA 地 址 也 是 0x3f， 扩 展 分 区 的 ee 
偏 移 肩 区 0x7e00 也 是 如 此 。 以 上 是 特 指 主 分 区 和 扩展 分 区 的 情况 ， 到 了 风 辑 分 区 就 不 一 样 了 ， 碰 到 时 再 说 。 









































MBR 引导 局 区 中 的 分 区 表 查 看 完了 ， 下 面 查看 扩展 分 区 的 分 区 表 。 扩 展 分 区 中 的 所 有 分 区 表 被 组 织 成 
单 向 链表 ， 咱 们 查看 链表 中 的 第 1 个 结 点 ， 也 就 是 第 1 个 子 扩展 分 区 的 EBR 引导 扇 区 ， 为 方便 起 见 ， 暂 且 
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尔 之 类 的 四 《 公 后 卓 
称 之 为 EBRI 人 名 和 展 分 区 的 起 始 扇 区 地 址 是 0x7e00， [work@localhost ~]$ sh ~/tool/calculator.sh "0x00007E00*512' x 
将 其 乘 以 512 换算 为 字 节 ， 如 图 13-16 所 示 。 fo 
该 分 区 表 : 有 两 个 分 区 表 项 ， 第 1 个 表 项 在 此 肩 区 Ce bochs]$ sh ~/tool/xxd 
中 偏 移 范 围 是 0xlbe~0x1lcd, 它 是 逻辑 分 区 hd80M.img5 
的 元 信息 ， 第 2 个 表 项 在 此 扇 区 中 偏 移 范围 是 0xlce 一 
0xldd， 这 是 下 一 个 扩展 分 区 的 扇 区 LBA 地 址 。 这 下 
















































































in 














































































































实 实在 在 地 让 您 看 到 了 ， 子 扩展 分 区 中 的 分 区 表 结 构 4 图 13-16 FEBRI1 
是 典型 的 单 向 链表 结 点 ,将 部 分 信息 汇总 到 表 13-3 中 。 
表 13-3 第 1 个 子 扩展 分 区 表 部 分 信息 
分 区 编号 分 区 类 型 偏 移 扇 区 扇 区 数 
闭 名 分 区 0x66 0x0000003F 0x000046A1 
hd80M.img5 
下 一 个 子 扩展 分 区 Ox05 0x000046E0 0x00006270 


























子 扩展 分 区 是 在 总 扩展 分 区 中 创建 的 ， 子 扩展 分 区 的 偏 移 扇 区 理应 以 总 扩展 分 区 的 绝对 扇 区 LBA 地 址 
为 基准 ， 因 此 ,“ 子 扩展 分 区 的 绝对 扇 区 LBA 地 址 = 总 扩展 分 区 绝对 扇 区 LBA 地 址 + 子 扩展 分 区 的 偏 移 肩 区 ”。 
逻辑 分 区 是 在 子 扩展 分 区 中 创建 的 ， 逻 辑 分 区 的 偏 移 局 区 理应 以 子 扩展 分 区 的 绝对 遍 区 LBA 地 址 为 
基准 ， 因 此 ,“ 逻 辑 分 区 的 绝对 扇 区 LBA 地 址 = 子 扩展 分 区 绝对 扇 区 LBA 地 址 + 逻辑 分 区 偏 移 肩 区 ” 这 里 
的 子 扩展 分 区 就 是 当前 子 扩展 分 区 。 




































































































































































硬盘 扇 区 数 0x27DEO 









































































































































































































































































表 13-3 中 ， 逮 辑 分 区 hd80M.img5 的 分 区 类 型 83607552 字 节 , 80MB 网 

是 0x66, 这 是 咱们 在 fdisk 中 设置 的 , 其 偏 移 是 0x3f， 

这 是 指 在 当前 子 扩展 分 区 中 的 偏 移 肩 区 数 ， 当 前 子 | 信 黎 ha 车 从,o1 

扩展 分 区 地 址 是 由 前 躯 结 点 〈 分 区 表 ) 中 的 “下 一 个 子 。 | 局 区 数 。 扇 区 数 

扩展 分 区 的 位 移 扁 区 “+” 总 扩展 分 区 绝对 扇 区 LBA 地 

址 ” 但 由 于 前 躯 结 点 是 总 扩展 分 区 ， 因 此 hd80Mimg5 总 扩展 扇 区 总 扩展 分 区 

的 绝对 扇 区 地 址 是 0x7e00+0x3f-Ox7e3f。 Mon rg ee 
到 目前 为 止 ， 分 区 布局 如 图 13-17 所 示 。 -E00 eIFE0_____ > 
如 前 约定 ， 两 个 横向 虚线 箭头 间 的 分 区 属于 同 

一 个 分 区 表 ， 图 13-17 中 上 面 那 对 虚线 间 的 分 区 是 上 i 过 辑 分 区 

次 介绍 过 的 分 区 ,咱们 以 增 量 方式 绘制 分 区 布局 , 每 区 数 “” 房 区 数 

次 新 增 的 分 区 放 在 最 下 面 。 从 这 张 图 中 可 以 清晰 看 Psd 

出 ， 逻 辑 分 区 是 在 上 一 个 分 区 表 中 的 子 扩展 分 区 中 。 下 一 个 子 扩展 分 区 | 下 -个 
当前 结 点 中 的 “下 一 个 子 扩展 分 区 ”是 下 一 个 逻 在 站 要 各 公 中 ee | 

辑 分 区 所 在 的 子 扩展 分 区 , 其 偏 移 扇 区 是 0x000046E0， -- -0x46E0 _ - > < 0x6270 

因此 其 绝对 扇 区 地 址 要 加 上 总 扩展 分 区 扇 区 地 址 ， ,图 13-17 分 区 布局 2 






































即 0x7e00+0x46E0= 0xC4E0。 将 其 转换 成 字 节 后 继续 查看 该 扇 区 ， 如 图 13-18 所 示 。 

















[work@localhost ~]$ sh ~/tool/calculator.sh '(Ox00007E00+0x000046E0)*512' x 
189c000 

[work@localhost ~]$ 

[work@localhost bochs]$ sh ~/t 








4 图 13-18 EBR2 
同 前 面 一 样 ， 第 1 个 表 项 是 逻辑 分 多， 第 2 个 表 项 是 扩展 分 区 ， 重 点 信息 汇总 到 表 13-4 中 。 
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表 13-4 第 2 个 子 扩展 分 区 表 部 分 信息 
分 区 编号 区 类 型 偏 移 扇 区 扇 区 数 
逻辑 分 区 hd80M.img6 0x66 0x0000003F 0x00006231 
下 一 个 子 扩展 分 区 Ox05 Ox0000A950 0x00003B10 
最 新 分 区 布局 如 图 13-19 所 示 。 
硬盘 扇 区 教 0x27DEO 
即 83607552 字 ，80MB 
人 a 
主 分 区 
偏 移 hd80M.img1 
扇 区 数 。 扇 区 数 
0x3F 0x7DC1 
总 扩展 扇 区 总 扩展 分 区 
hd80M.img4 hd80M.img4 
偏 移 扇 区 数 扇 区 数 
0 | 0x1FFE0 ___________- 二 
逻辑 分 区 
偏 移 ooom. img5 
na 
Xx Ox46A1 
一 个 子 扩展 分 区 
在 扩展 分 区 中 一 个 子 扩展 
偏 移 房 区 数 分 区 扇 区 数 
___0x46E0 __ ee__ 0x6270 __ 
逻辑 分 区 
移 hd80M.img6 
扇 区 数 
0x6231 
一 个 子 扩展 分 区 下 一 个 
在 总 扩展 分 区 中 子 扩展 分 区 
偏 移 扇 区 数 扇 区 数 
0xA950 0x3B10 
二 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 -和 | 一 一 一 一 -和 
A 图 13-19 分 区 布局 3 
13-4 中 让 ee 人 0x0000A950， 为 了 定位 该 分 区 ， 依 然 重复 之 前 的 过 程 ， 将 其 














[work@localhost ~]$ sh ~/tool/calculator.sh '(Ox00007E00+0x0000A950)*512' x 
24ea000 

[work@localhost ~]$ 

[work@localhost bochs]$ sh ~/tool/xxd. 

24ea000: 


00 00 00 00 00 00 00 00 00 
* 

24ealb0: 

24ealcg9: 

24ea1d0: 

24eale0: 








13-20 EBR3 




















提取 重点 信息 到 对 



























































表 13-5 第 3 个 子 扩展 分 区 表 部 分 信息 
分 区 编号 分 区 类 型 偏 移 扇 区 扇 区 数 
逻辑 分 区 hd80M.img7 0x66 0x0000003F 0x00003ADI1 
下 一 个 子 扩展 分 区 0x05 Ox0000E460 0x00007620 
分 区 布局 图 不 再 单独 列 出 了 ， 等 剩 下 的 几 个 分 区 表 都 查看 完 再 列 个 分 区 布局 汇总 图 。 图 13-21 所 示 是 
EBR4 引导 扇 区 ， 计 算 过 程 您 懂 的 。 重 点 信息 见 表 13-6。 














576 








13.1 硬盘 及 分 区 表 
表 13-6 第 4 个子 扩展 分 区 表 部 分 信息 
分 区 编号 分 区 类 型 偏 移 扇 区 扇 区 数 
逻辑 分 区 hd80M.img8 0x66 0x0000003F 0x000075E1 
下 一 个 子 扩展 分 区 Ox05 Ox00015A80 0x0000A560 











13-22 所 示 是 EBR5 所 在 扇 区 。 


[work@localhost ~]$ sh ~/tooL/coLcuLator .sh '(Ox00007E00+0x0000E460)*512' x 




































































[work@localhost ~]$ sh ~/tool/calculator .sh '(Ox00007E00+0x00015A80)*512' x 
































































2c4c000 3b10000 
[work@localhost ~]$ [work@localhost ~]$ 
.Sh hd sh hd80M.img 
00 00 00 00 00 
00 00 00 00 00 
21 A5 00 00 
00 00 00 00 
00 00 00 00 
00 00 00 00 
A 图 13-21 EBR4 A 图 13-22 EBR5 
EBR5 中 只 有 一 个 逻辑 分 区 ， 因 此 分 区 结束 。 重 点 信息 见 表 13-7。 
表 13-7 第 5 个 子 扩展 分 区 表 部 分 信息 
分 区 编号 分 区 类 型 偏 移 扇 区 扇 区 数 
逻辑 分 区 hd80M.img9 0x66 0x0000003F Ox0000A521 
13-23 是 硬盘 hd80M.img 所 有 分 区 布局 图 。 
硬盘 硬盘 
人 
起 始 硬盘 扇 区 数 0x27DE0 Ee 
扇 区 即 83607552 字 节 ，80MB 山区 
人 BE 
上 
MBR Ox3F | 0x7DC1 
分 区 表 总 扩展 扇 区 总 扩展 分 区 
hd80M.img4 全 人 全 
本 RE 
逻辑 分 区 
偏 移 hd80M.img5 
房 区 数 。 肩 区 数 
EBRI1 0x3F | 0x46A1 
分 区 表 下 一 个 子 扩展 分 区 
在 总 扩展 分 区 中 下 一 个 子 扩展 分 区 
偏 移 扇 区 数 扇 区 数 
NN NE 0x6270 __ 
hd80M.img6 
EBR2 dx 
区 A x 
分 区 胡 yA TE 
a 全 AAS 0x3B10 
逻辑 分 区 
hd80M.img7 
EBR3 AD 
分 区 表 下 一 个 子 扩展 分 区 
在 总 扩展 分 区 中 下 一 个 子 扩展 分 区 
偏 移 扇 区 数 扇 区 数 
上 MEAB0 RS 2 | os20 
逻辑 分 区 
偏 移 “hd80M.img8 
EBR4 Oe 
分 区 表 和 下 一 个 子 扩展 分 区 
偏 移 扇 区 数 扇 区 数 
a SRB | 
EBR25 a 
hd80M.img9 
xX 房 区 房 区 
人 区 家 和 区 
和 图 13-23 ”分 区 布局 汇总 
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本 贡 终 于 结束 了 ， 兄 弟 们 也 辛苦 了 ， 有 
































们 开始 写 硬盘 驱动 。 





里 论 知 识 也 就 到 此 为 止 ， 下 节 趴 























区 编写 硬盘 驱动 程序 


本 
数 ， 


口 的 封装 ， 它 和 


根据 需要 





什么 是 驱动 程序 ? 问 了 下 度 娘 ， 
“操作 系统 和 硬件 之 间 的 桥梁 ” 这 话 对 是 对 ， 
F 是 独立 的 个 体 ， 它 提供 一 
们 习惯 的 高 级 语言 来 说 ， 这 些 接 





大 伙 儿 知道 ， 硬 伯 
简陋 、 最 繁琐 的 ， 相 









































用 说 驱动 程序 是 让 计算 机 和 硬件 通信 的 特殊 程序 ， 是 “硬件 的 灵 3 
晶 对 于 初学 者 来 说 总 感觉 和 没 说 一 样 , 还 是 没 懂 驱 动 程序 是 什么 。 
套 方法 作为 操 





99 
AN 


























屿 | 


作 接口 给 外 界 调用 ， 但 此 接口 往往 是 最 原始 、 最 























el 






































使 用 起 来 非常 肪 烦 ， 很 多 指令 要 提前 设置 好 各 种 参 




















基本 上 都 是 要 用 汇编 语言 来 操作 寄存 器 。 基 
巴 参数 设置 等 重复 、 枯燥 、 复杂 的 过 程 





























也 可 以 提供 相关 的 策略 ， 如 缓存 等 ， 让 硬 人 








因此 没有 驱动 程序 的 话 ， 操 作 系 统 也 是 可 以 同 硬 
己 做 饭 吃 ， 要 经 过 买 菜 、 洗 菜 、 切 妆 、 炒 菜 的 过 程 ， 有 
去 饭店 吃 吧 ， 直 接 吃 就 行 了 ， 免 去 了 买 沫 、 砍 价 、 配 菜 、 


























此 











苗 述 ， 对 于 驱动 程序 我 个 人 的 理解 是 驱动 程序 是 对 硬件 接 
| 装 成 一 个 过 程 , 避免 每 次 执行 命令 时 都 重复 做 这 些 工作 ， 























操作 更 加 容易 、 省 事 、 方 便 , 无 需 再 显 式 做 一 些 底层 设置 。 












































位 
















































































i 的， 无 非 是 直接 操作 IO 端口 。 举 个 例子 ， 平 时 咱们 自 
人 嫌 这 太 麻 烦 了 吃饭 用 5 分 钟 要 做 1 小 时 )， 干 脆 就 
就 饪 的 过 程 ， 饭 店 起 的 作用 就 类 似 于 驱动 程序 。 

























































































































































































































































































































































































































































































































































































































































































13.2.1 硬盘 初始 化 

硬件 是 实 实在 在 的 东西 ， 要 想 在 软件 中 管理 它们 ， 只 能 从 人 逻辑 上 抓 住 这 些 硬件 的 特性 ， 将 它们 抽象 成 一 些 数 
据 结 构 ， 然 后 这 些 数 据 结构 便 代表 了 人 硬件， 用 这 些 数 据 结 构 来 组 织 硬件 的 信息 及 状态 ,在 逻辑 上 硬件 就 是 这 数据 
结构 。 硬 盘 也 是 “实在 ”的 东 东 ， 为 了 管理 它们 还 是 得 将 它们 抽象 成 某 些 数据 结构 ， 这 就 是 本 节 的 任务 之 一 。 

为 了 支持 硬盘 操作 ， 咱 们 还 有 几 件 事 要 做 。 硬 盘 上 有 两 个 ata 通道 ， 也 称 为 IDE 通道 。 第 1 个 ata 通 
道上 的 两 个 硬盘 〈 主 和 从 ) 的 中 断 信号 挂 在 8259A 从 片 的 下 Q14 上 ， 没 错 ， 是 两 个 硬盘 共享 同一 个 IRQ 
接口 ， 也 许 您 在 想 ， 硬 件 发 生 中 断 时 ， 如 何 区 分 中 断 是 来 自 哪 个 硬盘 的 ?” 是 这 样 的 ， 硬 盘 发 生 中 断 的 条 件 
是 咱们 对 硬件 执行 了 某 些 命令 ,然后 硬盘 完成 任务 后 才 发 中 断 ， 咱 们 在 对 硬盘 发 命令 时 ， 需 要 提前 指定 是 
对 主 盘 ， 还 是 从 盘 操 作 ， 这 是 在 硬盘 控制 器 的 device 寄存 器 中 第 4 位 的 dev 位 指定 的 〈 忘 记 的 话 回 头 看 看 
第 3 章 的 硬盘 控制 器 端口 )， 因 此 自然 就 知道 是 哪个 硬盘 来 了 中 断 信 号 ， 有 具体 的 作法 咱们 在 后 面 实现 的 部 分 
说 。 顺便 说 一 下 , 第 2 个 ata 通道 接 在 8259A 从 片 的 IRQ15 上 , 该 ata 通道 上 可 支持 两 个 硬盘 。 来 自 8259A 
从 片 的 中 断 是 由 8259A 主 片 帮忙 向 处 理 器 传达 的 , 8259A 从 片 是 级 联 在 8259A 主 片 的 耻 Q2 接口 的 , 因此 
为 了 让 处 理 器 也 响应 来 自 8259A 从 片 的 中 断 ， 屏 蔽 中 断 寄 存 器 必须 也 把 IRQ2 打开 ， 如 代码 13-1 所 示 。 

代码 13-1 (project/c13/a/kernel/interrupt.c ) 

. 略 

41 /* 初始 化 可 编程 中 断 控制 器 8259A */ 

42 static void pic init(void) { 

56 /* IRO2 用 于 级 联 从 片 ， 必 须 打 开 ， 否 则 无 法 响应 从 片上 的 中 断 。 

57 片上 打开 的 中 断 有 IRQ0 的 时 钟 ，IRQ1 的 键盘 和 级 联 从 片 的 IRQ2， 

其 他 全 部 关闭 */ 

58 outb (PIC M DATA, 0xf8) 

59 

60 /* 打开 从 片上 的 IRQ14， 此 引 肢 接收 硬盘 控制 器 的 中 断 */ 

61 outb (PIC S DATA, Oxbf); 

62 

63 put_str(" pic init done\n"); 

64 } 


代码 第 58 一 61 行 重新 设置 了 ! 
的 键盘 和 级 联 从 片 的 IRQ2。 从 片 8259A | 




















顺便 提 





人 句 ， 在 中 断 处 天 





























两 片 8259A 同时 发 送 EOI。 
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断 屏 蔽 寄存 器 ， 





程序 中 ， 如 果 中 断 源 是 来 
时 候 ， 主 片 和 从 片 都 要 发 送 。 否 则 ， 将 无 法 继续 响应 新 的 中 断 。 不 过 咱 

















前 是 在 主 片 8259A 上 打开 的 中 断 IRQ0 的 时 钟 、IRQ1 























上 打开 的 中 断 是 IRQ14 的 硬盘 。 





的 话 ， 在 发 送 中 断 结束 信号 EOI 的 
们 的 中 断 处 理 程序 一 直 都 是 向 主 从 


自从 片 8259A 



























































put_xxx 之 类 的 函数 ， 可 是 自从 
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= 














守 企 
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要 做 ， 是 为 了 让 














们 1 j 1 方 便 。 











J 




















咱们 为 上 

















函数 不 方便 ， 为 此 咱 





j 户 进程 实现 了 printf 
































们 也 心疼 下 自 EE 用 
















































































E 内 核 中 实现 格式 化 输 H 
只 是 printk 是 专门 用 在 内 核 态 的 格式 化 输出 函数 ， 它 是 printf 的 挛 生 兄弟 。 由 了 


啦 ， 所 以 实现 起 来 更 简单 了 ， 我 们 把 它 定义 在 lib/kernel/stdio.kernelc 


需要 系统 调 ) 
代码 13-2 
… 略 
10 /* 供 内 核 使 用 的 格式 化 输出 函数 */ 
11 void Printk (const char* format, 
2 va list args; 
13 va_start (args, format); 
14 char buf[1024] = {0}; 
业 总 vsprintf (buf, format, args); 
16 va_end (args); 
于 区 console put str (buf) 
L187 } 


下 面 介绍 和 硬盘 相关 的 数 和 


… 略 
7 /* 分 














区 结构 */ 


8 struct partition { 





结构 了 , 它 


代码 13-3 


4 





数 后 ， 越 来 越 觉 


函数 printk。printk 和 printf 原 到 





前 咱们 在 内 核 中 打印 输出 时 ， 都 是 用 console_ 


函 导 console_put_xxx 系列 的 














三 
上 全 








样 的 ， 

















本 月 三 | 
和 古人 














( project/c13/a/lib/kernel/stdio-kernel.c ) 














定义 在 device/ide.h : 

























































































， 这 是 我 们 新 创建 的 文 从 





( project/c13/a/device/ide.h ) 
































































































































































































































全 内 核 态 下 实现 ， 因 此 不 
， 如 代码 13-2 所 示 。 


EF， 如 代码 13-3 所 示 。 






































9 uint32 七 start lba; // 起 始 扇 区 

10 uint32 t sec_ cnt; // 扇 区 数 

11 struct disk* my disk; // 分 区 所 属 的 硬盘 

1 struct list elem part tag; // 用 于 队列 中 的 标记 

13 char name[8]; // 分 区 名 称 

14 struct super block* sb; // 本 分 区 的 超级 块 

工 5 struct bitmap block bitmap; // 块 位 医 

16 struct bitmap inode bitmap; // i 结 点 位 区 

17 struct list open inodes; // 本 分 区 打开 的 i 结 点 队列 

18: 3} 

19 

20 /* 硬盘 结构 */ 

2.1 struct disk { 

22 char name[8]; // 本 硬盘 的 名 称 

3 struct ide channel* my channel; // 此 块 硬盘 归属 于 哪个 ide 通道 

24 uint8 t dev no; // 本 硬盘 是 主 0， 还 是 从 1 

25 struct partition prim parts[4]; // 主 分 区 项 多 是 4 个 

26 struct partition logic parts[8]; 

// 逻辑 分 区 数量 无 限 ， 但 总 得 有 个 支持 的 上 限 ， 那 就 支持 8 个 

27 1}; 

28 

29 /* ata 通道 结构 */ 

30 struct ide channel { 

31 char name[8]; // 本 ata 通道 名 称 

32 uint16 t port base; // 本 通道 的 起 始 端口 号 

33 uint8 t irq no; // 本 通道 所 用 的 中 断 号 

34 struct lock lock; // 通道 锁 

35 bool expecting intr; // 表 示 等 待 硬盘 的 中 断 

36 struct semaphore disk done; // 用 于 阻塞 、 唤 醒 驱 动 程序 

37 struct disk devices[2]; // 一 个 通道 上 连接 两 个 硬盘 ， 一 主 一 从 

38:7]3 

程序 开头 定义 的 struct partition 是 分 区 表 结 构 ， 成 员 start_lba 表示 分 区 的 起 始 扇 区 ，sec_cnt 是 分 区 的 
容量 扇 区 数 ， 一 个 硬盘 有 很 多 分 区 ， 因 此 成 员 my_disk 表示 此 扇 区 属于 哪个 硬盘 。part_tag 是 本 分 区 的 标记 ， 
将 来 会 将 分 区 汇总 到 队列 中 ， 需 要 用 此 标记 。 name 是 分 区 名 称 , 如 sdal、sda2。 第 14 行 的 “struct super_block* 
sb”， 它 是 超级 块 指 针 ， 有 关 这 部 分 咱们 在 后 面 介绍 ， 此 处 只 是 用 来 占 个 位 置 ， 当 前 节 的 代码 中 并 没有 定 
义 超级 块 的 结构 ， 因 此 更 不 可 能 包含 超级 块 的 头 文件 ， 因 为 这 里 的 超级 块 是 struct super_block* 指 针 ，32 
位 系统 下 指针 都 是 32 位 ， 在 有 指针 操作 的 时 候 才 会 涉及 到 数据 宽度 ， 而 本 节 咀 们 并 没有 使 用 它 ， 因 此 编 
译 并 没有 问题 。 后 面 的 3 个 成 员 是 文件 系统 中 涉及 的 。 为 了 减少 对 低速 磁盘 的 访问 次 数 ， 文 件 系 统 通常 以 
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多 个 扇 区 为 单位 来 读 写 磁盘 ， 这 多 个 扇 区 就 是 块 。block_bitmap 是 块 位 图 ， 用 来 管理 本 分 区 所 有 块 ， 为 了 
简单 ， 咱 们 的 块 大 小 是 由 1 个 扇 区 组 成 的 ， 所 以 block_bitmap 就 是 管理 扇 区 的 位 图 。inode_bitmap 是 i 结 
点 管理 位 图 。open_inodes 是 分 区 所 打开 的 inode 队列 。 这 些 内 容 要 在 文件 系统 的 部 分 中 介绍 ， 现 在 多 说 无 
益 ， 此 处 知道 在 分 区 中 有 超级 块 指 针 即 可 。 

在 下 面 定义 的 是 struct disk， 此 结构 体 代表 硬盘 ，name 表示 硬盘 的 名 称 ， 比 如 sda、sdb 等 。 一 个 通道 上 有 
两 块 硬盘 ， 所 以 my_channel 用 于 指定 本 硬盘 所 属 的 通道 ， 成 员 dev_no 用 来 表示 本 硬盘 是 主 盘 ， 还 是 从 盘 ， 
prim_parts 是 本 硬盘 中 的 主 分 区 数量 ， 最 多 是 4 个 主 分 区 ，logic_parts 是 逻辑 分 区 的 数量 ， 咱 们 这 里 限制 为 8 个。 














接 下 来 定义 的 是 struct ide_channel， 此 结构 表示 ide 通 
成 员 name 是 通道 的 名 称 ， 如 ata0 或 ide0。 
基 址 ， 对 于 它 要 多 解释 两 句 , I 




















port_base 是 本 通道 的 端口 














范围 是 不 一 样 
































0x376。 





是 0x3F6， 通 道 


通道 1 的 端 














控制 块 寄存 器 端 




















Nea 


成 员 irq_no 是 本 通 



















































































的 ， 通 道 1 (Primary 通道 ) 的 命令 块 寄存 器 端口 范 
首 2 (Secondary 通道 ) 命令 
口 可 以 以 0x1F0 为 基数 ， 其 命 
口 在 此 基数 上 加 上 0x206， 同 理 ， 通 道 2 的 基数 就 是 0x170。 
道 的 中 断 号 , 在 硬盘 的 中 断 处 到 








甬道 ， 也 就 是 ata 通道 。 










































































们 这 里 只 处 理 两 个 通道 的 主板 ,每 个 通道 的 
围 是 0x1F0~0x1F7， 控 和 








冲 块 寄存 器 























Sn 





令 块 寄存 器 端口 范围 是 0x170 一 0x177， 探 甫 


命令 块 寄存 器 端口 





















































程序 中 要 根据 中 断 号 来 判断 在 哪个 通 











块 寄 存 器 端 
在 此 基数 上 分 别 加 上 0 一 7 就 可 以 了 ， 


是 























中 操作 , 将 

















这 很 



























































































































































































































































言 号 来 





来 实现 硬盘 中 断 处 理 程 序 时 就 清楚 了 。 

成 员 lock 是 本 通道 的 锁 ， 用 来 实现 通道 的 互 斥 。 为 什么 要 给 通道 加 个 锁 呢 ? 大 伙 儿 知道 ，!1 个 通道 ! 
有 主 、 从 两 块 硬盘 ， 向 硬盘 下 达 命 令 的 时 候 可 以 通过 device 寄存 器 中 的 dev 位 来 指定 操作 哪 块 硬盘 ， 
好 区 分 。 但 硬盘 完成 操作 后 ， 它 还 得 通知 调用 者 任务 执行 的 结果 ， 是 顺利 完成 了 ， 还 是 失败 了 ， 如 果 是 读 
硬盘 的 话 ， 现 在 可 以 取 数 据 了 ， 这 里 是 让 硬盘 主动 发 中 断 来 通知 调用 者 的 。 可 是 一 个 通道 只 能 有 1 个 中 断 
童 号 ， 因 此 通道 中 的 两 个 硬盘 也 只 能 共用 同一 个 中 断 ， 中 断 发 生 时 ， 中 断 处 理 程 序 是 如 何 区 分 中 断 
自 哪 一 个 硬盘 呢 ? 还 真 不 知道 怎样 区 分 ， 所 以 一 次 只 人 允许 通道 中 的 1 个 硬盘 操作 ， 因 此 在 通道 中 设置 锁 来 
实现 互 斥 ， 对 通道 中 任何 一 个 硬盘 操作 时 都 要 申请 该 锁 以 实现 独 享 通道 。 


扬 处 到 
一 步 动作 ， 如 获取 数 # 


过 此 信号 量 阻 
量 将 硬盘 驱动 程序 唤醒 。 
成 员 devices 是 个 长 度 为 2 的 数组 ， 表 示 一 个 通道 ! 


中 


























成 员 expecting_intr 表示 本 通道 























等 。 











[= 二 


里 ， 上 此 
本 气 


成 员 disk_done 是 个 信和 号 




















程序 中 会 通过 此 成 员 来 判断 此 次 
























































的 作用 是 : 驱动 程 











自己 ， 避 和 免 干 











等 厦 ; 






































费 

















大 





的 中 断 是 否 是 因为 之 前 的 硬 




















FE 等 待 硬盘 中 断 。 驱 动 程序 向 硬盘 发 完 命令 后 等 待 来 自重 盘 的 中 断 ， 中 








盘 操 作 命令 引起 的 ， 如 果 是 ， 则 进行 下 


























指 ] 


期 间 可 





序 向 硬盘 发 送 命令 后 ， 在 等 待 硬 














CPU。 等 硬盘 工作 完成 后 会 发 出 中 断 ， 中 断 处 理 程序 ; 
































的 两 个 硬盘 。 


头 文件 就 这 样 ， 下 面 介 绍 ide.c 中 的 实现 ， 请 见 代 码 13-4。 
代码 13-4 (project/c13/a/device/ide.c ) 
/* 定义 硬盘 各 寄存 器 的 端口 号 */ 











#define reg data (channel) 
#define reg error (channel) 
#define reg sect cnt (channe 
#define reg lba 1 (channel) 
#define reg lba m(channel) 
#define reg lba h(channel) 
#define reg dev (channel) 
#define reg status (channel) 
#define reg cmd (channel) 








1) 


(channel->port base + 0) 
(channel->port base + 1) 
(channel->port base + 2) 
(channel->port base + 3) 
(channel—->port base + 4) 
(channel->port base + 5) 
(channel->port base + 6) 
(channel->port base + 7) 
(reg_ status (channel)) 























20 #define reg alt status (channel) (channel->port base + 0x206) 
21 #define reg ctl (channel) reg alt status (channel) 

22 

23 /* reg alt_status 寄存 器 的 一 些 关键 位 */ 

24 #define BIT ALT STAT BSY 0x80 // 硬盘 忙 

25 #define BIT ALT STAT DRDY 0x40 // 驱动 器 准备 好 

26 #define BIT ALT STAT DRQO 0x8 // 数据 传输 准备 好 了 

2 
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以 通 

















过 此 信和 号 





A 











28 /* device 寄存 器 的 一 些 关 键 位 */ 














29 #define BIT DEV MBS 0xa0 // 第 7 位 和 第 5 位 固定 为 1 
30 #define BIT_DEV_LBA 0x40 

31 #define BIT_DEV_DEV 0x10 

32 

33 /* 一 些 硬盘 操作 的 指令 */ 

34 #define CMD IDENTIFY 0xec // identify 指令 





35 #define CMD READ SECTOR 0x20 // 读 户 区 指令 
36 #define CMD WRITE SECTOR 0x30 // 写 房 区 指令 









































37 

38 /* 定义 可 读 写 的 最 大 扇 区 数 ， 调 试用 的 */ 

39 #define max lba ((80*1024*1024/512) - 1) // 只 支持 80MB 硬盘 
40 





uint8 t channel cnt; // 按 硬盘 数 计算 的 通道 数 
struct ide channel channels[2]; // 有 两 个 ide 通道 


41 

42 

43 

44 /* 硬盘 数据 结构 初始 化 */ 
45 void ide init() { 
46 
47 
48 
49 








printk ("ide init start\n"); 

uint8 t hd cnt = *((uint8 tx) (0x475)); // 获取 硬盘 的 数量 
ASSERT (hd cnt > 0); 

Pe = Es _ROUND_UP (hd _ cnt, 2); 










































































// 一 个 iqde 通道 上 有 两 个 硬盘 ， 根 据 硬盘 数量 反 推 有 几 个 ide 通道 
50 struct ide channel* channel; 
志和 uint8 t channel no = 0; 
52 
53 /* 处 理 每 个 通道 上 的 硬盘 */ 
54 while (channel no < channel cnt) { 
与 总 channel = &channels [channel no]; 
56 sprintf (channel->name, "ide%d", channel no); 
D7 
58 /* 为 每 个 ide 通道 初始 化 端口 基 址 及 中 断 向 量 */ 
59 Switch (channel no) { 
60 case 0: 
61 channel->port base = 0xlf0; 








// ide0i 通道 的 起 始 端 号 是 0x1f0 





62 channel->irg no = 0x20 + 14; 
// 从 片 8259a 上 倒数 第 二 的 中 断 引 脚 
// 硬盘 ， 也 就 是 ide0 通道 的 中 断 向 量 号 











63 break; 
64 case 1: 
65 channel->port base = Ox170; 








// iaqel 通道 的 起 始 端口 号 是 0x170 








66 channel->irg no = 0x20 + 15; 
// 从 8259A 上 的 最 后 一 个 中 断 引 脚 
























































































































































// 我 们 用 来 响应 iaqel 通道 上 的 硬盘 中 断 

67 break; 
68 } 
69 
70 channel->expecting intr = false; 

// 未 向 硬盘 写 入 指令 时 不 其 待 硬盘 的 中 断 
区 lock init (&channel—->lock); 
22 
73 /* 初始 化 为 0， 目 的 是 向 硬盘 控制 器 请 求 数据 后 ， 

硬盘 驱动 sema_down 此 信号 量 会 阻塞 线程 ， 

74 到 硬盘 完成 后 通过 发 中 断 ， 

中 断 处 理 程序 将 此 信号 量 sema_up， 唤 醒 线 程 */ 
Re sema init (&channel->disk done, 0);，; 
76 channel not+t+; // 下 一 个 channel 
77 
78 printk ("ide init done\n"); 
79 } 
在 代码 第 11 一 21 行 定义 的 宏 是 针对 两 个 ata 通道 不 同 寄存 器 的 端口 ,在 第 3 章 已 经 介绍 了 硬盘 的 端口 ， 




















大 伙 儿 可 以 再 参考 下 “ 表 3-17 硬盘 控制 器 主要 端口 寄存 器 ” 
接 下 来 定义 了 寄存 器 中 的 关键 位 ， 命 名 规则 是 BIT_ 寄 存 器 名 称 _ 位 名 。 第 23 一 26 行 定 义 的 是 status 
寄存 器 中 的 一 些 关键 位 ， 可 以 对 照 “ 图 3-32 status 寄存 器 ”了 解 下 ， 第 28 一 31 行 定义 的 是 device 寄存 器 
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中 的 一 些 关 键 位 ， 可 





加 


以 对 照 “ 











中 的 第 5 位 和 第 7 位 ， 这 两 位 固定 为 1。 





a 令 , 这 里 就 定义 了 三 
， 其 值 为 0x20， 写 遍 


命令 ， 





其 值 为 








3-31 device 寄存 器 ” 


了 解 下 ， 














0xec， 读 局 区 命令 














硬盘 的 身份 信息 ， 下 节 我 们 就 要 用 
下 面 定 义 的 宏 max_lba 表示 最 大 的 lba 地 址 ， 这 是 调试 用 的 ， 避 免 出 现 扇 区 


的 情况 。 
变量 
E 有 








反 推 

















channel_cnt 用 


1L 个 通道 ， 也 就 是 硬盘 数 除 以 2 便 是 通道 数 。 下 面 

















到 它 。 











来 表示 机 器 上 的 ata 








通道 数 ， 


个 ,对 隆 

















们 的 简单 应 ) 











] 来 说 已 经 够 用 




















区 指令 ， 划 


















































最 后 是 硬盘 初始 化 函数 ide_init， 此 函数 目 




















册 硬盘 





叶 处 理 














从 


前 所 做 的 工作 是 初始 化 以 上 定义 的 数据 











加 


























第 54 行 





和 中 断 号 irq_no。 
通道 的 服务 器 确实 很 普遍 ， 当 有 3 


中 断 号 是 0x2e 
下 四 

















行 通过 while 循环 处 理 


1 初始 化 通道 expecting_intr 为 false， 
数据 结构 至 此 初始 化 完成 ， 本 节 偏 重 于 基 





程序 、 检 测 硬盘 参数 和 扫描 











本 


区 表 。 

















第 47 行 通过 代码 “x*((uint8_t*)(0x475))” 在 寺 
1MB 以 内 的 虚拟 地 址 和 物理 
第 49 行 通 过 代码 “DIV_ROUND_UPQd_cnt 2);” 简 单 地 推算 上 


每 一 个 通道 ， 在 switch 结构 ! 





















































， 即 Ox20 + 14。 

















大 伙 儿 辛苦 了 。 


13.2.2 ”实现 thread_yield 和 idle 线程 





thread_yield 执 


行 后 各 























能 是 主动 和 























也 址 0x475 处 获取 硬盘 














这 里 咀 们 的 做 法 比较 














值 为 0x30。 其 中 identify 指令 





6 全 和 
和 鲁莽”， 


的 channels 是 通道 数组 。 


的 数量 ， 将 j 











地 址 相同 ， 所 以 虚拟 地 址 0x475 可 以 正确 访 





E 务 的 状态 是 TASK_ READY， 即 让 出 CPU 后 ， 


























问 到 物理 
上 了 通道 数 ， 存 入 变量 























针对 这 有 





switch 结构 的 好 处 是 便于 扩展 ， 昌 然 个 人 PC 一 般 都 是 两 个 ide 


丽 个 通道 























折 的 通道 加 入 时 ,再 加 个 case 分 支 就 可 以 了 。 这 里 
通道 2 的 端口 基 址 是 0x170， 中 断 号 是 0x2f， 即 0x20 + 15 。 
再 初始 化 通道 的 锁 channel->lock 和 信和 号 量 channel-> disk_done。 





仅仅 是 通 





其 存 入 变量 hd_ent 


地 址 0x475。 








依次 初始 化 端 
通道 的 主板 ， 


顺便 说 一 句 ，BIT_DEV_MBS 是 指 device 


了 。 分 别 是 identify 


用 来 获取 





区 地 址 计算 错误 而 出 现 越界 


过 硬盘 数 来 


埋 构 ， 将 来 还 要 注 














。 低 端 


二 channel_cnt 中 。 
口 基 址 port_base 


但 多 个 ide 




















通道 1 端口 


基 址 是 0x1f0， 














础 构建 ， 没 喻 实际 功能 验证 





在 进行 下 一 步 之 前 ， 我 们 先 要 完善 一 些 基础 构件 ， 本 节 完 成 thread_yield 和 idle 线程 。 
thread_yield 定义 在 thread.c 中 ， 它 的 功 

















EE， 因此， 本 节 的 内 容 就 到 这 了 ， 


巴 CPU 使 用 权 让 出 来 ， 它 与 thread_block 的 区 别 是 
它 会 被 加 入 到 就 绪 队 列 中 ， 下 次 还 能 


继续 被 调度 器 调度 执行 ， 而 thread_block 执行 后 任务 的 状态 是 TASK_BLOCKED， 需 要 被 唤醒 后 才能 加 入 
到 就 绪 队 列 ， 所 以 下 次 执行 还 不 知道 是 什么 时 候 。 










































































( project/c13/b/thread/thread.c ) 


好 啦 ， 下 面 看 thread_yield 的 实现 ， 见 代码 13-5。 
代码 13-5 

… 略 

13 struct task struct* idle thread; // idle 线程 

21 /* 系统 空闲 时 运行 的 线程 */ 

22 static void idle(void* arg UNUSED) { 

23 while(1) { 

24 thread block (TASK BLOCKED); 

25 // 执 行 hlt 时 必须 要 保证 目前 处 在 开 中 断 的 情况 下 

26 AasSm vOLatiLle (Vsti hlit® s % * memory.y}; 

27 } 

28.} 

… 略 

123 /* 实现 任务 调度 */ 

124 void schedule() { 

… 略 

138 /* 如 果 就 绪 队 列 中 没有 可 运行 的 任务 ， 就 唤醒 idqle */ 

139 if (list empty(&thread ready list)) { 

140 thread unblock (idle thread);} 

141 } 

… 略 

154 } 
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二 9 2 外 














/* 主动 让 出 cpu， 换 其 他 线程 运行 */ 

void thread yield(void) { 

struct task struct* cur = running thread(); 

enum intr status old status = intr disable(); 

ASSERT (!elem find(&thread ready list, &cur->general tag)); 
list append(&thread ready list, &cur->general tag); 
cur->status = TASK READY; 

Schedule () ; 

Intr_set_status (olLlq_status) ; 








194 /* 初始 化 线程 环境 */ 
195 void thread init (void) { 


put_str("thread init start\n"); 


list init(&thread ready list); 
list init(&thread all list);} 
lock init (&pid lock); 


202 /* 将 当前 main 函数 创建 为 线程 */ 


make main thread(); 





/* 创建 idle 线程 */ 
idle thread = thread start ("idle", 10, idle, NULL);} 


put_str("thread init done\n"); 














我 们 先 看 thread_yield 的 实现 ， 它 定义 在 第 184 行 ， 原 理 还 是 变 简 单 的 ， 核 心 就 是 3 
(1) 先 将 当前 任务 重新 加 入 到 就 绪 队 列 〈 队 尾 )， 如 第 188 行 代码 。 
(2) 然后 将 当前 任务 的 status 置 为 TASK_READY， 如 第 189 行 代码 。 





(3) 最 


后 调用 schedule 重新 调度 新 任务 ， 如 第 190 行 代码 。 








































































































步 。 


值得 注意 的 是 前 2 步 必须 是 原子 操作 ， 您 看 ， 如 果 在 开 中 断 的 情况 下 ， 刚 完成 第 《1) 步 把 当前 任务 








添加 到 就 绪 队 列 ， 第 〈2) 步 修改 状态 的 代码 “cur->status = TASK_READY ”尚未 执行 ， 因 此 当前 任务 的 
状态 依然 是 TASK_RUNNING。 如果 此 时 发 生 时 钟 中 断 ， 当 前 任务 正巧 被 换 下 CPU， 调 度 器 schedule 判断 
当前 任务 的 状态 是 TASK_RUNNING， 就 要 将 其 重新 添加 到 就 绪 队 列 ， 为 避免 重复 添加 ， 这 时 会 触发 
“ASSERT(!elem_find(&thread_ready_list,&cur->general_tag));”。 好 了 ，thread_yield 介绍 完了 。 


一 直 以 来 我 们 的 系统 有 个 明显 的 缺陷 《哈哈 ， 好 吧 ， 缺 陷 很 多 ， 我 不 要 谦虚 了 )， 当 就 绪 队 列 中 没有 
任务 时 ， 调 度 器 没有 任务 可 调度 ， 系 统 就 会 通过 “ASSERTUIlist_empty(&thread_ready_lisb);” 悬 停 。 这 种 
持续 下 去 了 ， 所 以 本 次 在 thread.c 中 顺便 蹇 了 个 idle 线程 ，idle 线程 用 于 系统 空间 时 ， 也 就 是 




















情况 不 能 














| 

























































































就 绪 队 列 中 没有 任务 时 才 运 行 的 。 
咱们 看 下 代码 的 开头 ， 定 义 了 全 局 变量 idle_thread， 它 就 是 idle 线程， 在 第 206 行 创 建 idle 线程 时 会 


为 其 初始 化 

















o 


在 第 22 行 的 就 是 idle 函数 的 实现 ， 其 原 









































De 









































里 是 在 函数 体 中 执行 “thread_block(TASK_BLOCKED)” 阻 塞 自 己 ， 
在 其 被 唤醒 后 ， 通 过 内 联 汇编 执行 hlt 指令 ， 使 系统 挂 起 ， 达 到 真正 的 “空闲 ” hlt 指令 的 功能 让 处 理 器 
止 执行 指令 ， 也 就 是 将 处 理 器 挂 起 〈 并 不 是 类 似 “jmp $” 那 样 空 听 CPU，CPU 利用 率 100%)， 使 处 理 












































停 
器 得 到 休息 ，CPU 利用 率 一 下 子 就 掉 下 来 了 ， 在 那 一 小 段 时 间 CPU 利用 率 为 0。 处 理 器 已 经 停止 运行 ， 






































因此 并 不 会 再 产生 内 部 异常 ， 唯 一 能 唤醒 处 理 器 的 就 是 外 部 中 断 ， 当 外 部 发 生 后， 处 理 器 恢复 执行 后 


















































指令 。 处 理 器 需要 被 唤醒 ， 必 须要 保证 在 开 中 断 的 情况 下 执行 hlt， 因 此 内 联 汇编 代码 中 


























四 的 
2 先 执行 sti, 再 



































执行 hlt。 顺 便 说 一 下 ，idle_thread 在 第 一 次 创建 时 会 被 加 入 到 就 绪 队 列 ， 因 此 会 执行 一 次 ， 然 后 阻塞 。 
当 就 绪 队 列 为 空 时 ，schedule 会 在 第 140 行将 idle_thread 解除 阻塞 ， 也 就 是 唤醒 idle_thread, idle_thread 


会 执行 “sti; 
idle_thread 的 创建 工作 是 放 在 thread_init 中 完成 的 ， 即 第 206 行 。 
好 啦 ， 有 关 thread.c 中 的 改进 就 到 这 ， 下 节 继 续 出 发 。 









































hlt”， 先 开 中 断 ， 再 挂 起 CPU 。 
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13323 


实现 简单 的 休眠 函数 

















任何 一 件 工作 都 建立 在 一 定 的 基础 之 上 , 没有 绝对 独立 的 个 体 , 1 















































硬盘 和 CPU 是 相互 独立 的 个 体 ， 它 们 各 自 并 行 执行 ， 但 由 于 硬盘 是 低速 设备 ， 其 在 处 理 请 求 时 往往 


消耗 很 长 的 时 间 《〈 不 过 手册 上 说 最 慢 的 情况 也 能 在 31 秒 之 内 完成 )， 为 避免 浪费 CPU 资源 ， 在 等 待 硬盘 操 

















基础 函数 ， 在 继续 之 前 ， 咱 们 先 去 把 它们 完成 再 说 。 




















们 的 硬盘 中 断 处 理 





程序 也 依赖 一 些 




















































































































作 的 过 程 中 最 好 把 CPU 主动 让 出 来 , 让 CPU 去 执行 其 他 任务 , 为 实现 这 种 “明智 ”的 行为 , 我 们 在 timer.c 
中 定义 休眠 函数 ， 当 然 这 只 是 简易 版 ， 精 度 不 是 很 高 ， 能 达到 目的 就 可 以 了 。 请 见 代 码 13-6。 


代码 13-6 (project/c13/c/device/timer.c ) 






































… 略 

8 #define IRQO FREQUENCY 100 

… 略 

17 #define mil seconds per intr (1000 / IRQO FREQUENCY) 

18 

19 uint32 七 ticks; // ticks 是 内 核 自 中 断 开 启 以 来 总 共 的 咬 哄 数 


oO 




















51 /* 以 tick 为 单位 的 sleep， 任 何 时 间 形式 的 sleep 会 转换 此 ticks 形式 





52 static void ticks to sleep(uint32 t sleep ticks) { 


S59 


Uint32 t. start tick = tickss 








/* 若 间 隔 的 ticks 数 不 够 便 让 出 cpu */ 

while (ticks - start tick < Sleep ticks) { 
thread yield(); 

} 


61 /* 以 毫秒 为 单位 的 sleep 1 秒 = 1000 毫秒 */ 
62 void mtime sleep(uint32 t m seconds) { 
uint32 七 Sleep ticks = DIV ROUND UP (m seconds, mil seconds per intr); 


LO 














ASSERT (sleep ticks > 0)，; 
ticks to sleep(sleep ticks); 





六 











程序 开头 定义 的 宏 mil_seconds_per_intr， 其 意义 是 每 多 少 毫秒 发 生 一 次 中 断 ， 也 就 是 以 毫秒 计算 的 中 


断 周期 。 我 们 已 经 把 时 钟 中 断 频 率 设置 成 了 每 秒 100 次 , 因此 mil_seconds_per_intr 的 值 是 1000/100=10 上 毫 
秒 ，1 个 中 断 周期 是 10 毫秒 ， 我 们 用 它 实现 简单 的 延 时 功能 。 


























定义 在 第 52 行 的 函数 是 ticks_to_sleep， 它 接受 一 个 参数 sleep_ticks，sleep_ticks 是 中 断 发 生 的 次 数 
ticks， 即 咬 咪 数 ， 功 能 是 让 任务 休眠 sleep_ticks 个 ticks， 也 就 是 此 函数 按照 时 钟 跑 哄 数 来 休眠 。 原 理 很 简 
单 ， 是 利用 两 次 时 钟 中 断 发 生 的 “间隔 tcks” 实 现 的 ,也 就 是 两 次 采样 ticks 之 差 。 函数 中 使 用 的 变量 ticks 

















是 全 局 变量 ， 它 是 由 时 钟 中 断 处 理 函 数 intr_timer_handler 更 新 的 ， 每 次 时 钟 中 断 发 9 























这 里 取 两 次 采样 间隔 , 通过 while 循环 不 断 获取 当前 的 ticks, 只 要 当前 


(这 里 是 












































start_tick)， 所 得 的 差 小 于 sleep_ticks (休眠 的 ticks 数 )， 就 j 





























满足 此 条 件 为 止 〈 发 生 了 足够 多 次 数 的 时 钟 中 断 )， 从 而 达到 了 延 时 的 目的 。 
函数 mtime_sleep， 其 接受 一 个 参数 宣 秒 m_seconds， 其 功能 是 使 程序 休眠 m_seconds 毫秒 ， 此 函数 按 
照 毫 秒 来 休眠 。 然 而 mtime_sleep 只 是 个 外 壳 ， 咱 们 并 没有 真正 做 到 按时 间 来 休眠 ， 按 时 间 休 眠 的 原理 是 : 



























































将 休眠 的 毫秒 时 间 m_seconds 转换 为 时 钟 中 断 发 和 9 



































E 它 的 值 就 加 1。 咀 们 
的 ticks 值 减 去 第 一 次 调用 时 的 ticks 
周 用 thread_yield 让 出 CPU， 直 到 不 












































E 的 “间隔 ticks 数 ” 然后 调用 ticks_to_sleep， 也 就 是 说 


最 终 还 是 由 ticks_to_sleep 完成 休眠 。 代 码 第 63 行 sleep_ticks 便 是 将 时 间 转 换 后 的 ticks 数 ， 本 质 上 就 是 
民 的 毫秒 数 ” 除 以 “中 断 发 生 的 毫秒 周期 ?>。 最 后 调用 “ticks_to_sleep(sleep_ticks)” 实 现 休眠 。 


用 “ 体 旧 





















































i 


在 























休眠 函数 ， 但 没 必 要 。 好 啦 ， 不 管 休眠 的 时 间 粒 度 是 毫秒 还 是 更 大 ， 最 终 要 转换 成 中 




















们 实际 应 用 中 ， 用 mtime_sleep 这 种 毫秒 级 的 休眠 足够 应 付 了 ， 当 然 也 可 以 专门 




















ticks_to_sleep 去 完成 功能 ， 大 伙 儿 可 以 自行 尝试 。 
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再 写 一 个 秒 级 的 



































断 次 数 ， 再 调用 














13.2.4 完善 硬盘 驱动 程序 
基础 部 分 算是 介绍 完了 ， 下 面 开 始 介绍 硬盘 的 中 断 处 理 函 数 部 分 ， 请 见 代码 13-7-1。 


代码 13-7-1 (project/c13/c/device/ide.c ) 






































四 




















48 /* 选择 读 写 的 硬盘 */ 
49 static void select disk(struct disk* hd) 1{ 





50 uint8 t reg device = BIT DEV MBS | BIT DEV_LBA; 

51 if (hd->dev no == 1) { // 若是 从 盘 就 置 DEV 位 为 1 
52 reg device |= BIT DEV_DEV; 

53 } 

54 outb (reg dev (hd->my channel), reg device); 

55: 二 

56 





57 /* 向 硬盘 控制 器 写 入 起 始 扇 区 地 址 及 要 读 写 的 扇 区 数 */ 
58 static void select_sector (struct disk* hd, uint32 t lba, uint8 t sec cnt) { 





























59 ASSERT (lba <= max lba); 
60 struct ide channel* channel = hd->my_ channel; 
61 
62 /* 写 入 要 读 写 的 扇 区 数 */ 
63 outb (reg_sect_cnt (channel), sec cnt); 
// 如 果 sec_cnt 为 0， 则 表示 写 入 256 个 扇 区 
64 
65 /* 写 入 lba 地 址 ， 即 扇 区 号 */ 
66 outbl(reg lba l(channel), lba); 

















// lba 地 址 的 低 8 位 ， 不 用 单独 取出 低 8 位 
// outb 函数 中 a outb Sb0，s%w1l 会 只 用 al 






















































































67 outb (reg_lba m(channel), lba >> 8); // lba 地 址 的 8 一 15 位 

68 outb (reg_lba_h(channel)，1lba >> 16); // lba 地 址 的 16 一 23 位 

69 

70 /* 因为 lba 地 址 的 第 24 一 27 位 要 存储 在 device 寄存 器 的 0~ 3 位， 

71 * 无 法 单独 写 入 这 4 位 ， 所 以 在 此 处 把 device 寄存 器 再 重新 写 入 一 次 */ 

72 outb (reg_qev(channe1)，BIT_ DEV MBS | BIT DEV LBA | \ 
(hd->dev no == 1 ? BIT DEV DEV : 0) | lba >> 24); 

73 } 

74 


75 /* 向 通道 channel 发 命令 cmq */ 
7T6 statie void cmcoub Sus ide channel* channel, uint8 t cmd) { 
77 /* 只 要 向 硬盘 发 出 了 命令 便 将 此 标记 置 为 true， 

硬盘 中 断 处 理 程序 需要 根据 它 来 判断 */ 

















78 channel->expecting intr = true; 
79 outbl(reg cmd(channel), cmd); 

80 } 

81 





82 /* 硬盘 读 入 sec_cnt 个 扇 区 的 数据 到 buf */ 

































































83 static void read from sector (struct disk* hd, void* buf, uint8 t sec cnt) { 
84 uint32 t size in byte; 

85 if (sec cnt == 0) { 

86 /* 因为 sec_cnt 是 8 位 变量 ， 调 函 数 将 其 赋值 时 ， 若 为 256 则 会 将 最 高 位 的 1 丢掉 变 为 0 */ 
87 size in byte = 256 * 512; 

88 } else { 

89 size in byte = sec cnt * 512; 

90 } 

91 insw(reg data(hd->my channel), buf, size in byte / 2); 

92 } 

93 

94 /* 将 buf 中 sec _cnt 扇 区 的 数据 写 入 硬盘 */ 








95 static void write2sector (struct disk* hd, void* buf, uint8 t sec cnt) { 



























































96 uint32 t size in byte; 
97 if (sec cnt == 0) { 
98 /* 因为 sec_cnt 是 8 位 变量 ， 调 函 数 将 其 赋值 时 ， 
若 为 256 则 会 将 最 高 位 的 1 丢掉 变 为 0 */ 
99 size in byte = 256 * 512; 
100 } else { 
T0903 size in byte = sec cnt * 512; 
102 } 
有 outswl(reg data(hd->my channel), buf, size _ in byte / 2) 
104 } 
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105 

106 /* 等 待 30 秒 */ 

107 static bool busy wait (struct disk* hd) { 

TQ8 struct ide channel* channel = hd->my_ channel; 

109 uint16 t time limit = 30 * 1000; // 可 以 等 待 
110 while (time limit -= 10 >= 0) { 

下 出 二 if (!(inb(reg status (channel)) & BIT STAT BSY)) { 
生生 这 return (inbl(reg status (channel)) & BIT STAT DRO); 
Lt3 } else { 

114 mtime sleep (10); // 睡眠 10 毫秒 
115 } 

116 } 

Ly return false; 

118 } 

… 略 


\ 双 、 


30000 毫秒 























拼凑 H 
是 再 将 变量 
device 寄存 器 ， 有 



































函数 select_sector 接受 3 个 参数 ， 硬 盘 指 针 hd、 























明道 


bi device 的 值 存 入 变量 reg_device， 








时 Teg_device 的 值 加 上 BIT_DEV_DEV。 最 后 
1 “reg_dev(hd->my_channel)” 这 档 


的 主 





日 









































根 所 








二 hd->dev_no 

















盘 , 为 1 表示 是 通道 的 从 盘 。 先 / 











函数 select_disk 接受 一 个 参数 ， 人 硬盘 指针 hd， 功 能 是 选择 待 操作 的 硬盘 是 主 盘 或 从 盘 。 原 到 
存 器 中 的 dev 位 , 该 位 为 0 表示 是 通 ; 








是 利用 








device 珂 


有 宏 BIT_DEV_MBS |BIT_DEV_LBA 








Me 














通过 outb 函数 将 变 


- 旦 . 
里 











就 完成 了 了 






































3 





二 
1 








由 器 写 入 起 始 肩 


区 地 址 及 要 读 写 的 扇 











写 的 鹿 区 数 ， 这 是 由 第 63 行 的 代码 完成 的 ，Sector count 寄存 器 是 8 位 宽度 ， 范 








该 寄存 器 的 值 为 0 时 ， 





发 cmd 命令 。 发 命令 有 


表示 256 个 扇 














第 


大 | 





27 位 写 在 device 寄存 器 的 低 4 位 中 ， 
时 ， 又 补充 了 LBA 的 第 
下 一 个 函数 是 cmd_out, 它 接受 2 个 参数 ,通道 channel 和 硬盘 操作 命令 cmd 函数 功能 是 将 i 


置 为 tue， 这 是 为 硬盘 中 断 处 弄 


24 一 27 位 。 


\ 过、 


的 时 候 要 将 通道 























示 将 来 该 通道 发 出 的 ! 





此 








佳 征 72 行 ， 

















的 expecting_intr 

















将 命令 





断 信号 也 许 是 


此 次 命令 操作 引起 的 ， 














cmd 写 入 通道 的 cmd 寄存 器 。 
下 一 个 函数 是 read_from_sector， 它 接受 3 个 参数 ,分别 是 待 操作 的 硬盘 hd、 绥 六 
数 sec_cnt， 功 能 是 从 硬盘 hd 中 读 入 sec_cnt 个 扇 

















取 的 ，insw 的 参数 是 字 








将 字 节 除 以 2 就 是 字 了 ， 这 虽 














表示 





256 个 扇 区 ， 并 不 是 0 扇 区 ， 因 此 在 





AAA 
PP 
2 





可 或 从 租 
区 起 始 地 址 lba、 
区 数 。 功 能 分 两 步 实 现 ， 第 1 步 9 























忆 





韦 














区 。 第 2 步 是 分 别 在 寄存 器 LBA low、LBA mid、LBA high 中 写 入 
区 LBA 地 址 的 低 8 位 、 中 间 8 位 和 高 8 位 ， 这 是 由 第 66 一 68 行 代码 完成 的 ，LBA 地 址 共 28 位 ， 
重新 把 device 寄存 器 写 了 一 次 , 保留 原来 信息 的 





的 值 判断 是 主 盘 , 还 是 从 盘 , 若 为 1 则 表示 是 从 盘 ， 
reg_device 写 入 硬盘 所 在 通道 
的 选择 。 
区 数 sec_cnt， 功 能 是 向 硬 
在 Sector count 寄存 器 中 写 入 待 ; 








的 




















大 





立 
入 





是 0~255， 因 此 当 写 





| 
2 
第 24 一 
同 

















明道 channel 
下 伏笔 ， 表 

















程序 埋 














因此 此 通 











道 正 








期 待 来 自 硬盘 的 ! 























断 。 然 后 再 














区 的 数据 到 buf。 此 函数 内 部 是 i 








是 2 个 字 节 ， 因 此 要 将 肩 区 数 转换 成 字 后 再 
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调用 in 








下 





区 buf、 读 取 的 扇 
半 用 insw 来 完成 硬盘 
sw。 先 转换 成 字 节 ， 








用 区 | 






































有 将 sec_cnt 转换 为 字 节 时 要 对 sec_cnt 判断 一 下 ， 如 果 sec_cnt 为 0 的 话 ，1i 
87 行 的 size_in_byte 等 于 256*512。 


0 时 





不 
昭 


则 的 话 ，size_in_byte 


的 值 就 等 于 sec_cnt * 512。size_in_byte 变 为 合适 的 字 节 后 ， 在 第 91 行将 size_in_byte/2 转换 为 字 作 为 参数 

















调用 


insw 完成 读 取 扇 区 。 
下 面 是 函数 write2sector， 它 接受 3 个 参数 ， 硬 盘 hd、 缓 冲 区 buf、 扇 区 数 sec_cnt， 功 





sec_cnt 扇 区 的 数据 写 入 硬盘 hd。 这 里 写 扇 区 是 调 





























区 数 sec_cnt 转换 为 字 ， 原理 
函数 busy_wait 接受 1 个 参数 ， 硬 盘 hd， 功 
过 程 中 ， 驱 动 程序 可 以 让 出 CPU 使 用 权 使 其 他 和 





盘 30 秒 呢 ? 在 ata 手册 中 有 这 人 么 





























台 忆 旧 
有 起 

















j outsw 完成 的 ，outsw 的 参数 也 是 字 ， 因 此 也 需要 将 
同 read_from_sector 相同 ， 不 再 袭 述 。 
等 待 硬盘 30 秒 。 硬 盘 是 个 低速 设备 ， 
E 务 得 到 调度 ， 这 就 是 busy_wait 的 作 / 
句 话 :“All actions required in this state shall be completed within 31 s”， 


台 忆 昌 


能 是 将 buf 中 





a 
| 











因此 在 其 响应 
]。 为 什么 要 等 待 硬 


























大 概 意思 是 所 有 的 操作 都 应 该 在 31 秒 内 完成 ， 所 以 我 们 在 30 秒 内 等 待 硬 盘 响 应 ， 若 成 功 则 返回 true， 否 








则 false。 变 量 time_limit 的 值 是 30*1000 毫秒 ， 即 30 秒 ， 接 着 通过 while 循环 ， 每 次 将 time_limit 减 10 
毫秒 ,在 第 111 行 读 取 status 寄存 器 ， 通 过 宏 BIT_STAT_BSY 判断 status 寄存 器 的 BSY 位 是 否 为 1， 如 果 

















为 1， 则 表示 硬盘 繁 





六 ， 这 时 候 就 





周 用 

















接着 在 第 112 行书 
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了 次 读 取 status 寄存 器 ， 返 回 





mtime_sleep(10) 去 体 日 














民 10 毫秒 。 如 果 BSY 位 为 0 则 表示 硬盘 不 忙 











Ly 





其 DRQ 位 的 值 ，DRQ 位 为 1 表示 硬盘 





已 经 准备 好 数据 了 ， 














空转 ( 空 儿 )， 自 旋 锁 就 是 忙 等 待 的 一 种 形式 。 了 趴 
高 效 一 点 ,毕竟 是 主动 让 出 了 CPU 使 用 权 , 这 是 日 
































3-32 status 寄存 器 )。 
































下 面 介绍 ide.c 的 下 半 部 分 ， 见 代码 13-7-2。 





代码 13-7-2 








/* 从 硬盘 读 取 sec_cnt 个 扇 














区 到 buf */ 

















日 mtime_sleep 函数 


AAA 大 








实 busy_wait 的 意思 是 忙 等 待 ， 


们 这 里 虽然 用 busy_wait 来 命名 此 功能 ， 但 本 质 上 我 们 更 
































间接 调 























( project/c13/c/device/ide.c ) 











































































































































































































般 忙 等 


于 


竺 都 是 指 CPU 

















了 thread_yield 函数 实现 的 。 


void ide readl(struct disk* hd, uint32 t lba, void* buf，uint32 七 sec_cnt) { 
ASSERT (lba <= max lba); 
ASSERT (sec cnt > 0); 
lock acquire (&hd->my channel->lock); 
/* 1 先 选择 操作 的 硬盘 */ 
select _ qisk (hd) ; 
uint32 t secs_op; // 每 次 操作 的 扇 区 数 
uint32 t secs done = 0; // 已 完成 的 扇 区 数 
while(secs done < sec cnt) { 
if ((secs done + 256) <= sec cnt) { 
secs op = 256; 
} else { 
secs op = sec cnt - secs done; 
} 
/* 2 写 入 待 读 入 的 扇 区 数 和 起 始 扇 区 号 */ 
select sector(hd, lba + secs done, secs op); 
/* 3 执行 的 命令 写 入 reg_cmd 寄存 器 */ 
cmd_out (hd->my_channe1， CMD_READ_SECTOR) ; // 准 备 开 始 读数 据 
/类 太 大火 炎炎 炎炎 大大 类 大 类 类 类 类 大 类 大 大 大 阻塞 己 的 二 机 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 
在 硬盘 已 经 开始 工作 ( 开始 在 内 部 读数 据 或 写 数 据 ) 后 才能 阻塞 自己 ， 
现在 硬盘 已 经 开始 忙 了 ， 
将 自己 阻塞 ， 等 待 硬盘 完成 读 操 作 后 通过 中 断 处 理 程序 唤醒 自己 */ 
sema down (&hd->my_ channel->disk done); 
/类 太 大业 炎炎 类 炎炎 炎炎 炎炎 类 类 类 类 类 大 类 类 类 大 类 大大 类 类 大 类 类 大 类 类 类 大 类 类 大 大 类 大 类 类 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 了 
/* 4 检测 硬盘 状态 是 否 可 读 */ 
/* 醒 来 后 开始 执行 下 面 代码 */ 
if (lbusy wait (hd)) { // 若 失 败 
char error[64]; 
sprintf(error, "gs read sector %d failed!!!!!!l\n", hd->name, lba); 


PANIC (error); 
} 


/* 5 把 数据 从 硬盘 的 缓冲 
read from sector (hda， 
secs_op); 
secs done += secs_op; 











区 中 读 出 */ 





} 


lock release(&hd->my channel->lock); 














/* 将 buf 中 sec cnt 


ASSERT (lba <= max lba); 
ASSERT (sec cnt > 0); 
lock acquire 


/* 1 先 选 择 操 作 的 硬盘 */ 
select disk (hd); 


uint32 t secs op; 
uint32 t secs done = 
whilel(secs done < sec cnt) 


if ((secs done + 256) 
secs op = 256; 
} else { 


区 数据 写 入 硬盘 */ 


void ide writel(struct disk* hd, 


























{ 


<= sec cnt) { 


EE 
uint32t lbay void* 
(ghd->my_channel->lock); 
// 人 皇 次 操作 的 扇 区 数 
0; // 已 完成 的 扇 区 数 








(void*) ((uint32 t)buf + secs done * 512),\ 


buf, 


uint32 七 sec cnt) { 
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第 13 章 编写 硬盘 驱动 程序 
180 secs op = sec cnt - secs done; 
十 8: } 
182 
183 /* 2 写 入 待 写 入 的 扇 区 数 和 起 始 扇 区 号 */ 
184 select sector(hd, lba + secs done, secs op); 
185 
186 /* 3 执行 的 命令 写 入 reg_cmd 寄存 器 
87 cmd out (hd->my_ channel, CMD ea SOLO 
// 准备 开始 写 数据 
188 
189 /* 4 检测 硬盘 状态 是 否 可 读 */ 
190 if (lbusy wait (hd)) { // 若 失败 
91 char error[64]; 
192 sprintf(error, "%s write sector %d failed!!!!!!\n", hd->name, lba); 
193 PANIC (error); 
194 } 
195 
196 /* 5 将 数据 写 入 硬盘 */ 
197 write2sector(hd, (void*) ((uint32 t)buf + secs done * 512), secs op); 
198 
199 /* 在 硬盘 响应 期 间 阻塞 自己 */ 
200 sema down (&hd->my_ channel->disk done); 
201 secs done += secs op; 
202 } 
203 /* 醒 来 后 开始 释放 锁 */ 
204 lock release(&hd->my channel->lock); 
205 } 
206 
207 /* 硬盘 中 断 处 理 程序 */ 
208 void intr hd handler (uint8 t irq no) { 
2.09 ASSERT (irgq no == 0x2e | irq no == 0x2f); 
210 uint8t ch no = irg no - Ox2e; 
和 21 注 struct ide channel* channel = &channels[ch nol]; 
212 ASSERT (channel->irqg no == irq no); 
213 /* 不 必 担 心 此 中 断 是 否 对 应 的 是 这 一 次 的 expecting intr， 
214 * 每 次 读 写 硬盘 时 会 申请 锁 ， 从 而 保证 了 同步 一 致 性 */ 
2159 if (channel->expecting intr) { 
216 channel->expecting intr = false; 
217 sema up(&channel->disk done); 
218 
219 /* 读 取 状 态 寄存 器 使 硬盘 控制 器 认为 此 次 的 中 断 已 被 处 理 ， 
从 而 硬盘 可 以 继续 执行 新 的 读 写 */ 
220 inbl(reg status (channel)); 
221 } 
222 } 
223 
224 /* 硬盘 数据 结构 初始 化 */ 


261 } 


代码 13-7-2 中 就 介 


上 就 是 之 前 介 


函数 ide_read 接受 4 个 参数 ， 人 硬盘 hd、 启 
hd 的 而 区 地 纪 


void ide _ init () { 


printk ("ide init start\n"); 





/* 处 理 各 


while 





个 通道 上 的 硬盘 */ 


(channel no < channel cnt) { 














register handler (channel->irg no intr hd handler); 


channel nott+; // 下 一 个 channel 


} 
printk 





("ide init done\n".); 





绍 函 数 的 封装 。 














区 地 址 lba、 绥 冲 区 








XxX. buf、 








Ne 





而 保证 一 次 只 操作 同 





在 继续 之 前 还 有 点 事 要 和 大 伙 儿 交待 。 因 为 读 写 扇 
写 最 多 是 255 个 局 区 ( 当 写 入 端口 值 为 0 时 ， 则 写 入 256 个 扇 区 )， 所 以 当 让 
须 拆 分 成 多 次 读 写 操作 。 每 当 完 成 一 个 扇 区 的 读 写 后 ， 此 寄存 器 的 值 便 减 1， 所 以 当 座 
包括 尚未 完成 的 扇 区 数 。 好 啦 ， 可 以 继续 了 。 
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道上 的 一 块 硬盘 。 














志明 
























































让 


止 lba 处 读 取 sec_cnt 个 扇 区 到 buf。 在 第 124 行 ， 操 作 硬 盘 之 前 先 将 硬盘 所 在 的 通 
第 127 行 通过 select_disk(hd) 选 择 待 操作 的 硬 
区 数 端 口 0x1f2 及 0x172 是 8 位 寄存 器 ， 故 每 次 读 





又 数量 


sec_cnt， 功 和 








也 






































盘 。 








绍 了 4 个 函数 ，ide_ read，ide_write，intr_ hd_handler 和 ide_init。 以 几 个 函数 基本 





EE 是 从 硬盘 


道上 锁 ， 从 








卖 写 的 端口 数 超过 256 时 ， 必 


卖 写 失败 时 ， 此 端口 


13.2 ”编写 硬盘 驱动 程 





了 H 








由 于 硬盘 一 次 只 能 操作 256 个 扇 区 ， 为 了 相对 高 效 一 些 ， 咱 们 的 做 法 是 如 果 待 操作 的 扇 区 数 sec_cnt 
大 于 256， 咱 们 尽量 一 次 操作 256 个 扇 区 ， 余 下 不 足 256 扇 区 的 部 分 一 次 性 完成 。 在 第 129 














































































































是 指 每 次 硬盘 操作 的 扇 区 数 ，secs_done 是 操作 完成 的 扇 区 数 。 下 四 









































行 ，secs_op 





| 通过 while 循环 ， 将 sec_cnt 个 扇 区 按 


照 256 个 分 组 来 操作 。 第 132 一 136 行 便 是 按照 以 上 思路 分 组 ， 每 次 操作 secs_op 个 扇 区 ，secs_op 的 值 不 是 








256， 就 是 小 于 256 的 余数 ，secs_op 等 于 256 的 情况 在 0 次 以 上 ， 














操作 的 扇 区 数 secs_op 后 , 在 第 139 行 通过 select_sector 函数 选择 待 操 作 的 肩 区 1 
行 通过 cmd_onut 函数 向 硬盘 发 读 扇 区 命令 。 此 时 硬盘 已 经 开始 工作 了 ， 前 面 说 过 了 ， 硬 盘 是 低速 设备 ， 所 


























































































































以 在 此 期 间 最 好 是 把 CPU 使 用 权 让 出 去 。 出 让 CPU 使 用 权 有 两 种 方式 , 一 种 是 用 thread_block 函数 阻塞 E 
已 执行 。 另 一 种 是 用 thread_yield 主动 交 





























,， 直 到 运行 条 件 成 熟 时 再 运行 ， 也 就 是 由 别人 唤醒 自己 后 再 继续 


























































































































出 CPU， 调 度 器 将 所 有 任务 调度 一 圈 之 后 又 会 让 自己 运行 ， 但 下 次 运行 
1L 备 ， 比 如 此 处 是 硬盘 还 没有 完成 操作 ， 了 驱动 程序 醒 来 后 也 无 所 事 事 ， 还 得 再 将 CPU 让 出 去 ， 因 此 这 


而 小 于 256 的 情况 顶 多 出 现 1 次 。 确 定 
弛 址 及 个 数 , 之 后 在 第 142 




























































































































































































前 的 驱动 程序 就 会 阻塞 ， 在 等 待 便 盘 操作 完成 期 间 开 始 睡觉 了 。 

































































时 ， 非 常 有 可 能 的 是 运行 条 件 疝 

















里 用 thread_block 阻塞 驱动 程序 自己 ， 直 到 条 件 成 熟 时 再 运行 。 这 种 自我 阻塞 是 通过 第 147 行 对 信号 量 执行 
P 操作 完成 的 ， 即 代码 “sema_down(&hd->my_channel->disk done)”。 忆 
醒 呢 ?是 这 样 的 , 硬盘 完成 操作 后 会 发 中 断 信和 号， 后面 介绍 的 硬盘 中 断 处 理 程序 intr_hd_handler 会 在 该 通道 
上 执行 “sema_up(&channel->disk_done)” 从 而 唤醒 当前 的 驱动 程序 。 总 之 ， 第 147 行 的 代码 执行 过 后 





PP 何 时 条 件 成 熟 呢 ?” 也 就 是 何 时 被 唤 











DZ 











当 硬 盘 完 成 操作 后 会 主动 发 中 断 ， 对 应 的 中 断 处 理 程 序 会 将 该 通道 的 信号 量 disk_done 执行 V 操作 ， 即 代 
码 “sema_up(&channel->disk_done)” 从 而 唤醒 驱动 程序 。 驱 动 程序 醒 来 之 后 ， 在 第 152 行 开 始 判断 硬盘 的 状 









































态 ， 这 是 通过 代码 “busy_wait(hd)” 完 成 的 ， 如 果 不 出 现 重 大 硬件 损 

































































务 的 话 ， 通 常情 况 下 这 种 硬盘 操作 不 会 失 


败 , 如 果 失 败 ,八成 也 不 是 咀 们 能 解决 的 ,， 因此 就 将 程序 通过 PANIC 悬 停 。 如 果 成 功 了 ,就 通过 read_from_sector 



































函数 将 扇 区 数据 读 入 到 缓冲 区 (buf+secs_done* $12) 处 ， 随 着 完成 的 扇 区 数 secs_done 越 来 越 多 ,缓冲 区 地 址 也 
会 随 之 偏 移 。 然 后 使 secs_done 加 上 secs_op， 更 新 secs_done。 启 区 都 读 入 后 ， 在 第 162 行 释放 锁 。 


















































下 面 是 函数 ide_write， 它 接受 4 个 参数 ， 人 硬盘 hd、 写 入 硬盘 的 扇 区 地 址 lba、 待 写 入 硬盘 的 数据 所 在 
的 地 址 buf、 待 写 入 的 数据 以 户 区 大 小 为 单位 的 数量 sec_cnt。 功 能 是 
hd 的 lba 扇 区 。ide_write 同 ide_read 的 逻辑 是 相同 的 ， 区 别 是 ide_write 是 将 组 六 
阻塞 的 时 机 也 有 所 不 同 。 对 于 读 硬 盘 来 说 ， 驱 动 程序 阻塞 自己 是 在 硬盘 开始 读 肩 










































































































































































将 buf 中 sec_cnt 扇 区 数据 写 入 硬盘 
区 buf 中 的 数据 写 到 硬盘 ， 
区 之 后 ， 对 于 写 硬盘 来 说 ， 
































驱动 程序 阻塞 自己 是 在 硬盘 开始 写 肩 区 之 后 。 总 之 ,阻塞 的 时 机 一 定 是 在 硬盘 开始 真正 忙活 之 后 的 那 段 “ 漫 


























长 ”的 时 间 里 。 其 他 方面 同 ide_read 类 似 ， 不 再 闭 述 。 









































接着 是 函数 intr_ hd_handler， 这 是 硬盘 中 断 处 理 程序 ， 参 数 是 

















个 通道 的 中 断 , 因此 irq_no 要 么 等 于 0x2e, 要 么 等 于 0x2f, 它们 分 另 






































接口 。 由 于 有 两 个 通道 ， 在 第 210 行 先 获 取 中 断 所 属 的 通道 号 ， 直 接 用 
差 便 是 中 断 通道 在 通道 数组 channels 中 的 索引 值 。 大 多 数 情况 下 ,硬盘 发 生 中 断 通常 是 由 之 站 
出 了 操作 命令 引起 的 ， 这 是 咱们 主动 使 其 发 中 断 的 方式 ， 之 前 咱们 也 说 过 了 ， 为 避免 无 法 分 清 中 断 信号 来 
习 同 一 通道 上 的 哪 块 硬盘 ， 虽 们 在 主动 操作 硬盘 时 申请 了 通道 上 的 锁 ， 因 此 ， 如 果 通 道 发 生 





































































































































































































中 断 号 irq_no。 此 中 断 处 理 程序 负责 两 
| 是 从 片 8259A 的 IRQ14 接口 和 IRQ15 
断 号 irq_no 减 去 0x2e， 所 得 的 





























和 咱们 对 其 发 







































































它 只 会 是 由 最 近 一 次 操作 的 硬盘 引起 的 ， 并 不 会 是 之 前 某 次 操作 的 硬盘 发 出 的 。 在 通过 
向 硬盘 发 号 施 令 时 , 我 们 会 将 通道 的 channel->expecting_intr 置 为 true,， 也 就 是 宣称 此 通道 正 期 竺 中断 的 来 





了 中 断 信和 号， 





cmd_out 函数 主动 




























































































序 中 要 判断 channel->expecting_intr 的 值 是 否 为 true， 毕竟 这 种 硬盘 中 





























断 才 是 我 们 期 待 的 《而 不 是 





硬盘 自 检 出 了 问题 ， 通 过 中 断 发 出 了 某 种 警告 ， 这 种 情况 咱们 和 暂 不 处 理 )。 如 果 channel->expec 






































临 ， 这 是 给 硬盘 中 断 处 理 程序 看 的 ， 也 就 是 之 前 所 说 的 为 中 断 处 理 函数 埋 下 的 “伏笔 ”” 因此 ， 在 中 断 处 理 程 























其 他 情况 ， 如 
ting_intr 的 值 





为 ttue， 将 其 置 为 false( 置 为 true 是 cmd_out 的 职责 )， 然 后 给 通道 的 信号 量 disk_done 执行 V 操作 ， 即 代 
























































码 “sema_up(&channel->disk_done);” 这 样 ， 阻 塞 在 此 信号 量 上 的 驱动 程序 便 会 醒 来 。 


































































































断 处 理 完成 后 ， 需 要 显 式 通知 硬盘 控制 器 此 次 中 断 已 经 处 型 











完成 》 否则 硬盘 便 不 会 P 

















这 也 是 为 了 保证 数据 的 有 效 性 和 安全 性 。 硬 盘 控制 器 的 中 断 在 下 列 








e 读 取 了 status 寄存 器 。 





情况 下 会 被 清 掉 。 


让 








生 新 的 中 断 ， 
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e 发 出 了 reset 命令 。 

。 或 者 又 向 reg_cmd 写 了 新 的 命令 。 

我 们 采取 第 1 种 方法 ， 再 读 一 次 status 寄存 器 ， 也 就 是 第 220 行 的 代码 “inb(reg_status(channel));”。 

最 后 在 第 257 行 ， 我 们 把 硬盘 中 断 处 理 程序 在 ide_init 中 完成 注册 。 至 此 ， 我 们 硬盘 驱动 算是 完成 了 ， 
本 节 到 此 为 止 ， 下 节 我 们 要 做 点 具体 的 事实 战 啦 。 
















































































13.2.5 ”获取 硬盘 信息 ， 扫 描 分 区 表 


我 想 大 伙 儿 已 经 有 些 迫 不 及 待 想 试 斌 硬盘 驱 动 程序 了 ,本 节 该 是 检验 它们 的 时 候 了 ,咱们 用 两 件 工作 
来 验证 ， 一 是 向 硬盘 发 identify 命令 获取 硬盘 的 信息 ， 二 是 扫描 分 区 表 。 

identify 命令 是 0xec， 它 用 于 获取 硬盘 的 参数 ， 不 过 奇怪 的 是 此 命令 返回 的 结果 都 是 以 字 为 日 位 ， 并 
不 是 字 节 ， 这 一 点 要 注意 。 咱 们 只 是 来 验证 驱动 程序 ， 因 此 表 13-8 中 只 列 出 了 咀 们 用 到 的 三 个 参数 ， 更 
多 的 参数 请 见 ata 手册 。 


















































































































































































































































表 13-8 identify 命令 获得 的 返回 信息 ( 部 分 ) 
字 偏 移 量 描述 
10~19 硬盘 序列 号 ， 长 度 为 20 的 字符 串 
27 一 46 硬盘 型 号 ， 长 度 为 40 的 字符 串 
60~61 可 供用 户 使 用 的 扇 区 数 ， 长 度 为 2 的 整 型 












































分 区 表 扫 描 的 工作 稍微 复杂 一 些 ， 根 据 “ 图 13-17 分 区 布局 汇总 ” 咱们 需要 以 MBR 引导 扇 区 为 入 口 ， 
遍历 所 有 主 分 区 ， 然 后 找到 总 扩展 分 区 ， 在 其 中 递归 遍历 每 一 个 子 扩 展 分 区 ， 找 出 逻辑 分 区 。 由 于 涉及 到 
分 区 的 管理 , 因此 我 们 得 给 每 个 分 区 起 个 名 字 , 简单 起 见 , 最 好 咱们 借鉴 现成 的 Linux 设备 命名 方案 。Linux 
中 所 有 的 设备 都 在 /dev/ 目 录 下 ,硬盘 命名 规则 是 [xJd[y][n]， 其 中 只 有 字母 d 是 固定 的 ， 其 他 带 中 括号 的 字 
符 都 是 多 选 值 ， 下 面 从 左 到 右 介绍 各 个 字符 。 

x 表示 硬盘 分 类 ， 硬 盘 有 两 大 类 ，IDE 磁盘 和 SCSI 磁盘 。h 代表 IDE 磁盘 ，s 代表 SCSI 磁盘 ， 故 x 
取 值 为 h 和 s。 

d 表示 disk， 即 磁盘 。 

y 表示 设备 号 ， 以 区 分 第 几 个 设备 ， 取 值 范围 是 小 写字 符 ， 其 中 a 是 第 1 个 硬盘 ，b 是 第 2 个 硬盘 ， 
依次 类 推 。 

n 表示 分 区 号 ， 也 就 是 一 个 硬盘 上 的 第 几 个 分 区 。 分 区 以 数字 1 开始 ， 依 次 类 推 。 

综 上 所 述 ，sda 表示 第 1 个 SCSI 硬盘 ，hdc 表示 第 3 个 IDE 硬盘 ，sdal 表示 第 1 个 SCSI 硬盘 的 第 1 
个 分 区 ，hdc3 表示 第 3 个 IDE 硬盘 的 第 3 个 分 区 。 咱 们 这 里 统一 用 SCSI 硬盘 的 命名 规则 来 命名 虚拟 硬盘 
hd60M.img 和 hd80M.img。 其 中 hd60M.img 为 sda，hd80M.img 为 sdb。hd60M.img 是 裸 盘 ， 没 有 文件 系统 和 
分 区 ， 因 此 咱们 只 处 理 hd80M.img， 将 其 上 的 主 分 区 占据 sdb[1 一 和， 逻辑 分 区 占据 sdb[S 一 ]。 

好 啦 ， 现 在 上 代码 ， 先 看 ide.c 的 前 半 部 分 ， 见 代码 13-8-1。 


代码 13-8-1 (project/c13/d/device/ide.c ) 
































































































































































































































































































































































































































































































































48 /* 用 于 记录 总 扩展 分 区 的 起 始 lba， 初 始 为 0，partition_scan 时 以 此 为 标记 */ 
49 int32 七 ext lba base = 0; 
































50 

51 uint8t pno=0, 1no= 0; // 用 来 记录 硬盘 主 分 区 和 逻辑 分 区 的 下 标 
52 

53 struct list partition list; // 分 区 队列 

54 
































55 /* 构建 一 个 16 字 节 大 小 的 结构 体 ， 用 来 存 分 区 表 项 */ 
56 struct partition table entry { 











57 uint8 t bootable; // 是 否 可 引导 
58 uint8 t start head; // 起 始 磁头 号 
59 uint8 七 start sec; // 起 始 扇 区 号 
60 uint8 七 start chs; // 起 始 柱 面 号 
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61 uint8 七 fs type; // 分 区 类 型 

62 uint8 t end head; // 结束 磁头 号 

63 uint8 t end sec; // 结束 扇 区 号 

64 uint8 七 end chs; // 结束 柱 面 号 

65 /* 更 需要 关注 的 是 下 面 这 两 项 */ 

66 uint32 t start lba; // 本 分 区 起 始 扇 区 的 lpba 地 址 
67 uint32 七 sec cnt; // 本 分 区 的 扇 区 数 

68 } _ attribute  ((packed)); // 保证 此 结构 是 16 字 节 大 小 
69 























70 /* 引导 扇 区 ，mbz 或 ebr 所 在 的 扇 区 */ 
71 struct boot_ sector { 






















































































72 uint8 t other[446]; // 引导 代码 
73 struct partition table entry partition table[4]; 
// 分 区 表 中 有 4 项 ， 64 字 节 
74 uint16 t signature; // 启动 扇 区 的 结束 标志 是 0x55, 0xaa, 
75 } attribute  ((packed)); 
… 略 
236 /* 将 dst 中 len 个 相 邻 字 节 交换 位 置 后 存 入 puf */ 
237 s static void swap pairs bytes(const char* dst, char* puf, uint32 t len) { 
238 uint8 七 idx; 
239 for (idx = 0; idx < len; idx += 2) { 
240 /* buf 中 存储 dst 中 两 相 邻 元 素 交 换 位 置 后 的 字符 串 */ 
241 but [idx 4 1] = SS 蕊 二 二 
242 buf[idx] = *dst++; 
243 上 
244 buflidxl = TNOT77 
245 } 
246 
247 /* 获得 硬盘 参数 信息 */ 
248 static void identify disk(struct disk* hd) { 
249 Char.Lo TnfoL512] 
250 select disk (hd) ; 
251 cmd out (hd->my channel, CMD IDENTIFY); 



































252 /* 向 硬盘 发 送 指令 后 便 通过 信号 量 阻 塞 自己 ， 



















































































253 ”* 待 硬盘 处 理 完 成 后 ， 通 过 中 断 处 理 程序 将 自己 唤醒 */ 

254 sema down (&hd->my_ channel->disk done); 

255 

256 /* 醒 来 后 开始 执行 下 面 代码 */ 

257 if (!busy wait (hd)) { //” 若 失败 

258 char error[64]; 

259 sprintf(error, "ss identify failed!!!!!!\n", hd->name); 
260 PANIC (error); 

261 } 

262 read from sector(hd, id info, 1); 

263 

264 char buf[64]; 

265 uint8t sn start = 10 * 2, sn len = 20, md start = 27 * 2, md len = 40; 
266 swap_ pairs bytes(&id info[sn start], buf, sn len); 

267 从 谋生 守 攻 度 A disk %s info:\n SN: Ss\n", hd->name, buf); 
268 memset (buf, 0, sizeof (buf));} 

269 swap_ pairs bytes(&id info[md start], buf, md len); 

270 printk(" MODULE: %Ss\n", buf); 

27 uint32 t sectors = *(uint32 t*)&id info[60 * 2]; 

272 printk(" SECTORS: %d\n", sectors); 

273 printk(" CAPACITY: %dMB\n", sectors * 512 / 1024 / 1024); 
274 } 


























代码 开头 先 定义 了 一 些 数据 ， 挑 重点 说 一 下 。ext_lba_base 是 用 在 分 区 表 扫 描 函 数 partition_scan 中 的 ， 此 






































变量 有 两 个 作用 , 一 是 作为 扫描 分 区 表 的 标记 , partition_scan 知 发 现 ext_lba_base 为 0 便 知 道 这 是 第 一 次 扫描 ， 






































因此 初始 为 0。 另 外 就 是 用 于 记录 总 扩展 分 区 地 址 ， 那 时 肯定 就 不 为 0 了 。Ppartition_list 是 所 有 分 区 的 列表 。 
区 表 项 











接 下 来 的 partition_table_entry 是 分 区 表 项 ， 即 分 区 表 中 的 每 个 分 区 项 ， 它 是 按照 “ 表 13-1 分 
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_attribute ”是 gcc 特有 的 关键 字 ， 用 于 告诉 gcc 在 编译 时 需要 做 些 “特殊 处 理 ”，packed 就 是 “特殊 处 到 




















结构 ”定义 的 。 在 结构 定义 结束 处 有 个 “__attribute  ((packed))” 这 是 编译 器 gcc 提供 的 属性 定义 ， 
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性 


意 为 压缩 的 ， 即 不 允许 编译 器 为 对 齐 而 在 此 结构 中 填充 空 除 ， 从 而 保证 结构 partition_table_entry 的 大 小 是 











和 





16 字 节 ， 这 与 分 区 表 项 的 大 小 是 吻合 


o 





























下 一 个 是 引导 扇 区 结构 体 boot_sector， 成 员 other 大 小 是 446 字 节 ， 其 内 容 是 引导 代码 ， 但 这 并 
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不 重要 ， 它 在 这 里 只 是 用 来 占 位 ， 因 为 在 引导 局 区 中 偏 移 446 字 节 的 地 方才 是 分 区 表 ， 目 的 是 让 下 面 







































































的 分 区 表 partition_table 位 置 正确 ，partition_table 是 个 数组 ， 数 组 元 素 是 “struct partition_table_entry” 共 














4 个 元 素 ， 即 总 大 小 64 字 节 。signature 是 魔 数 ， 类 型 是 uint16_t， 即 大 小 是 2 字 节 ， 它 是 启动 扇 区 的 结束 标 
志 0x55, 0xaa,， 占 两 个 字 节 , 最 后 一 个 字 节 是 0xaa。 由 于 x86 是 小 端 字 节 序 , 故此 处 变量 的 实际 值 为 0xaa55。 
这 三 个 成 员 加 起 来 总 共 大 小 是 512 字 节 ， 最 后 也 用 “__attribute _((packed))” 严 格 保证 512 字 节 大 小 。 

也 许 您 会 疑问 , 为 什么 以 上 两 个 结构 要 严格 限制 大 小 ?因为 我 们 要 用 它们 来 读 入 严格 大 小 的 数据 ， 这 

































































样 方 便 编程 ， 





会 您 就 知道 了 。 








函数 swap_pairs_bytes 接受 3 个 参数 ， 目 标 数据 地 址 dst、 组 冲 区 buf、 数 据 长 度 ln， 功能 是 将 dst 中 


len 个 相 邻 字 

















节 交 换 位 置 后 存 入 buf，buf 是 dst 最 终 转换 的 结果 。 此 函数 用 来 处 理 identify 命令 的 返回 信息 ， 















































硬盘 参数 信息 是 以 字 为 单位 的 ， 包 括 偏 移 、 长 度 的 单位 都 是 字 ， 在 这 16 位 的 字 中 ， 相 邻 字 符 的 位 置 是 互 
换 的 ， 所 以 通过 此 函数 做 转换 。 

identify_disk 函数 接受 1 个 参数 ， 硬 盘 hd。 功 能 是 向 硬盘 发 送 identify 命令 以 获得 硬盘 参数 信息 。 函 
数 体 中 定义 了 数组 id_info， 用 来 存储 向 硬盘 发 送 identify 命令 后 返回 的 硬盘 参数 。 




































































第 250 行 先 通过 select_disk(hd) 选 择 硬盘 ， 接 着 通过 cmd_out 函数 向 硬盘 发 送 了 CMD_IDENTIFY 命 




































































令 后 ， 此 时 硬盘 开始 工作 ， 然 后 调用 sema_down 阻塞 自己 。 待 当前 任务 被 唤醒 后 ， 调 用 “busy_wait(hd)” 























判断 硬盘 状态 ， 如 果 成 功 了 ， 调 用 read_from_sector 从 硬盘 获取 信息 到 id_info。 







































































此 时 id_info 中 已 经 是 硬盘 的 参数 信息 了 ， 接 下 来 开始 打印 它们 。 第 264 行 的 数组 buf 是 缓冲 区 ， 是 给 
swap_pairs_bytes 使 用 的 , 用 于 存储 转换 的 结果 。 第 265 行 的 sn_start 表示 序列 号 起 始 字 节 地 址 ， 其 值 为 10 * 2， 




































































10 表示 字 偏 移 量 ， 可 见 表 13-2。md_start 表示 型 号 起 始 字 节 地 址 ， 其 值 为 27 * 2，27 表示 字 偏 移 量 。 调 用 








swap_pairs_bytes 函数 后 ，buf 中 已 经 是 字 节 两 两 交换 的 结果 ， 接 着 在 第 267 行 输出 序列 号 ， 后 面 的 输出 同 到 
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下 面 看 ide.c 的 下 半 部 分 ， 见 代码 13-8-2。 


277 stat 


代码 13-8-2 (project/c13/d/device/ide.c ) 








276 /* 扫描 硬盘 hd 中 地 址 为 ext 1ba 的 扇 区 中 的 所 有 分 区 */ 











ic void partition scan(struct disk* hd, uint32 t ext lba) { 
struct boot sector* bs = sys malloc(sizeof(struct boot sector)); 
ide read(hd, ext lba, bs, 1); 

uint8 t part idx = 0; 

struct partition table entry* p = bs->partition table; 











/* 遍历 分 区 表 4 个 分 区 表 项 */ 
while (part idx++ < 4) { 

if (p->fs type == 0x5) // 若 为 扩展 分 区 
if (ext lba base != 0) { 









































287 /* 子 扩 展 分 区 的 start_lba 是 相对 于 主 引 导 扇 区 中 的 总 扩展 分 区 地 址 */ 


// ext_lba base 为 0 表示 是 第 一 次 读 取 引导 块 ， 也 就 是 主 引 导 记 录 所 在 的 扇 区 
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partition scan(hd, p->start lba + ext lba base); 
} else { 


















































/* 记录 下 扩展 分 区 的 起 始 1ba 地 址 ， 

后 面 所 有 的 扩展 分 区 地 址 都 相对 于 此 */ 
ext_ lba base = p->start lba; 
partition scan(hd, p->start lba); 



























































} else if (p->fs type != 0) { // 若是 有 效 的 分 区 类 型 
if (ext lba == 0) { // 此 时 全 是 主 分 区 
hd->prim parts[p no]l.start_ lba = ext lba + p->start lba; 


hd->prim parts[p nol] .sec cnt = p->sec cnt; 
hd->prim parts[p no] .my disk = hd; 
list append(&partition list, &hd->prim parts[p nol] .part tag); 
sprintf (hd->prim parts[p no] .name, \ 
"ssd"y hd->nameyr "pno. + 1}3 
pP_not+t+; 
ASSERT(p no < 4); VA A Pe We 
} else { 
hd->logic parts[l1 no] .start lba = ext lba + p->start lba; 
hd->logic parts[l1 nol].sec cnt = p->sec cnt; 







































































































































































































































































































































































306 hd->logic parts[1 no] .my disk = hd; 
307 list append(&partition list, &hd->logic parts[l1 no]l .Part tag); 
308 sprintf (hd->logic parts[l1 no] .name, \ 

"ss%d", hd->name, 1 no + 5); 

// 逻辑 分 区 数字 从 5 开始 ， 主 分 区 是 1~4 
309 1_not+; 
LO if (1 no >= 8) // 只 支持 8 个 逻辑 分 多， 避免 数组 越界 
3 return; 
312 } 
313 } 
314 p++} 
3 二 5 } 
316 sys_free (bs); 
:i 
318 
319 /* 打印 分 区 信息 */ 
320 static bool partition info(struct list elem* pelem, int arg UNUSED) { 
321 struct partition* part = elem2entry(struct partition, part tag, pelem); 
322 printk(" $s start lba:0Oxsx, sec cnt:0x%x\n",\ 

part->name, part->start lba, part->sec cnt);} 
323 
324 /* 在 此 处 return false 与 函数 本 身 功 能 无 关 ， 
325 ” * 只 是 为 了 让 主 调 函数 1ist_ traversal 继续 向 下 遍历 元 素 */ 
326 return false; 
327 .1 
… 略 
347 /* 硬盘 数据 结构 初始 化 */ 
348 void ide init () { 
> printk ("ide init start\n"); 
383 /* 分 别 获取 两 个 硬盘 的 参数 及 分 区 信息 */ 
384 while (dev no < 2) { 
385 struct disk* hd = &channel->devices[dev nol]; 
386 hd->my_channel = channel; 
387 hd->dev no = dev no; 
388 sprintf(hd->name, "sd%c", 'a' + channel no * 2 + dev no); 
389 identify disk (hd); // 获取 硬盘 参数 
390 if (dev no != 0) { // 内 核 本 身 的 裸 硬盘 ( hd60M. img ) 不 处 理 
391 partition scan (hd，0); // 扫描 该 硬盘 上 的 分 区 
3.92 } 
393 pno= 0, 1no= 0; 
394 dev_not++; 
395 } 
396 dev no = 0; 
// 将 硬盘 驱动 器 号 置 0， 为 下 一 个 channel 的 两 个 硬盘 初始 化 

397 channel not++; // 下 一 个 channel 
398 } 
3.99 
400 printk("\n all partition info\n"); 
401 /* 打印 所 有 分 区 信息 */ 
402 list traversal(&partition list, partition info (int)NULL); 
403 printk ("ide init done\n"); 
404 } 

函数 partition_scan 接受 2 个 参数 ,硬盘 hd 和 扩展 扇 区 地 址 ext_lba。 功 能 是 扫描 硬盘 hd 中 地 址 为 ext_lba 
的 局 区 中 的 所 有 分 区 。 

每 个 子 扩展 分 区 中 都 有 1 个 分 区 表 ， 因 此 函数 partition_scan 需要 针对 每 一 个 子 扩展 分 区 递归 调用 ， 每 调用 
一 次 ， 都 要 用 1 扇 区 大 小 的 内 存 来 存储 子 扩展 分 区 所 在 的 扇 区 ， 即 MBR 引导 扇 区 或 EBR 引导 扇 区 。 注 意 ， 由 
于 是 递归 调用 ， 每 次 函数 未 退出 时 又 进行 了 函数 调用 ， 这 会 导致 栈 中 原 函 数 的 局 部 数据 不 释放 ， 并 且 会 在 栈 中 
生成 新 的 局 部 变量 ， 尤 其 是 局 部 变量 很 大 时 ， 这 种 递归 调用 会 使 栈 的 内 存 空间 消耗 量 很 大 ， 因 此 用 于 存储 分 区 
表 扇 区 的 内 存 绝对 不 能 用 局 部 变量 。 比 如 咱们 刚刚 在 identify_disk 函数 中 定义 的 “char id_info[512]” 就 是 局 部 
变量 ， 局 部 变量 占用 的 是 栈 空 间 ， 随 着 子 扩展 分 区 的 增多 ， 每 次 调用 partition_scan 扫描 分 区 时 都 要 在 栈 中 占用 
512 字 节 的 内 存 ， 分 区 一 多 ， 递 归 调用 时 栈 就 会 溢出 了 。 咱 们 的 栈 加 上 PCB 总 共 是 4096 字 节 ， 除 了 PCB 外 ， 
栈 中 也 就 是 顶 多 容纳 7 个 扇 区 ， 再 加 上 栈 中 已 经 用 了 一 部 分 空间 ， 因 此 顶 多 递归 6 次 ， 第 7 次 就 会 使 栈 溢出 。 





为 避免 这 种 情况 , 我们 在 函数 体 姑 
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278 行 用 sys_malloc 动态 申请 struct boot_sector 大 小 的 内 存 (1 


593 





第 13 章 ”编写 硬盘 驱动 入 


扇 区 大 小 ) 来 存储 分 区 表 所 在 的 扇 区 ,返回 地 址 存储 在 指针 bs。 第 279 行 通过 ide_read 读 入 1 扇 区 的 数据 
到 bs 指向 的 内 存 。 之 前 我 们 在 定义 struct boot_sector 时 用 “attribute __”((packed))” 严 格 限制 了 结构 体 大 
小 ， 因 此 在 第 281 行 ， 可 以 通过 “bs->partition_table ”获得 分 区 表 地 址 ， 并 返回 给 分 区 表 项 指针 p。 
此 时 p 指向 分 区 表 数 组 , 在 第 284 行 起 , 利用 指针 p 遍历 所 有 分 区 表 项 。 如 果 分 表 表 项 类 型 p->fs_type 
为 0x5， 这 说 明 是 扩展 分 区 ， 意 味 着 要 递归 调用 partition_scan。 前 面 说 过 ext_lba_base 有 两 个 作用 ， 就 体现 
在 第 286 一 293 行 的 条 件 判断 中 。 先 看 第 289 行 的 else 分 支 ， 它 表示 ext_lba_base 为 0， 这 说 明 这 是 第 一 次 调 
用 partition_scan， 此 时 获取 的 是 MBR 引导 扇 区 中 的 分 区 表 ， 需 要 记录 下 总 扩展 分 区 的 起 始 lba 地 址 ， 因 为 
后 面 所 有 的 子 扩展 分 区 地 址 都 相对 于 此 。 于 是 在 第 291 行 用 p->start_lba 为 ext_lba_base 赋值 ， 因 此 现在 
ext_lba_base 是 总 扩展 分 区 地 址 ， 不 再 为 0。 接 着 在 第 292 行 用 p->start_lba 即 总 扩展 分 区 起 始 地 址 作为 参数 
继续 调用 partition_scan。 现 在 回去 看 第 286 行 ， 如 果 ext_lba_base 不 为 0， 这 说 明 已 不 是 第 1 次 递归 调用 ， 
此 时 所 获取 的 分 区 表 是 EBR 引导 扇 区 中 的 ， 子 扩展 分 区 的 起 始 鹿 区 地 址 是 相对 于 主 引导 扇 区 中 的 总 扩展 分 
区 地 址 ext_lba_base， 因 此 下 面 第 288 行 用 “p->start_lba + ext_lba_base” 作 为 partition_scan 的 参数 继续 调用 。 
以 上 代码 片段 是 处 理 扩展 分 区 的 情况 ,在 第 294 行 之 后 便 是 处 理 主 分 区 或 逻辑 分 区 。 分 区 类 型 (文件 
系统 类 型 ) 若 为 0， 则 表示 empty， 即 无 效 的 分 区 类 型 ， 因 此 在 第 294 行 判断 ， 只 要 分 区 类 型 p->fs_type 
不 等 于 0， 就 认为 是 有 效 的 分 区 。 如 果 partition_scan 的 参数 ext_lba 为 0， 说 明 当 前 是 MBR 引导 分 区 ， 
此 此 时 的 分 区 表 中 除了 主 分 区 就 是 总 扩展 分 区 , 扩展 分 区 已 经 在 上 面 代 码 片 段 中 处 理 过 了 ， 因 此 此 时 的 分 
区 必然 是 主 分 区 。 接 着 在 第 296 一 298 行将 主 分 区 的 信息 收录 到 硬盘 hd 的 prim_parts 数组 中 。 第 299 行将 
分 区 加 入 到 分 区 列表 partition_list 中 。 第 300 行 ， 通 过 sprintf 函数 拼接 字符 串 为 主 分 区 命名 ， 主 分 区 名 称 
从 1 起 ， 如 sdal。 第 303 行 之 后 是 处 理 逻 辑 分 区 的 代码 ， 同 主 分 区 类 似 ， 不 再 歼 述 。 

下 个 函数 是 partition_info， 它 的 功能 是 打印 分 区 信息 ， 此 函数 被 用 在 list_traversal 中 作为 回调 函数 调 
用 ， 必须 有 2 个 参数 ,但 我 们 只 用 到 分 区 标记 pelem， 所 以 第 2 个 参数 arg 我 们 用 UNUSED 来 修饰 ， 表 示 
未 使 用 。UNUSED 是 个 宏 ， 定义 在 global.h 中 :“#define UNUSED _ attribute _((unused))” 也 是 利用 gcc 
提供 的 属性 unused 实现 的 。 函 数 实现 很 简单 ， 不 说 了 。 
接 下 来 要 把 函数 identify_disk 和 partition_scan 加 入 到 ide_init 中 ， 这 分 别 是 第 389 行 和 第 391 行 完 成 
的 。 接 着 在 第 402 行 调 用 list_traversal 打印 所 有 分 区 信息 。 

编译 运行 ， 结 果 如 图 13-24 所 示 。 
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syscall_init done 
ide_init start 
disk sda info: 
SN: BxHDO00011 
MODULE: Generic 1234 
SECTORS: 121968 
ChPhACITY: 59MB 
isk sdb info: 
SN: BXHDO0012 
MODULE: Generic 1234 
SECTORS: 163296 
CAPACITY: ?79MB 


all partition info 

sdb1 start_lba:Qx3F, sec_cnt:Qx?DC1 
sdb5 start_lba:Qx?E3F, sec_cnt:Qx46A1 
sdbb start_lba:QxC51F, sec_cnt:Qx6231 
sdb? start_lba:Qx127?8F, sec_cnt:Qx3AD1 
sdb8 start_lba:Qx1629F, sec_cnt:Qx?5E1 
sdb9 start_lba:Qx1iD8BF, sec_cnt:QxAS5Z1 

ide_init done 


CTRL + 3rd button enables mouse | | | | | | | | | | | 

4 图 13-24 硬盘 及 分 区 信息 

大 伙 儿 可 以 和 图 13-24 中 的 分 区 信息 对 比 一 下 ， 结 果 是 一 样 的 。 

好 啦 ， 经 过 漫长 的 前 期 工作 ， 驱 动 程序 算是 完成 了 ， 下 一 章 咀 们 开始 文件 系统 的 实现 。 
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本 章 开始 咀 们 要 实现 文件 系统 ， 这 涉及 到 文件 描述 符 、i 结 点 等 概念 ， 内 容 较 多 ， 工 作 量 较 大 ， 难 度 
较 高 …… 工 作 量 有 点 大 倒是 真 的 ， 难 度 没 有 ， 对 大 家 来 说 只 是 体力 活 。 待 文件 系统 完成 后 ， 虽 们 就 可 以 在 
磁盘 上 加 载 用 户 程序 了 。 


文件 系统 概念 简介 


在 实现 文件 系统 之 前 ， 咱 们 要 介绍 文件 系统 中 几 个 重要 的 概念 。 咱 们 先 了 解 下 Linux 中 是 怎么 管理 文 
件 的 。 尽 管 是 参照 Linux 文件 系统 ， 但 不 可 能 是 原样 照搬 过 来 ， 否 则 您 直接 看 Linux 源码 不 就 行 了 ^ ^。 咱 
们 的 目的 是 用 最 少 的 代码 介绍 清楚 内 核 的 原理 ， 只 要 了 解 操 作 系统 的 核心 思路 就 行 了 。 再 说 ，Linux 太 庞 
大 了 ， 小 弟 不 可 能 赁 一 已 之 力 全 部 消化 ， 而 且 作 为 一 个 成 熟 的 操作 系统 ，Linux 的 强大 是 在 管理 方面 ， 管 
理 策略 占 了 整个 系统 的 95% 以 上 ， 而 咱们 只 做 5% 以 内 的 事 。 


14.1.1 inode、 间 接 块 索引 表 、 文 件 控制 块 FCB 简介 


硬盘 是 低速 设备 ， 其 读 写 单位 是 扇 区 ,为 了 避免 频繁 访问 硬盘 ,操作 系统 不 会 有 了 一 扇 区 数据 就 去 读 
写 一 次 磁盘 ， 往 往 等 数据 积 斤 到 “足够 大 小 ”时 才 一 次 性 访问 硬盘 ， 这 足够 大 小 的 数据 就 是 块 ， 硬 盘 读 写 
单位 是 扇 区 ， 因 此 一 个 块 是 由 多 个 扇 区 组 成 的 ， 块 大 小 是 扇 区 大 小 的 整数 倍 。 在 Windows 中 ， 块 被 称 为 
徐 ， 比 如 在 Windows 中 格式 化 分 区 时 ， 若 选择 文件 系统 类 型 为 FAT32， 我 们 还 可 以 选择 多 种 不 同 大 小 的 
复 ， 有 4KB、32KB 等 。 以 下 为 叙述 方便 ， 一 律 统称 为 块 。 块 是 文件 系统 的 读 写 单位 ， 因 此 文件 至 少 要 占 
据 一 个 块 ， 当 文件 体积 大 于 1 个 块 时 ,文件 肯定 被 拆 分 成 多 个 块 来 存储 ， 那 么 问题 来 了 ， 这 多 个 块 该 如 何 
组 织 到 一 起 ? 现在 要 讨论 文件 的 组 织 方式 了 。 拿 FAT 文件 系统 来 说 ，FAT 称 为 文件 分 配 表 ， 在 此 文件 系统 
中 存储 的 文件 ， 其 所 有 的 块 被 用 于 链 式 结构 来 组 织 ， 在 每 个 块 的 最 后 存储 下 一 个 块 的 地 址 ， 从 而 块 与 块 之 
间 串 联 到 一 起 ， 这 样 一 来 ， 文 件 可 以 不 连续 存储 ， 文 件 中 的 块 可 以 分 布 在 各 个 零散 的 空间 中 ， 有 效 地 利用 
了 存储 空间 ， 或 者 说 是 提升 了 磁盘 的 利用 率 ， 相 当 于 节省 了 空间 。 其 结构 如 图 14-1 所 示 。 

图 中 文件 A 大 小 是 10KB, 块 大 小 是 4KB, 因此 要 占用 
3 个 块 ， 最 后 一 个 块 ( 块 5) 中 浪费 了 2KB 空间 。 但 通过 链 
式 结构 来 组 织 文件 的 次 端 是 当 访 问 文件 中 的 某 个 块 时 , 必须 
要 从 头 开始 遍历 块 结 点 ， 比 如 要 访问 文件 A 的 第 3 个 块 ( 块 
5)， 需 要 先 访 问 第 1 个 块 ( 块 3)， 获 得 第 2 块 的 地 址 ( 块 
6)， 再 从 第 2 块 中 获取 第 3 块 ( 块 5) 的 地 址 ， 软 件 上 算法 
效率 低下 ， 而 且 每 访问 一 个 结 点 ， 就 要 涉及 一 次 硬盘 寻 道 ， 
使 得 对 原本 低速 的 设备 访问 更 加 频繁 了 。 也 许 连 微软 自己 
也 受 不 了 它 了 ， 后 来 推出 了 NTFS 文件 系统 。 

以 上 是 文件 用 链 式 结构 组 织 的 形式 ， 注 意 啦 ， 文 件 组 
织 形式 是 对 各 个 文件 而 言 的 ，FAT 文件 系统 中 每 个 文件 都 有 这 么 个 单独 的 链 式 结构 来 组 织 、 跟 踪 文 件 的 所 
有 块 。 下 面 讨论 下 另 一 种 文件 组 织 形 式 ，UINX 操作 系统 中 的 索引 结构 一 一 inode， 在 咱们 的 实现 中 也 以 
inode 为 主 ， 因 此 下 面 重 点 说 下 。 

UNIX 文件 系统 比较 先进 ， 它 将 文件 以 索引 结构 来 组 织 ， 避 免 了 访问 某 一 数据 块 需要 从 头 把 其 前 所 有 数据 块 再 遍 












































































































































































































































































































































































































































[|] 块 大 小 4KB 























文件 A 


起 始 块 ”3 
大 小 10KB 

























































































列 14-1 文件 的 链 式 组 织 结 构 
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历 一 次 的 





四 Ex var 
决 点 。 采 | 














优点 ， 更 重要 的 是 文件 系统 为 每 个 文人 


地 址 ， 数 组 元 素 | 
索引 表 中 获得 块 + 





下 标 是 文人 








索引 、 跟 踪 一 个 文件 的 所 有 块 。 强 调 下 ，inode 是 文件 索引 结构 组 织 形式 的 














个 这 样 的 元 信息 数 和 
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各 表 项 都 是 块 的 地 址 ， 这 256 个 块 地 址 需要 通过 一 级 间接 块 索引 表 才 能 获得 ， 
一 级 间接 块 索引 表 中 包含 “间接 ”二 字 的 原 

















结构 , 因此 在 UINX 文 从 
采用 索引 结构 存储 文件 A 的 逻辑 示意 医 

















] 索 引 结构 的 文件 系统 ， 文 件 中 的 块 依然 可 以 分 散 到 不 连续 的 零散 空间 中 ,保留 了 磁盘 高 利 











] 率 的 












































系统 中 , 一 个 文 从 
如 图 14-2 所 示 。 
用 索引 结构 的 缺点 是 索引 表 本 



































构 称 为 inode， 即 index node， 索 3 
体 体 现 ， 必 须 为 每 个 文 伯 
必须 对 应 一 个 inode, 磁盘 中 有 多 少 文件 就 有 多 少 inode。 





[的 所 有 块 建立 了 一 个 索引 表 ， 索 引 表 就 是 块 地 址 数组 ， 每 个 数组 元 素 就 是 块 的 
F 瑞 的 索引 ， 第 个 数组 元 素 指向 文件 中 的 第 n 个 块 ， 这样 访 问 和 
也 址 就 可 以 了 ， 速 度 大 大 提升 。 包 含 此 索引 表 的 索引 结 




















E 意 一 个 块 的 时 候 ， 只 要 从 
结 点 ， 用 来 
都 单独 配备 
































身 要 占 | 














一 定 的 存储 空 








加 kaks 。 间 ， 文 件 要 是 很 大 时 ， 块 就 比较 多 ， 索 引 表 项 就 要 跟着 增 
多 ， 难 道 要 让 索引 表 就 变 得 很 大 吗 ? 这 显然 不 科学 ，UNIX 

为 解决 这 个 问题 采取 了 折 中 的 方法 ， 将 一 部 分 块 放 在 索引 
一 表 中 ， 如 果 文件 很 大 ， 将 其 他 块 放 在 另 一 个 索引 表 ， 具 体 
名 交 《| 做 法 是 :每 个 索引 表 中 共 15 个 索引 项 ， 暂 时 称 此 索引 表 为 
ua| ， 老 索引 表 。 老 索引 表 中 前 12 个 索引 项 是 文件 的 前 12 个 块 


14-2 文件 的 索引 组 织 结构 











的 地 址 ， 它 们 是 文件 的 直接 块 ， 即 可 直接 获得 地 址 的 块 。 


























若 文件 大 于 12 个 块 ， 那 就 有 





有 建 江 个 





所 的 块 索引 表 ， 





表 称 为 一 级 间接 块 索引 

















索引 表 的 第 13 个 索引 项 中 。 有 了 


























因 。 此 表 也 要 占用 一 个 物 到 





















































































































































块 来 存储 ， 该 物理 
级 间接 块 索引 表 ， 文 件 最 大 可 达 12+256=268 个 块 。 有 同学 说 了 ， 要 是 

















革 索 引 


表 ， 表 中 可 容纳 256 个 块 的 地 址 ， 
因此 称 为 “间接 块 ”， 这 也 是 





E 块 的 地 址 存 








诸 到 老 















































































































































































































































































































































文件 超过 268 个 块 怎么 办 ?这 个 好 办 , 我 们 可 以 再 建立 二 级 间接 块 索 引 表 ， 此 表 中 各 表 项 存储 的 是 一 级 间接 
块 索引 表 ， 然 后 在 老 索引 表 中 第 14 个 索引 项 存储 二 级 间接 块 索引 表 所 在 块 的 地 址 。 有 了 二 级 间接 块 索引 表 ， 
文件 最 大 可 达 (12+256+256*256) 个 块 ， 自 己 算 算 多 少 块 吧 。 二 
再 不 够 的 话 ， 可 以 再 建立 三 级 间接 块 索引 表 ， 表 中 各 表 项 存储 逻辑 结构 sp 人 
的 是 二 级 间接 块 索引 表 ， 然 后 在 二 级 间接 块 索 引 表 中 建立 一 级 i 结 点 编号 文件 内 所 有 的 块 
间接 块 索引 表 ， 三 级 间接 块 索 引 表 所 在 块 的 地 址 记录 在 老 索 引 eS 
表 的 第 15 个 索引 项 中 。 有 了 三 级 间接 块 索引 表 ， 文 件 最 大 可 时 间 | 9 
达 (12+256+256*256+256*256*256) 个 块 ， 不 用 再 算 了 , 总之。 一半 
很 大 。 如 果 超过 了 这 个 限度 ， 那 就 没 办 法 了 ， 正 常情 况 下 也 不 会 。 | 环 不 间 本 贡 | “一 | | 
出 现 这 种 情况 ， 真 要 是 有 这 样 的 超大 文件 出 现 ， 那 就 只 能 用 mv 。 上 二 过 和 和 
命令 将 其 切割 成 多 个 小 文件 了 。inode 的 逻辑 结构 如 图 14-3 所 示 。 生生 ~ ~ 广 

您 看 , 在 inode 结构 中 , 几乎 吉 括 了 一 个 文件 的 所 有 信息 ， 索引 表 指 针 > 机 上 
i 结 点 编号 是 指 此 inode 的 序号 ， 这 通常 是 指 它 在 inode 数组 中 。 | 率 全 吕 要 人 
的 下 标 〈 后 面 会 讲 到 )。 权 限 是 指 读 、 写 、 执 行 。 属 主 是 指 文件 > > > 
的 拥有 者 ， 时 间 是 指 创建 时 间 、 修 改 时 间 、 访 问 时 间 等 。 文 件 “图 1473 inode 结 点 结构 与 各 级 间接 块 索引 表 
大 小 是 指 文件 的 字 节 尺寸 。 下 面 这 些 连续 的 各 种 块 指 针 及 索引 表 指 针 是 文件 所 有 块 的 索引 ,也 就 是 指向 文件 
的 实体 部 分 。 文 件 系 统 为 实现 文件 管理 方案 ， 必 然 会 创造 出 一 些 辅助 管理 的 数据 结构 ， 只 要 用 于 管理 、 控 制 
文件 相关 信息 的 数据 结构 都 被 称 为 FCB (File Contrl Block), 即 文件 控制 块 ,inode 也 是 这 种 结构 , 因此 inode 
是 FCB 的 一 种 。 形 象 一 点 地 说 inode 相当 于 通 往 文件 实体 数据 块 的 大 门 ， 这 一 点 的 作用 类 似 于 内 存 段 的 段 


























的 条 伯 
在 文人 
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坟 


此 不 会 完整 i 








上 的 元 信息 〈 文 
先 要 找到 文件 的 inode， 从 这 个 意义 
也 实现 这 些 居 


述 符 ， 只 不 过 inode 是 文件 实体 数据 块 的 描述 符 ， 里 本 



































有 文件 数据 块 总 大 小 等 撕 3 

















fa 





F 本 身 








术 信 息 ， 有 文件 实体 数据 块 的 具体 地 二 








的 元 信息 是 它 自己 的 文件 涉 )， 要 想 通 过 文 伯 
上 来 说 ，inode 等 同 于 文件 。 男 外 ， 中 




















止 。 总 之 我 想 强 j 


们 并 没 打算 实现 月 








i 规定 了 访问 此 文件 数据 块 的 权限 、 属 主 等 安全 方 

















周 的 是 inode 是 文 
系统 获得 文件 的 实体 ， 必 须 


证 




















有 户 权 限 管理 
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只 要 把 灰色 的 部 分 完成 就 可 以 了 。 

















》 





Linux 是 后 起 之 郁 ， 它 的 文 伯 
多 少 inode。 但 是 硬盘 空间 是 有 限 的， 





















































来 管理 


人 磁盘 


空间 的 ， 
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而 且 inode 本 身 也 要 











此 , 各 个 分 区 的 可 | 











是 暂且 先 这 么 说 ， 
固定 的 ， 现 假设 
区 容量 。 


为 y， 那 么 





小 ， 这 样 在 为 分 
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空 | 


F 系 统 借鉴 了 inode 结构 ， 同 样 是 一 个 文 





牛 目 右 
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占 | 











司 实 际 上 被 所 有 文 

















为 还 有 超级 块 、 各 种 位 
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、 目 录 项 等 也 占 | 






































X+y= 分 














区 








x= 文 件数 *inode 大 小 ， 
先 确 定 inode 数量 )， 正 如 
inode 的 数量 等 
称 为 inode_ table， 在 1 
的 下 标 便 是 文 介 
文件 的 数量 间 





inode 利用 率 ， 不 加 参数 执行 df 时 ， 查 看 的 是 空间 利 / 
好 啦 ， 有 关 inode 就 介绍 到 这 ， 如 果 感 觉 模 阁 

















大 





此 分 区 最 大 创建 的 
Linux 中 每 分 区 








“所 有 文件 的 inode 结构 ”使 
您 看 ， 分 区 容量 大 小 是 
规划 文件 系统 的 元 信息 时 ， 必 须要 


























磁盘 空间 








来 存储 ， 文 件 系 统 是 针对 各 个 分 
牛 的 inode 结构 和 所 有 文件 的 数 和 
磁盘 空间 )。inode 结构 是 固定 的 ， 其 大 小 
的 磁盘 空间 为 x,“ 所 有 文件 的 数据 块 ” 使 / 








inode， 有 多 少 文件 就 有 
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享 ( 
































] 的 磁盘 空间 




















固定 的 , x 和 y 是 变量 ， 都 是 一 方 决定 另 一 方 占 / 





文件 数 是 有 限 4 


的 inode 数量 是 











出 的 (实际 J 


E 将 一 方 确定 下 来 才 行 。 这 个 











上 我 们 用 
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定 的 ， 可 以 





























F inode 的 编号 。 








文件 的 数量 ， 为 方便 管理 
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十 算 机 中 表格 都 可 以 











接 决 定 了 分 


区 空间 的 利 



































j 率 分 为 inode 的 利 











数组 来 表示 ， 
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用 率 ， 说 “间接 ”的 
比如 对 于 大 小 分 别 为 10KB 和 10GB 的 文件 ,同一 个 16GB 大 小 
因此 一 个 分 区 的 利 











14.1.2 目录 项 与 目录 简介 


经 过 我 反复 强调 , 我 想 大 伙 儿 已 经 了 


其 地 位 等 同 于 文件 。 


自 
LDO 9》 





通过 文件 名 来 访问 文件 的 ，inode ! 
话 ， 需 要 改变 文 伯 





述 的 ， 
































inode， 只 能 间 ] 

















但 如 此 重要 的 数据 
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一 口 


























却 没有 文件 名 ， 

















文人 




















mkfs 命 
j tune2fs 命令 查看 inode 数量 。 








j 的 空间 大 











E 被 确定 下 来 的 变量 是 x， 





令 分 


区 时 也 是 这 样 做 的 ， 











F 的 inode 通过 一 个 大 表格 来 维护 ， 此 表格 
此 inode table 本 质 上 就 是 inode 数组 ， 数 组 元 素 








原因 是 文 伯 








F 可 大 可 小 ， 每 个 文 





个 大 小 不 一 ， 











] 率 和 磁盘 空间 利用 率 7 
的 话 ， 等 只 
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构 中 却 少 了 一 个 对 
其 实 可 以 在 inode 中 存储 文件 名 ， 只 是 如 果 这 样 做 的 








丽 种 ， 在 Linux ! 














品 





的 分 区 可 分 别 容 纳 的 文件 数 必然 相差 甚 远 。 
可 以 通过 df -i 命令 查看 




















在 实践 上 再 加 深 理 








解 吧 。 


解 了 每 个 文件 都 要 有 一 个 inode，inode 中 记录 了 文件 的 大 部 分 信 












































| 用户 来 说 最 重要 的 属性 。 想 想 看 ， 我 们 是 







































































系统 的 设计 ， 而 且 也 不 是 现代 文件 系统 的 做 法 ， 原 因 是 文件 系统 对 文件 是 用 inode 来 描 

只 要 给 出 inode， 文 件 系统 便 能 够 找到 文件 实体 的 数据 块 ， 因 此 文件 名 对 操作 系统 《文件 系统 ) 来 
说 并 不 重要 ， 从 这 也 能 够 看 出 ，inode 是 文件 系统 需要 的 东西 ， 并 不 是 给 用 户 准备 的 《用 户 无 法 直接 使 用 
接 用 到 )。 可 是 文件 系统 毕竟 是 人 创造 的 ， 创 建文 件 系统 的 目的 是 为 了 帮助 人 们 解决 问题 ， 

而 不 是 制造 麻烦 ， 文 件 系统 的 用 户 是 人 ， 人 是 通过 文件 名 来 与 文件 打交道 的 ， 不 可 能 要 让 用 户 记 住 文件 的 
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牛 ， 而 














号 。 那 么 问题 来 了 ， 文 
再 想 想 看 ， 文 件 名 在 查找 文 
上 任何 








是 广义 

































































前 坚 用 到 








个 的 范畴 。 无 论文 





储 在 和 











录 相关 的 ] 








在 Linux 中 ， 











牛 系统 是 如 何 把 文 伯 
牛 的 时 候 才 用 到 
文件 名 的 情况 ,无 论文 























F 名 








， 此 处 的 “查找 文件 ” 
牛 名 是 作为 可 执行 程序 ， 或 是 作为 参数 ， 这 都 

















和 inode 关联 到 一 起 














的 呢 ? 


并 不 是 狭义 上 的 用 搜索 或 find 命令 查 
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牛 在 哪个 路 径 ， 



































清楚 这 

















两 种 文件 





录 和 文件 都 用 








这 就 引出 了 另外 一 个 
inode 来 表示 ， 


它 表 定 要 位 于 某 个 目录 
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我 们 这 里 称 目录 为 





























个 与 


匹配 的 inode。 按 理 说 ， 既 然 同 一 种 inode 同时 表示 目录 和 
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inode | 

















该 inode 是 


表示 的 是 目 





文件 〈 不 会 存在 管道 文人 

















录 文件 ， 








门 称 为 目录 的 数据 结构 ， 
于 描述 一 个 文件 实体 的 数据 块 ， 至 了 
必 关 心 它 是 
普通 文件 
如 果 该 inode 表示 上 


磁盘 -| 








录 文 件 ， 





《至 少 要 有 个 根 目录 /)， 因 此 文件 名 应 
录 。 什 么 是 目录 ? 




















该 存 





录 也 是 文件 ， 只 是 目录 是 包含 文件 的 文件 。 为 了 表 
般 意 义 上 的 文件 称 为 普通 文件 。 





在 Linux 中 ， 只 要 是 文 






































普通 文件 ， 这 说 明 在 inode 中 








录 和 文件 呢 ? 在 磁盘 上 的 文件 系统 中 (注意 啦 , 我 说 的 是 磁盘 上 )， 














上 有 的 只 是 inode， 这 是 我 























， 还 是 











此 inode 指向 的 数据 块 中 的 内 容 应 1 
F、socket 之 类 )， 因 此 








该 数据 块 ! 
什么 。 既 然 同 一 种 inode 既 用 来 表示 普通 文件 ， 又 ) 
录 文 件 , 唯一 的 地 方 
的 是 普通 文件 ， 此 inode 指向 的 数 


























直 反 复 强 调 inode 重要 性 的 原 
记录 的 是 什么 ， 这 并 不 是 inode 决定 的 ，inode 
































来 表示 








居 块 中 的 内 容 应 该 是 普通 文件 





录 文 件 ，inode 结构 相同 ， 





因 之 一 。 
也 不 
区 分 














因此 





os 








只 能 是 数据 块 本 身 的 内 容 了 ， 如 您 所 料 , 它们 必须 是 不 同 的 。 

















己 的 数据 。 如 果 i 


玄 inode 

















玄 是 该 目 





录 下 的 目 


























杂项 ， 咱们 只 会 支持 目 录 文 件 和 普通 
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什么 





录 项 ? ] 




















要 么 是 普通 文件 的 目录 项 ， 要 么 是 目录 文件 的 


其 实 咱们 每 天 都 要 见 到 它们 ， 先 来 个 亲民 一 些 的 介绍 。 

















录 项 。 
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不 管 文件 是 普通 文件 ， 还 是 目录 文件 ， 它 总 会 存在 于 某 个 目录 中 ， 所 有 的 普通 文件 或 目录 文件 都 存在 
于 根 目录 之 下 ， 根 目录 是 所 有 目录 的 父 目 录 。 我 们 在 某 个 目录 下 执行 1 命令 的 时 候 ， 输 出 的 结果 就 是 目 
录 项 的 外 在 展现 ， 如 图 14-4 所 示 。 

图 14-4 中 输出 的 是 在 当前 目录 lib 下 执行 ls 后 的 结果 ， 参 数 a 显示 隐藏 文件 ， 为 的 是 显示 '.' 和 '.. ' 这 两 
个 文件 ， 参 数 i 是 为 了 显示 inode 编号 。 您 看 到 的 框框 中 4 个 文件 ， 三 个 目录 和 一 个 普通 文件 (php.ini)， 
它们 的 名 字 就 是 lib 目录 中 各 条 目 中 记录 的 名 字 ， 这 个 条 目 称 为 目录 项 。 

有 时 候 我 们 在 执行 ls 命令 时 还 能 看 到 文件 属 主 、 权 限 等 信息 ， 那 是 由 于 加 了 参数 1 (命令 是 1s 别名: 
']s -1 --color=auto')。 不 过 这 些 额 外 的 信息 是 来 自 inode， 如 图 14-5 所 示 。 


[work@localhost lib]$ ls -ai 


567272[.] 171460[..] 567273[php] 567320 [php.inil 
work@localhost lib]$ 





































































































[work@localhost 1lib]$ 1s -lai 


总 用 量 6 _ 


FWXP-X。 
rWXr-X. 
rwxr-x。14 work work 4096 2 月 
r--r--。 


文件 类 型 


3 work work 4096 2 月 
9 work work 4096 2 月 


19 10:29 
17 09:47 
5 14:12 


1 work work 48835 2 月 19 10:29 


[work@localhost lib]$ 

































































































































































































































































































































































































































































































































































A 图 14--4 录 中 的 目录 项 A 图 14-5 录 项 信息 及 inode 信息 
参数 1 用 于 长 列表 格式 显示 文件 信息 , 两 边框 框 中 的 内 容 来 自 目 录 项 , 左边 第 2 个 框框 表示 文件 类 型 ， 
它 也 来 自 于 目录 项 ， 1 inode。 您 看 ， 这 里 的 文件 类 型 中 ，'d 表 示 文 件 是 目录 ， “表示 
文件 是 普通 文件 。 之 前 说 inode 不 关心 数据 块 中 记录 的 是 什么 ， 也 就 是 说 数据 块 中 存储 的 是 目录 ， 还 是 普 
通 文件 的 实体 数据 ，inode 是 不 知道 的 。 那 现在 您 应 该 清楚 了 ，inode 不 知道 的 事 ， 目 录 项 知道 。 
好 啦 ， 现 在 可 以 想像 一 下 目录 项 的 样子 了 。 目 录 相当 于 个 文件 列表 (或 者 是 表格 )， 每 个 文件 在 目录 
中 都 是 一 个 entry (条 目 、 项 )， 各 个 entry 中 的 内 容 包括 文件 名 、 
文件 类 型 ， 为 了 定位 文件 的 数据 , entry 中 至 少 还 要 包括 inode 编号 ， er 
这 个 entry 是 目录 中 各 个 文件 的 描述 ， 它 称 为 目录 项 ， 目 录 项 中 至 de 和 
少 要 包括 文件 名 、 文 件 类 型 及 文件 对 应 的 inode 编号 ， 还 是 拿 图 14-4 171460 目录 
中 的 lib 目录 来 说 ， 其 目录 项 如 图 14-6 所 示 。 | 
您 看 ， 目 录 项 中 包含 文件 名 、inode 编号 和 文件 类 型 ， 它 们 三 ee 
个 的 作用 有 两 个 , 一 是 标识 此 Inode 表示 的 文件 是 目录 ,还 是 普通 | 
文件 ， 也 就 是 inode 所 指向 数据 块 中 的 内 容 是 什么 。 二 是 将 文件 名 与 inode 做 个 绑 定 关联 ， 这 样 用 户 便 可 
以 通过 文件 名 来 找到 文件 的 实体 数据 。 
有 了 目录 项 后 ， 通 过 文件 名 找 文件 实体 数据 块 的 流程 是 。 
(1) 在 目录 中 找到 文件 名 所 在 的 目录 项 。 
(2) 从 目录 项 中 获取 inode 编号 。 
(3) 用 inode 编号 作为 inode 数组 的 索引 下 标 ， 找 到 inode。 
(4) 从 该 node 中 获取 数据 块 的 地 址 ， 读 取 数 据 块 。 
以 上 是 一 个 目录 项 中 最 基本 的 属性 ， 在 较 成 熟 文件 系统 的 inode 中 属性 会 多 一 些 , 拿 Linux 的 ext2 文 
件 系统 来 说 ， 其 目录 项 结构 是 这 样 的 ， 如 图 14-7 所 示 。 
其 中 的 文件 类 型 人 le type 可 能 的 取 值 如 图 14-8 所 示 。 
// 未 知 文件 类 型 
EXT2_FT_REG_ FILE, // 普通 文件 
struct ext2_dir_entry-2 { ; i 
inode; // inode 编 号 EXT2_FT_BLKDEV， // 块 设备 
rec_len; // 目录 项 长 度 EXT2_FT_FIF0， // 命名 管道 
name_len; // 名 字 长 度 EXT2_FT_SOCK, // 套 接 字 
a a 
A 图 14-7 ext2 目录 项 A 图 14-8 ”ext2 文件 类 型 
只 要 用 于 管理 文件 相关 信息 的 数据 结构 都 可 称 为 文件 控制 块 , 因此 目录 项 也 是 。 创 建文 件 的 本 质 是 创建 了 文 
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件 的 文件 控制 块 ， 即 目录 项 和 inode， 这 
我 估计 头 一 次 接触 inode 和 目录 项 的 同学 可 能 还 是 很 “党 ”， 下 国 
(1) 每 个 文件 都 有 自己 单独 的 inode，inode 是 文 从 
《2) 所 有 文件 的 inode 集中 管理 ， 形 成 inode 数组 ， 每 个 inode 的 编 
(3) inode 中 的 前 12 个 直接 数据 块 指针 和 后 3 个 间接 块 索引 表 用 

牛 系统 中 并 不 存在 具体 称 大 

一 用 同一 种 inode 表示 。inode 表示 的 文件 是 普通 文件 ， 还 是 

PP 的 内 容 要 么 是 普通 文件 本 身 的 数据 ， 

















(4) 文 


容 是 什么 ， 即 数据 块 


点 在 与 文人 












































“ 目 














(5) 














录 项 仅 存 帮 



































录 ” 
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F 实 体 数 据 块 在 文件 系 












































F 创 建 的 相关 实践 中 大 伙 儿 会 更 有 体会 。 
i 总 结 梳理 下 以 上 所 介绍 的 内 容 。 
统 上 的 元 信息 。 
号 就 是 在 该 inode 数组 中 的 下 标 。 
于 指向 文件 的 数据 块 实体 。 





























录 文 人 














BE 








E 于 inode 指向 的 数据 块 中 ， 有 日 


的 所 有 数据 块 便 是 目录 。 





(6) 目录 项 中 记录 的 是 文件 名 、 文 人 
文件 名 及 inode， 使 文件 名 和 inode 关联 绑 定 ， 二 是 标识 此 inode 所 指向 的 数据 块 中 的 数据 














F inode 的 编 





























通 文件 ， 还 是 目录 ， 当 然 还 有 更 多 的 类 型 )。 


(7) inode 是 文件 的 “实质 ”， 但 它 并 不 能 直接 引用 ， 必 须 通过 文件 名 找到 文件 名 所 在 的 
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录 项 的 数据 块 就 是 


号 和 文件 类 型 ， 





么 是 目录 中 的 目录 项 。 


























水 ， 


目 























目录 项 起 到 的 作 月 


的 数据 结构 ， 同 样 也 没有 称 为 “普通 文件 ”的 数据 结构 ， 统 
F， 取 决 于 inode 所 指向 数据 块 中 的 实际 内 


录 项 所 属 的 inode 指向 

















月 有 两 个 ， 
居 类 型 《比如 是 普 


是 粘 合 























录 项 ， 然 后 















































































































































14.1.3 

































































































































































从 该 目录 项 中 获得 inode 的 编号 ， 然 后 用 此 编号 到 inode 数组 中 去 找 相关 的 inode， 最 终 找到 文件 的 数据 块 。 

inode 和 目录 项 的 关系 如 图 14-9 所 示 。 目录 数据 块 

看 了 这 张 图 后 ， 似 乎 有 点 清楚 了 ， 但 仔细 一 想 似 一 
平 又 感到 更 “ 蒙 加 ”了 ， 您 看 ， 要 想 找到 文件 (普通 。 09 | 
文件 或 目录 文件 ) 的 数据 块 ， 必 须 找到 文件 的 inode。 [| | 文件 类型 | 天 人 
inode 之 所 以 被 引用 (找到 )， 是 因为 在 文件 名 所 在 的 。 姑 中 拓 和 i 
目录 项 中 有 记录 它 的 编号 , 但 是 目录 项 是 在 目录 文件 ee 
的 数据 块 中 ， 而 数据 块 必须 通过 inode 才能 找到 …… 文件 糯 弄 | 本 有 
寻找 过 程 似乎 陷入 了 死 循环 。 任 何 看 似 循环 的 流程 者 
有 个 初始 ， 就 像 心脏 的 第 一 次 跳动 一 样 。 对 于 这 种 看 目录 d3 的 数据 块 
似 死 循环 的 问题 ， 无 外 乎 的 原因 就 是 它 的 上 层 目录 看 EE 
似 是 无 休止 的 ， 只 要 有 个 固定 的 目录 就 解决 了 。 也 许 | inode 3 目录 项 1 | inode 编 号 | ”X 
有 同学 已 经 想到 了 ， 对 ， 就 是 那个 根 目录 /， 它 是 所 有 “| 一 时 文 作 灶 型 | 普 进 六 人 
目录 的 父 目录 ， 每 个 分 区 都 有 自己 的 根 目录 ， 创 建文 。 | 项 关 | 人 
件 系统 之 后 它 的 位 置 就 是 固定 不 变 的 ， 也 就 是 说 ， 在 目录 项 a | node 编 号 | x 
文件 系统 的 设计 中 , 根 目 录 所 在 数据 块 的 地 址 是 被 “ 写 文件 类 型 | 。 目录 
死 ” 的， 查找 任意 文件 时 ， 都 直接 到 根 目录 的 数据 块 
中 找 相 关 的 目录 项 ， 然 后 递归 查找 ， 最 终 可 以 找到 任 | inode2 普通 文件 人 2 的 数据 块 
意 子 目 录 中 的 文件 。 属性 

好 啦 ， 概 念 差不多 就 说 到 这 ， 其 他 的 还 是 要 留 上 文件 | ， 
在 实践 中 验证 吧 ， 大 伙 儿 下 节 再 见 。 索引 指针 

超级 块 与 文件 系统 布局 ^ 图 14-9 inode 与 目录 项 的 关系 

到 现在 为 止 ， 我 们 已 经 介绍 了 inode 和 目录 项 的 作用 ， 还 顺带 说 了 下 根 目录 ， 这 对 于 实现 文件 系统 来 

说 差不多 了 ， 本 节 还 要 给 大 伙 儿 补充 个 重要 概念 ， 这 就 是 超级 块 。 


超级 块 是 干吗 的 呢 ? 大 伙 儿 想 想 ， 
组 中 ， 请 问 ，inode 数组 在 哪里 ? 大 小 是 多 少 ? 还 有 ， 尽 管 我 已 





的 ， 但 每 个 分 





又 都 有 
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我 们 已 经 知道 每 个 文件 都 有 个 inode， 





























1 1 的 根 目录 ， 








b 的 根 目录 在 本 分 区 的 第 2012 扇 区 ， 
这 就 说 明 该 地 址 必然 放 在 某 处 保存 ， 在 各 分 








昌 然 回 


其 地 址 并 不 统一 ， 也 许 分 区 a 的 根 





























经 和 大 伙 儿 说 过 根 目 
录 在 本 分 




















定 ， 但 不 统 











。 您 看 ， 既 然 各 分 





区 根 目 





区 的 第 500 局 
录 的 位 置 并 不 统一 ， 








所 有 的 inode 都 放 在 inode 数 
录 的 地 址 是 固定 写 死 











了 


XX， 分 区 








区 中 ， 该 处 的 地 址 必然 是 固定 且 统一 ， 以 备 随时 读 取 ， 总 之 表 
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面 上 看 似 变 化 复杂 的 事物 被 追溯 到 根源 时 都 是 及 其 男 








应 该 有 个 大 小 。 这 就 像 项 目的 配置 文件 ， 























定 简单 的 ， 大 道 





云 


至 简 。 为 了 避免 访问 越界 ， 根 








录 也 














已 
[= 




















配置 文件 中 ， 对 于 文件 系统 也 一 样 ， 我 们 需要 在 某 个 固定 地 方 去 
是 超级 块 ， 超 级 块 是 保存 文件 系统 元 信息 
恩 当 然 不 止 这 些 , 这 取决 于 文件 系统 的 复杂 怕 





在 超级 块 中 保存 的 信 








存 
上 
系统 需要 哪些 元 信息 。 

现在 中 
代表 文件 ， 












































因此 各 分 区 都 有 























的 信息 就 越 多 ， 大 伙 儿 可 以 参考 下 ext2 文 伯 
掉 的 很 多 东西 我 也 不 懂 ， 看 了 之 后 我 也 解释 不 了 ， 还 是 算 了 。 现 在 只 


们 说 说 inode 数组 还 需要 表 
己 的 inode 数组 。 

















的 元 


言 息 。 





E， 越 复杂 的 文件 系统 在 超级 块 中 

















然 很 多 东西 在 一 开始 都 可 以 被 固定 下 来 ， 但 依然 要 将 它 
取 文 人 














呆 存 在 
系统 元 信息 的 配置 ， 这 个 地 方 就 























保 


F 系 统 的 超级 块 ， 这 里 就 不 给 大 伙 儿 贴图 了 ， 内 容 挺 多 的 ， 





们 讨论 下 ， 实 现 一 个 最 基本 的 文件 























尽管 各 分 




















所 有 分 区 上 








件数 。 




















种 管理 inode 使 用 情况 的 方法 ， 我 们 已 
况 ， 好 ， 现 在 又 多 了 一 个 元 信息 ，inode 位 图 。 











的 最 大 文件 数 都 相同 ， 各 分 
(如 在 用 mkfs 工具 为 分 区 创建 文件 系统 时 就 有 inode 数量 的 设置 )， 我 1 


总 之 ， 各 分 区 inode 数组 长 度 是 固定 的 ， 等 于 最 大 文件 数 。 既 然 


区 可 创建 的 最 大 文件 数 是 在 为 分 





区 




















图 





经 会 用 位 





管理 内 

















存 了 ， 因 此 咱 


b 些 维护 信息 。 前面 说 过 了 , 文件 系统 是 针对 各 个 分 
区 可 创建 的 最 大 文件 数 是 
创建 文件 系统 (格式 化 ) 时 设置 的 
门 可 以 为 不 同上 
inode 数量 是 有 限 的 ， 必 须要 有 一 


| 





区 来 管理 的 , inode 
的 ， 但 这 并 不 表示 


丰 




















固 
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区 设置 不 同 的 文 



































] 也 用 





位 图 来 管理 inode 的 使 | 





月 

















除了 文件 系统 的 元 信息 外 , 就 剩 下 可 用 的 空 亲 块 了 , 文 























牛 系统 被 创建 出 来 的 目 






































的 就 是 为 了 合理 科学 地 管理 这 

























































































































































































































































































































































































些 空闲 块 ， 空 闲 块 也 是 有 限 的， 因此 空闲 块 的 使 用 情况 也 需要 被 跟踪 ， 所 以 咱们 也 要 为 这 些 空闲 块 准备 个 位 图 。 
咱们 所 讨论 出 来 的 内 容 已 经 足够 实现 一 个 简单 的 文件 系统 了 ， 总 结 一 下 它们 有 : inode 数组 的 地 址 及 大 
小 、inode 位 图 地 址 及 大 小 、 根 目录 的 地 址 和 大 小 、 空 闲 块 位 图 的 地 址 和 大 小 ， 超级 志 
以 上 这 几 类 信息 要 在 超级 块 中 保存 。 因 此 一 个 简单 的 超级 块 结构 如 图 14-10 所 示 。 大 
图 14-10 中 列 出 的 大 部 分 属性 都 很 容易 理解 ， 但 不 知道 大 伙 儿 对 “ 魔 数 ” 有 没 玖 撞击 
有 疑问 ， 它 是 干吗 的 ? 通常 情况 下 魔 数 用 来 确定 文件 系统 的 类 型 的 标志 ， 用 它 来 区 分 区 起 始 记 区 直下 
别 于 其 他 文件 系统 。 比 如 某 个 操作 系统 支持 多 种 文件 系统 ， 通 常 就 是 根据 此 魔 数 先 由 
判断 文件 系统 类 型 ， 然 后 调用 不 同 的 文件 系统 驱动 程序 访问 该 分 区 。 因 此 ， 访 问 不 inode 位 图 地 下 
同文 件 系统 上 的 文件 ， 按 理 说 先 要 了 解 该 文件 系统 中 元 信息 的 意义 ， 然 后 按照 该 文 ae 和 人 
件 系统 的 存 取 流程 去 操作 就 可 以 了 话 昌 这 么 说 ， 其 实 工作 量 还 是 蛮 大 的 )。 inode 数组 大 小 
超级 块 是 文件 系统 元 信息 的 “配置 文件 ” 它 是 在 为 分 区 创建 文件 系统 时 可 日本 种 
创建 的 ， 所 有 有 关 文 件 系统 元 信息 的 配置 都 在 超级 块 中 ， 因 此 超级 块 的 位 置 和 至 亲 据 起 始 地 于 
大 小 不 能 再 被 “配置 ”了 ， 必 须 是 固定 的 ， 它 被 固定 存储 在 各 分 区 的 第 2 个 记 
区 ， 通 常 是 占用 一 个 肩 区 的 大 小 ， 具 体 大 小 与 实际 文件 系统 类 型 为 准 。 A 
对 文件 系统 来 说 ， 该 有 的 数据 都 有 了 ， 下 面 该 讨论 下 它们 在 磁盘 上 的 布局 了 。 图 14-11 所 示 是 一 个 典型 的 






































































































































inode 结构 的 文件 系统 布局 ，Linux 早期 使 用 的 文件 系统 就 是 这 样 布局 的 ， 咱 
整个 硬盘 件 系 统 是 一 款 很 
SS 在 外 六 件 
MBR 引导 扇 区 | 分 区 1 | 分 区 2 | 分 区 N 的 文 们 
ext2 相 比 简 
任意 的 一 个 分 区 结构 图 中 只 是 一 个 
操作 系统 空闲 块 | inode [inode 本 他 各 分 区 中 是 同 构 的 ，6 
3 所 | 王 % “| 位 图 | 位 图 | 数组 | 和 于 | | 自己 的 文件 系统 。 操 作 系统 
4 图 14-11 文件 系统 布局 的 操 
引导 扇 区 ， 它 位 于 各 分 区 最 开始 的 扇 区 ， 根 据 文件 系统 类 型 的 不 同 ， 引 导 程 序 可 能 占 | 



































扇 区 组 成 一 个 数据 块 ， 

是 超级 块 、 空 闲 块 的 位 
于 存储 数据 的 区 域 ， 除 
件 系统 的 过 程 中 手动 设置 


600 
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3、 












































因此 这 里 标 出 
inode 位 图 、 
这 两 部 分 ， 


其 他 几 个 部 分 占 





们 参考 了 ext2 文件 系统 ，ext2 文 











成 熟 强大 的 文件 系统 ， 很 多 Linux 发 
系统 都 基于 它 。 咀 们 的 文件 系统 布局 和 
单 了 很 多 ， 少 了 一 些 块 组 和 块 组 描述 符 。 





























分 区 文件 系统 元 信息 的 布局 ， 其 
日 们 也 按照 这 种 布局 来 设计 


导 块 就 是 曾经 介绍 过 


























和 系统 引导 记录 OBR 所 在 的 地 址 ， 即 操作 系统 








的 是 引导 “ 块 ” 而 不 是 引导 “局 











区 ”。 在 操作 

















用 多 个 悄 区 ， 这 多 个 
统 引 导 块 后 面 的 依次 




















inode 数组 、 根 目录 、 空 闲 块 区 域 。 根 目录 和 














0 空闲 块 区 域 是 真正 用 
































* 








] 的 肩 区 数 取 决 于 分 区 的 容量 大 小 ,或 者 是 在 创建 文 





随 着 这 张 布 局 图 的 出 现 , 咱们 有 关 文 件 系 统 的 理论 部 分 也 就 告 一 段落 了 ， 后面 等 待 咀 们 的 将 是 更 多 的 
实践 ， 兄 第 们 咀 们 一 起 加 油 吧 。 


本 全 创建 文件 系统 


本 节 咱 们 将 在 硬盘 hd80M.img 的 各 分 区 上 创建 文件 系统 ， 后 续 的 文件 操作 都 要 基于 本 节 的 工作 ， 大 
伙 儿 走 起 。 


14.2.1 ”创建 超级 块 、i 结 点 、 目 录 项 


在 创建 文件 系统 之 前 ， 有 一 些 基础 数据 结构 要 先 创建 ， 它 们 是 超级 块 、inode 和 目录 项 ， 您 看 ， 这 一 
节 创 建 三 种 数据 结构 ， 这 说 明 它们 都 比较 简单 ， 相 信 本 节 很 快 搞定 。 

下 面 先 给 大 伙 儿 介绍 超级 块 , 早 在 介绍 硬盘 驱动 时 就 已 经 提 到 过 它 了 , 我 们 甚至 在 代码 中 定义 了 它 的 
指针 ， 不 过 幸好 没有 真正 用 到 ， 否 则 编译 就 不 会 通过 。 现 在 把 欠 大 伙 儿 的 超级 块 奉 上 。 有 关 文 件 操 作 的 代 
码 我 们 定义 在 fs 目录 下 , 本 节 咱 们 新 建 这 个 目录 , 超级 块 所 在 的 文件 位 于 fs/super_block.h 中 ， 见 代码 14-1。 
代码 14-1 (project/c14/a/fs/super_block.h ) 






















































































































































































































































































… 略 
5 /* 超级 块 */ 
6 struct super block { 
7 uint32 t magic; 
// 用 来 标识 文件 系统 类 型 















































































































































































































































// 支持 多 文件 系统 的 操作 系统 通过 此 标志 来 识别 文件 系统 类 型 

8 uint32 t sec cnt; // 本 分 区 总 共 的 扇 区 数 

9 uint32 t inode cnt; // 本 分 区 中 inode 数量 
10 uint32 t part lba base; // 本 分 区 的 起 始 lba 地 址 
下 泵 
12 uint32 t block bitmap lba; // 块 位 图 本 身 起 始 扇 区 地 址 
13 uint32 t block bitmap sects; // 扇 区 位 图 本 身 占 用 的 扇 区 数量 
14 
15 uint32 t inode bitmap lba; // i 结 点 位 图 起 始 房 区 lba 地 址 
16 uint32 t inode bitmap sects; // i 结 点 位 图 占用 的 扇 区 数 
2 
18 uint32 t inode table lba; // i 结 点 表 起 始 扇 区 lba 地 址 
19 uint32 t inode table sects; // i 结 点 表 占 用 的 扇 区 数量 
20 
2 uint32 t data start lba; // 数据 区 开始 的 第 一 个 扇 区 号 
22 uint32 t root inode no; // 根 目 录 所 在 的 工 结 点 号 
23 uint32 t dir entry size; // 目录 项 大 小 
24 
25 uint8 t pad[460]; // 加 上 460 字 节 ， 闫 够 512 字 节 1 扇 区 大 小 


26 } _attripbute  ((packed)); 


为 方便 写 程序 ， 咱 们 的 数据 块 大 小 与 扇 区 大 小 一 致 ， 即 1 块 等 于 1 肩 区 ， 请 大 伙 儿 知晓 。 

咱们 的 文件 系统 没 那么 强大 ， 因 此 超级 块 中 没什么 太 多 的 内 容 , 连 1 扇 区 都 不 到 ， 但 磁盘 操作 要 以 局 
区 为 单位 ， 虽 们 交 给 硬盘 的 数据 必须 是 扇 区 大 小 的 整数 倍 。 为 了 凌 足 1 忆 区 ， 即 512 字 节 ， 在 超级 块 的 最 
后 定义 了 460 字 节 的 pad 数 组， 仅仅 是 用 来 填充 扇 区 用 的 。 大 伙 儿 可 以 算 一 下 ，pad 之 前 的 所 有 变量 大 小 
之 和 一 定 为 52 字 节 ，13 个 变量 ， 每 个 变量 4 字 节 。 为 了 保证 编译 后 的 超级 块 实例 大 小 为 512 字 节 ， 在 第 
26 行 添加 了 “__attribute “((packed));”。 

好 啦 ， 对 于 超级 块 中 其 他 成 员 的 说 明 ， 大 伙 儿 自己 看 看 代码 中 的 注释 吧 ， 写 得 还 是 很 清楚 的 。 下 面 看 
男 一 个 数据 结构 ，inode，inode 定义 在 fs/inode.h 中 ， 见 代码 14-2。 


代码 14-2 (project/c14/a/fs/inode.h ) 
































































































































































































































… 略 
6 /* inode 结构 */ 

7 struct inode { 

8 ULNnt32. tt 1 no // inode 编号 
9 


601 


10 


11 若 此 inode 是 


12 


20 
21 


inode 结构 : 
i_size 是 此 inode 指向 的 文 从 
表示 普通 文件 的 大 小 ， 





/* 当 此 inoqe 是 文件 时 ， i_size 是 指 文件 大 / 














录 项 大 小 之 和 */ 





























录 ，i_size 是 指 该 目录 下 所 有 














uint32 t i size; 


uint32 t i open cnts; 














// 记录 此 文件 被 打开 的 次 数 

















bool write deny; 











/* i_sectors[0-11] 是 直接 块 ,，i sectors 
uint32 t i sectors[13]; 


struct list elem inode tag; 











}; 
#endif 

















// 写 文件 不 能 3 


12] 




















行 ， 进 程 写 文件 前 检查 此 标识 


来 存储 一 级 间接 块 指 针 */ 























当 inode 指向 的 是 




















以 字 节 为 单位 的 大 小 ， 并 不 是 以 数据 块 为 单位 ， 说 明 一 下 ， 为 方便 编码 ，1 
i open_cnts 表示 此 文 伯 

















不 能 再 有 其 他 并 行 的 写 
在 写 该 文件 了 ， 此 文 从 
i_sectors 是 数据 块 的 指针 ,咱们 的 块 大 小 就 是 1 扇 区 ， 
〈 而 不 是 像 ext2 中 的 i_block)。 
块 的 扇 区 地 址 ，i_sectors[12]) 























inode 指 代 9 





录 时 ，i_ size 表示 


F 被 打开 的 次 数 ， 它 在 关闭 文件 时 ， 回 
write_deny 用 于 限制 文件 的 并 行 写 操作 ， 我 们 都 有 这 档 
样 后 写 入 的 内 容 会 覆盖 





，i_no 是 inode 编号 ， 它 是 在 inode 数组 中 的 下 标 。 
F 的 大 小 ,目录 也 是 用 














































































































之 前 写 入 的 内 容 ， 从 而 引起 数据 混乱 ， 因 此 必须 保证 文件 在 执行 写 
































操作 ， 多 个 写 操作 应 该 以 串 行 的 方式 进行 。 
F 的 其 他 写 操作 应 该 被 拒绝 。 




















忆 此 当 inode 指向 的 是 普通 文件 时 ，i_size 

录 中 所 有 目录 项 的 大 小 之 和 。 注 意 i_size 是 

自 们 的 数据 块 大 小 等 于 扇 区 大 小 。 

收 与 之 相关 的 资源 时 使 用 ， 后 面 用 到 时 再 讨论 。 
的 常识 ， 不 能 让 多 个 用 户 同 时 写 1 个 文件 ， 这 
操作 时 ， 该 文件 




















当 write _ deny 为 true 时 表示 已 经 有 任务 






































不 同 的 是 
们 总 共 
inode tag 是 此 inode 的 标识 ， 用 了 
这 样 的 : 

慢 ， 为 了 避免 











大 











区 地 址 ， 咱 们 








此 为 了 不 引起 迷惑 ， 直 接 把 块 数 组 命名 为 i_sector 
其 中 ， 数 据 的 前 12 个 块 i_sectors[0-11] 是 直接 块 ， 也 就 是 它们 中 记录 的 是 数据 
来 存储 一 级 间接 块 索引 表 





























只 打算 支持 一 级 间接 块 ， 不 过 稍微 

















扇 区 大 小 是 512 字 节 ， 











并 且 块 地 址 用 4 字 贡 来 表示 ， 





因此 隆 








们 支持 的 一 级 间接 块 数量 是 128 个 ， 即 哗 




















支持 128+12=140 个 块 〈 扇 






























































下 次 














区 )。 二 级 三 级 同 理 ， 只 是 稍微 麻 ; 
于 加 入 “已 打 ] 
于 inode 是 从 硬盘 上 保存 的 ， 文 件 被 打开 时 ， 
了 打开 该 文件 时 还 要 从 硬盘 上 重复 载 入 inode， 应 该 在 该 文件 第 一 次 被 打开 时 就 将 其 

















加 入 到 内 存 缓存 中 ， 每 次 打开 一 个 文件 时 ， 先 在 此 组 




























































































盘 上 读 取 inode， 然 后 再 加 入 此 缓存 。 这 个 内 存 缓存 就 是 “已 打 和 天 





















































JEmz 上 日 


肯定 是 先 要 从 硬盘 上 载 入 其 inode， 但 硬盘 比较 


! 中 查找 相关 的 inode， 如 果 有 就 直接 使 用 ， 
F 的 inode 队列 ” 用 到 它 的 时 候 咱 











页 了 一 点 ， 大 伙 儿 有 兴趣 自行 实现 吧 。 

















Tf 的 inode 列表 ” 此 列表 将 在 以 后 定义 。 建 立 此 列表 的 目 























inode 
否则 再 从 硬 
们 再 介绍 。 














































































































下 面 咱们 看 目录 项 的 定义 ， 它 定义 在 fs/dir.h 中 ， 如 代码 14-3 所 示 。 
代码 14-3 (project/c14/a/fs/dir.h ) 

… 略 

9 #define MAX FILE NAME LEN 16 // 最 大 文件 名 长 度 

10 

11 /* 目录 结构 */ 

12. "struct .die 

13 struct inode* inode; 

14 uint32 t dir pos; // 记录 在 目录 内 的 偏 移 

J uint8 t dir buf[512]; // 目录 的 数据 缓存 

16 }; 

3 

18 /* 目录 项 结构 */ 

19 struct dir entry { 

20 char filename [MAX FILE NAME LEN];  // 普通 文件 或 目录 名 称 

21 uint32 七 no; // 普通 文件 或 目录 对 应 的 inode 编号 

22 enum file types f type; // 文件 类 型 

23. 1] 


LO 


文件 名 要 存储 在 目录 项 中 ,目录 项 大 小 是 
的 宏 MAX FILE NAME LEN 便 是 文 但 





下 














602 


struct dir 是 














而 会 说 到 。 





固定 的 ， 因 此 文件 名 的 长 度 
F} 名 的 最 大 长 度 , 其 值 为 16。 其 实 此 宏 是 为 目 


























录 结 构 ， 它 并 不 在 磁盘 上 存在 ， 只 用 了 























肯定 要 有 个 上 限 ， 代 码 开 头 定 义 
录 项 dir_entry 准备 的 ， 















































与 目录 相关 的 操作 时 ， 在 内 存 ! 





创建 的 结构 ， 用 








过 之 后 就 释放 了 ， 
其 成 员 inode 























不 会 回 写 到 磁盘 中 。 





是 指针 ， 因 此 肯定 是 用 于 指向 内 存 中 inode， 该 inode 必然 是 在 “已 打 3 


































































































用 到 时 再 说 ， 现 在 一 两 句 话说 不 清楚 。 
成 员 dir pos 用 于 壳 历 目录 时 记录 “游标 ”在 目录 中 的 侦 移 ， 也 就 是 
大 小 应 为 目录 项 大 小 的 整数 倍 ， 这 与 壳 历 目录 的 操作 相关 ， 用 到 时 再 说 。 


成 员 dir buf 用 寺 
下 面 是 目录 项 结构 struct dir_entry， 它 是 连接 文人 























录 项 的 偏 移 量 ， 


























I 








录 的 数据 缓存 ， 如 读 取 目录 时 ， 用 来 存储 返 



































的 目录 项 ， 这 是 后 话 了 。 
F 名 与 inode 的 纽带 , 成员 filename 是 文件 名 ， 这 里 只 














于 的 inode 队列 ” 


所 以 dir pos 





支持 最 大 16 个 字符 的 文件 名 。 成 员 i no 是 文件 filename 对 应 的 inode 编号 ， 无 论 flename 是 普通 文件 ， 
还 是 目录 文件 。 成 员 f _ type 是 指 filename 的 类 型 ， 具 体 类 型 定义 在 fs/fs.h' 



































代码 14-4 (project/c14/a/fs/fs.h ) 


#define MAX FILES PER PART 4096 






































#define BITS PER SECTOR 4096 // 每 扇 区 的 位 数 
#define SECTOR SIZE 512 // 扇 区 字 节 大 小 


#define BLOCK SIZE SECTOR SIZE EA 


11 /* 文件 类 型 */ 
12 enum file types { 


略 
6 
// 每 个 分 区 所 支持 最 大 创建 的 文件 数 
7 
8 
9 

















天 字 节 大 小 












































13 FT_UNKNOWN, // 不 支持 的 文件 类 型 

14 FT_REGULAR, // 普通 文件 

15 FT_DIRECTORY  ”// 目录 

16 -Jy 

代码 开头 定义 了 一 些 常用 的 宏 ， 大 伙 儿 自己 看 下 就 行 了 ， 























值 为 2， 表 示 目 录 。 


好 啦 ， 本 节 到 这 就 结束 了 ， 下 节 咱 














们 开始 实践 。 














14.2.2 创建 文件 系统 


本 节 开 始 创建 文件 系统 ， 也 就 是 平时 咱 























~ 


略 





























代码 14-5-1 (project/c14/a/fs/fs.c ) 


14 /* 格式 化 分 区 ， 也 就 是 初始 化 分 区 的 元 信息 ， 创 建文 件 系统 */ 


15 static void partition format (struct disk* hd struct partition* part) { 

































































们 所 说 的 高 级 格式 化 分 区 ， 相 关 的 代码 在 fs/fs.c : 
再 喝 呆 了 ， 开 始 动 真 格 的 。 完 成 格式 化 分 区 的 函数 是 partition format， 它 有 点 长 ， 分 成 几 部 分 来 看 ， 下 面 
E 看 第 一 部 分 ， 见 代码 14-5-1。 





， 如 代码 14-4 所 示 。 




















下 面 的 枚 举 结构 file_types 是 文件 类 型 ， 


FT_UNKNOWN 的 值 为 0, 表示 未 知 的 文件 类 型 , FT REGULAR 值 为 1, 表示 普通 文件 , FT_DIRECTORY 


， 好 啦 ， 不 





16 /* blocks_bitmap_init ( 为 方便 实现 ， 一 个 块 大 小 是 一 扇 区 ) */ 
2 uint32 t boot sector sects = 1; 
18 uint32 t super block sects = 1; 
19 uint32 t inode bitmap sects = 
DIV_ROUND UP (MAX_FILES PER PART, BITS PER SECTOR); 
// 工 结 点 位 图 占用 的 扇 区 数 ， 最 多 支持 4096 个 文件 
20 uint32 t inode table _ sects = DIV ROUND UP ((\ 
(sizeof (struct inode) *MAX FILES PER PART)), SECTOR SIZE); 
21 uint32 t used sects = boot sector sects + super block sects +\ 
inode bitmap sects + inode table sects; 
之 2 uint32 七 free sects = part->sec cnt - used sects; 
23 














24 /类 太 火炎 炎炎 炎炎 火炎 炎炎 火炎 简单 处 理 块 位 入 占据 的 扇 区 数 六 类 火炎 类 火炎 类 类 类 火炎 次 类 类 了/ 


25 
26 
2 
28 
29 














uint32 t block bitmap sects; 
block bitmap sects = DIV ROUND UP (free sects, 
/* block bitmap bit_len 是 位 图 中 位 的 长 度 ， 也 是 可 


























块 的 数量 */ 

















BITS_PER_SECTOR) ; 


uint32 t block bitmap bit len = free sects - block bitmap sects; 





block bitmap sects = DIV ROUND UP (block bitmap bit len,\ 
BITS_ PER SECTOR); 


30 /类 业 太 炎炎 大火 类 大大 大头 大 火炎 大 类 类 类 大 类 六 大 炎炎 大 类 类 类 大 类 六 大 大 类 大 类 类 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 了/ 


3 证 
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all sectors:0x%x\n 
block bitmap sectors:0x%x\n 


/* 超级 块 初始 化 */ 


struct super block sb; 





sb.magic = 0x19590318; 

sb.sec cnt = part->sec cnt; 

sb.inode cnt = MAX FILES PER PART; 
sb.part lba base = part->start lba; 
sb.block bitmap lba = sb.part lba base + 2; 
// 第 0 块 是 引导 块 ， 第 1 块 是 超级 块 














sb.block bitmap sects = block bitmap sects; 

sb.inode bitmap lba = sb.block bitmap lba + sb.block bitmap sects; 
sb.inode bitmap sects = inode bitmap sects; 

sb.inode table lba = sb.inode bitmap lba + sb.inode bitmap sects; 
sb.inode table sects = inode table sects; 

sb.data start lba = sb.inode table lba + sb.inode table sects; 
sb.root inode no = 0; 

sb.dir entry size = sizeof (struct dir entry); 


Drintk ("Ss Lnfo Nn™, 
printk(" magic:0x%x\n 


part->name); 
part lba base:0x%x\n 


inode bitmap lba:0x%x\n 
inode bitmap sectors:0x%x\ninode table lba:0x%x\n 
inode table sectors:0x%x\ndata start lba:O0x%x\n", 


inode cnt:0x%x\nblock bitmap_ lba: 


Ox%x\n 


sb.magic, sb.part lba base, sb.sec cnt, sb.inode cnt, 
sb.block bitmap lba, sb.block bitmap sects, sb.inode bitmap lba, 


SB. 
sb. 


inode bitmap sects, sb.inode table lba, 
inode table sects, sb.data start lba); 




















函数 partition_format 接受 1 个 参数 , 待 创建 文件 系统 的 分 区 part。 为 方便 实现 ， 





































































































个 块 大 小 是 一 肩 


史 






























































































































































































































































































































































但 是 相关 术语 中 都 是 以 块 单位 ， 因 此 下 面 说 到 “ 块 ” 时 请 大 家 直接 理解 为 扇 区 。 

创建 文件 系统 就 是 创建 文件 系统 所 需要 的 元 信息 , 这 包括 超级 块 位 置 及 大 小 、 空 闲 块 位 图 的 位 置 及 大 小 、 
inode 位 图 的 位 置 及 大 小 、inode 数组 的 位 置 及 大 小 、 空 闲 块 起 始 地 址 、 根 目录 起 始 地 址 。 创 建 步骤 如 下 : 

(1) 根据 分 区 part 大 小 ， 计 算 分 区 文件 系统 各 元 信息 需要 的 扇 区 数 及 位 置 。 

(2) 在 内 存 中 创建 超级 块 ， 将 以 上 步骤 计算 的 元 信息 写 入 超级 块 。 

(3) 将 超级 块 写 入 磁盘 。 

(4) 将 元 信息 写 入 磁盘 上 各 自 的 位 置 。 

(5) 将 根 目录 写 入 磁盘 。 

下 面 的 创建 工作 将 按照 这 $ 个 步骤 依次 完成 。 

代码 第 17 一 18 行 是 为 引导 块 和 超级 块 占 用 的 扇 区 数 赋 值 ， 简 单 起 见 ， 它 们 均 占 用 1 扇 区 大 小 。 顺 便 提 
一 句 ， 咱 们 的 引导 块 未 使 用 ， 因 此 无 所 谓 大 小 ， 但 依然 要 保留 其 占 位 。 

inode_bitmap_sects 表示 inode 位 图 占用 的 户 区 数 ，MAX FILES_PER _ PART 定义 在 fs.h 中 ,表示 分 区 
可 创建 的 最 大 文件 数 ， 也 就 是 inode 数量 ， 它 的 值 为 4096。BITS_PER_SECTOR 同样 定义 在 fs.h 中 ， 其 值 
也 为 4096， 经 过 宏 DIV ROUND UP 计算 后 inode bitmap_sects 的 值 为 1，inode 位 图 占用 1 扇 区 。 

inode table_sects 表示 inode 数组 占用 的 扇 区 数 ， 这 是 由 inode 的 尺寸 和 数量 决定 的 。 

目前 已 占用 的 磁盘 空间 包括 引导 块 、 超 级 块 、inode 位 图 及 inode 数组 ， 现 在 还 差 空闲 块 位 图 大 小 未 
计算 出 来 ， 它 是 由 空闲 块 的 数量 决定 的 ， 因 此 在 第 22 行 先 算出 空闲 块 数 量 ， 很 简单 ， 空 闲 块 〈 扇 区 ) 数 
量 等 于 分 区 总 扇 区 数 减 去 使 用 的 扇 区 数 。 

第 25 一 29 行 开 始 计算 空闲 块 位 图 占用 的 扇 区 数 。 由 于 空闲 块 位 图 大 小 和 空闲 块 数量 相互 依赖 ， 其 总 


和 为 空闲 块 数 free_sects， 相 当 于 7 


















































而 个 互相 决定 对 方 大 小 的 变量 ,6 

















们 这 里 

























































































空闲 块 数 free_sects 除 以 每 扇 区 的 位 数 ， 这 样 便 得 到 了 空 
secs。 空 闲 块 位 图 占用 了 一 部 分 空闲 扇 区 ， 因 此 现在 真正 的 空闲 
， 其 结果 也 是 位 图 中 位 的 个 数 ， 即 在 第 


604 


























闲 块 位 图 block_bitmap 占 





块 数 得 
28 行 我 们 把 结果 写 入 了 变量 block bitmap bit len， 然 后 有 





的 处 理 很 简单 ， 



































先 在 第 26 行 用 
的 肩 区 数 block bitmap _ 
把 block bitmap_sects 从 free_sets 中 减 























了 用 变量 





block bitmap bit len 重新 除 以 BITS_ PER_SECTOR, 这 便 是 空闲 块 位 图 最 终 占 用 的 扇 区 数 block bitmap_sects。 
虽然 这 样 处理 显 得 粗暴 一 些 ， 但 确实 很 简单 。 

接 下 来 第 33 行 开 始 在 内 存 中 创建 超级 块 ， 此 处 用 局 部 变量 生成 超级 块 ， 用 的 是 栈 中 的 内 存 ， 不 过 
还 好 , 超级 块 是 512 字 节 , 栈 还 够 用 。 一 直到 第 48 行 都 没什么 好 说 的 , 比较 清楚 , 第 49 行 的 代码 “sb.root_ 
inode_no =0” 这 表示 根 目 录 的 inode 编号 为 0， 也 就 是 说 inode 数组 中 第 0 个 inode 我 们 留 给 了 根 目录 。 

第 50 行为 目录 项 尺寸 dir_entry_size 赋值 。 第 $S2 一 53 行 打印 超级 块 中 元 信息 ， 我 们 在 运行 时 会 看 到 它们 。 

好 啦 ， 下 面 看 第 二 部 分 代码 ， 见 代码 14-5-2。 


代码 14-5-2 (project/c14/a/fs/fs.c ) 































































































































































































struct disk* hd = part->my disk; 
/大 大 大 大 大 大火 炎炎 火炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 大大 
57 * 1 将 超级 块 写 入 本 分 区 的 1 扇 区 * 


58 类 类 大大 类 类 大 大 类 大 炎炎 大 大大 大大 大 类 大 大 大 大 大 大 大 大 大 大 大 


wj; 
ea ou 暴 





















































59 ide writel(hd, part->start lba + 1, &sb, 1); 

60 printk(" super block lba:0x%x\n", part->start lba + 1); 
61 

62 /* 找 出 数据 量 最 大 的 元 信息 ， 用 其 尺寸 做 存储 缓冲 区 */ 

63 uint32 t buf size = (sb.block bitmap sects >= \ 





sb.inode bitmap sects ? sb.block bitmap sects : sb.inode bitmap sects); 


64 buf size = (buf size >= sb.inode table sects ? \ 
buf size : sb.inode table sects) * SECTOR SIZE; 





55 uint8 tx buf = (uint8 t*)sys malloc(buf size); 
// 申请 的 内 存 由 内 存 管理 系统 清 0 后 返 蕊 















































67 /太太 大 火炎 火炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 关头 大 大 类 类 类 六 类 大大 大大 大 大 大 大 


68 * 2 将 块 位 图 初始 化 并 写 入 sb.block bitmap lba * 


69 类 类 炎炎 类 类 大 类 六 大 类 类 类 类 大大 类 大 类 大 大 类 大 大 大大 大 大 大 大 大 大 大 大 大 大 大 了/ 



























































































































































































































































70 /* 初始 化 块 位 图 block bitmap */ 
5 buf[0] |= 0x01; // 第 0 个 块 预 留 给 根 目 录 ， 位 图 中 先 占 位 
72 uint32 t block bitmap last byte = block bitmap bit len / 8; 
We uint8 t block bitmap last bit = block bitmap bit len $ 8; 
74 uint32 t last size = SECTOR SIZE - AN 
(block bitmap last byte %$ SECTOR SIZE); 
// last_size 是 位 图 所 在 最 后 一 个 扇 区 中 ， 不 足 一 扇 区 的 其 余部 分 
75 
76 /* 1 先 将 位 图 最 后 一 字 节 到 其 所 在 的 扇 区 的 结束 全 置 为 1， 
即 超出 实际 块 数 的 部 分 直接 置 为 已 占用 */ 
RE memset (&buf [block bitmap last byte], Oxff, last size); 
78 
79 /* 2 再 将 上 一 步 中 覆盖 的 最 后 一 字 节 内 的 有 效 位 重新 置 0 */ 
80 uint8 t bit idx = 0; 
81 while (bit idx <= block bitmap last bit) { 
82 puf [block bitmap last byte] &= ~(1 << bit idx++); 
83 } 
84 ide writel(hd, sb.block bitmap lba, buf, sb.block bitmap sects); 
85 


























第 55 行 获取 分 区 part 自己 所 属 的 硬盘 hd，hd 将 作为 后 续 参 数 。 

超级 块 已 经 构建 完成 ， 在 第 59 行将 其 写 到 本 分 区 开始 的 扇 区 加 1 的 地 方 ， 即 part->start_ lba + 1， 也 就 是 
跨 过 引导 扇 区 ， 把 超级 块 写 入 引导 扇 区 后 面 的 扇 区 中 。 尽 管 此 处 的 引导 块 没 什么 用 ， 但 也 要 将 其 位 置 空 出 来 。 

元 信息 最 终 是 要 写 入 硬盘 的 , 但 数据 源 是 在 内 存 中 。 像 超级 块 本 身 是 1 扇 区 大 小 ,我 们 是 用 局 部 变量 
声明 它 的 , 栈 还 能 将 就 对 付 。 可 是 空闲 块 位 图 、inode 数组 位 图 等 占用 的 扇 区 数 较 大 〈 剧 透 : 好 几 百 扇 区 )， 
所 以 这 里 不 便 用 局 部 变量 来 保存 它们 了 ,应 该 从 堆 中 申请 内 存 获 取 缓 冲 区 ,最 好 是 找 出 数据 量 最 大 的 元 信 
息 ， 用 其 尺寸 作为 申请 的 内 存 大 小 。 在 第 63 一 64 行 开 始 选 出 占用 空间 最 大 的 元 信息 ， 使 其 尺寸 作为 申 
的 缓冲 区 大 小 ， 在 第 65 行 申请 内 存 返回 给 指针 buf，buf 是 通用 的 缓冲 区 ， 接 下 来 往 磁 盘 中 的 数据 写 入 操 
作 都 将 buf 作为 数据 源 ， 通 过 不 同 的 类 型 转换 ， 使 buf 变 成 合适 的 缓冲 区 类 型 。 

接 下 来 是 把 块 位 图 写 入 磁盘 扇 区 sb.block bitmap lba 的 准备 工作 。 
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我 们 把 第 0 个 空闲 块 作为 根 目 


码 完成 的 。 





接 下 来 第 72 一 83 行 提 


可 得 好 好 说 道 说 道 。 

















录 ， 因 此 我 们 需要 在 空闲 块 位 图 中 ; 

















图 最 后 一 个 扇 区 ， 











A 











文件 系统 的 主要 了 


理 , 跟踪 资源 的 状态 是 通过 位 图 








各 种 资源 的 位 图 ， 位 图 肯定 是 在 内 存 中 先 创建 好 ， 然 后 再 将 位 图 持久 化 到 硬盘 ,“ 持 久 化 ”是 指 把 数据 写 到 

















可 以 长 久保 存 信息 的 存储 介质 























为 了 使 用 分 区 上 的 数据 ， 这 免不了 数 
需要 这 些 资源 的 位 图 。 而 位 

















来 实现 的 ， 因 此 创建 文件 系统 就 是 创建 














远 保 存 ， 比 如 磁盘 就 是 一 种 持久 化 存储 介质 。 




















据 资源 的 增删 改 查 ,为 了 跟踪 分 区 中 的 数 扩 









































0 位 置 1， 这 是 通过 第 71 行 代 





不 属于 空闲 块 的 位 初始 为 1。 这 么 做 的 原因 是 这 样 的 ， 











然 我 们 此 时 是 在 创建 























位 图 ， 但 位 图 并 不 是 在 本 次 使 用 ， 而 是 将 来 挂 载 本 分 区 的 时 候 再 用 。 为 什么 呢 ? 您 想 ， 分 区 挂 载 的 目的 是 












































了 1 肯定 还 是 














E 内 存 中 ， 但 挂 载 分 区 前 内 存 中 可 没有 位 图 ， 这 就 需要 事先 把 这 








些 位 图 提前 持久 化 到 磁盘 
内 存 不 能 长 久保 存 数据 ， 断 










































































前 所 做 的 工作 )， 挂 载 分 区 时 再 














巴 位 图 从 硬盘 上 加 载 到 内 存 。 由 于 
































的 一 切 都 会 灰飞烟灭 ， 所 以 即使 是 ; 
怕 只 是 更 改 了 一 个 位 ， 都 要 及 时 同步 持久 化 到 磁盘 上 。 但 是 您 看 到 了 ， 现 在 只 











宏 DIV_ ROUND _ UP 把 free_sects 除 以 BITS_ PER_SECTOR 向 上 取 整 





























尾 在 大 多 数 情况 下 都 会 有 多 余 的 位 ， 
正 资源 ”并 不 存在 ， 而 是 指向 了 硬盘 上 “其 他 不 属于 位 图 所 指 代 资 源 的 数据 ” 若 在 位 
居 。 我 们 现在 持久 化 到 磁盘 上 的 位 图 是 以 康 
尾 那 些 无 效 、 多 余 的 位 ， 因 此 现在 必须 将 这 些 多 余 位 初 
tH 现 错误 的 情况 。 也 许 有 

















这 些 位 的 话 ， 必 然 会 损坏 那 
载 分 区 时 ， 再 从 磁盘 上 恢复 的 位 图 也 会 包括 扇 区 末 
始 为 1， 将 来 就 不 会 再 分 配 这 些 位 对 





应 的 资源 了 ， 避 免 了 | 














温 





吗 ? 确实 是 可 以 这 么 做 , 但 还 
资源 情况 ， 资 源 的 状态 应 该 以 它 为 ? 
免 了 二 次 读 硬盘 的 操作 。 剧 透 一 下 ， 将 来 挂 载 分 区 时 把 位 图 从 硬盘 加 载 到 内 存 后 ， 内 存 中 位 棋 


























有 btmp bytes len 限制 吗 ， 






























































区 后 ， 内 存 中 的 位 图 哪 
块 位 图 大 小 是 通过 



























































于 中 最 后 1 扇 区 的 末 


也 就 是 说 这 些 多 余 的 位 并 不 代表 茶 个 资源 ,或 者 说 是 这 些 位 指 代 的 “ 真 
































图 操作 中 强行 使 用 














又 为 单位 的 ， 将 来 挂 
































的 位 肯定 不 能 超过 btmp bytes_ len 的 范围 。 是 的 ， 
里 来 呢 ? 难道 我 们 在 创建 文件 系统 时 将 资源 的 数量 〈 也 就 是 btmp_bytes_len) 























E， 毕 况 人 磁盘 上 的 位 图 是 唯一 的 位 





















































btmp_bytes_len= 位 图 占用 
扇 区 中 的 多 余 位 初始 为 1， 表示 它 
待 块 位 图 初始 化 完成 后 ， 在 第 84 行将 


























门 已 被 占用 ， 不 许 再 碰 啦 。 道 理 ; 








。 我 们 完全 可 以 在 加 载 位 图 后 再 i 
































| 











同学 会 问 ， 位 图 中 不 是 
是 btmp_bytes_len 的 值 

写 到 超级 块 或 菜 个 肩 区 '! 
如 来 源 ， 它 反应 了 最 真实 的 






































十 算出 btmp_bytes_len 的 值 ， 而 且 避 
































的 














区 的 位 数 。 因 此 在 将 位 图 持久 























加 
化 到 硬盘 之 前 ， 一 定 要 将 位 图 最 后 一 






























































写 入 硬盘 sb.block bitmap lba 处 。 


好 啦 ， 下 面 看 第 三 部 分 代码 ， 见 代码 14-5-3。 

















… 略 


( project/c14/a/fs/fs.c ) 


86 /太太 大 火炎 火炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 类 类 类 类 关头 炎炎 六 六 六 太太 大 大 大 大 大 


87 * 3 将 inogde 位 医 











92 /* 由 于 inode table 中 共 

* 位 图 inodqe_bitmap 了 
93 * 即 inoqe_bitmap_sects 等 于 
jl P 的 位 全 都 代表 ijnode table 























































































































94 * 无 需 再 像 block_ bitmap 那样 
区 中 没有 多 余 的 无 效 位 */ 
96 ide writel(hd, sb.inode bitmap lba, 








88 大 大 大 大 大 大 大 大 大 炎炎 火炎 
89 /* 先 清空 缓 交 
90 memset (buf, 
91 buf[0] |= Ox1; 
* 所 以 位 医 
95 * inode_bitmap 所 厂 


初始 化 并 写 入 sb.inode pbitmap lba * 


大 炎 大 炎炎 类 类 大 类 大 大 类 大 大 大 大 大 大 大 大 大 大 大 大 大 大 了/ 














第 0 个 inode 分 给 了 根 目录 








PP 的 inode， 



































二 一 扇 区 的 剩余 部 分 ， 























buf, sb.inode bitmap sects); 


98 /太太 大 类 火炎 炎炎 类 类 类 类 类 炎炎 炎炎 类 类 类 大 类 类 类 大 类 大 类 大 类 大 大 大大 大 大 大 大 大 


99 * 4 将 ijnode 数组 初始 化 并 写 入 sb.inode table lba * 


















































100 大火 类 大 类 类 炎炎 火炎 大 类 大 大 类 类 类 类 类 类 大 类 大 大 大 大 大 大 大 大 大 类 大 大 大 大 大 大 大 了/ 

101  ”/* 准备 写 inode table 上 录 所 在 的 inode */ 
102 memset (buf, // 先 清空 缓冲 区 buf 
103 struct inode* i truct inode*)buf; 

104 i->i size = sb.dir entry size * 2; // .和 .. 
105 i->i no = 0; 录 占 inode 数组 中 第 0 个 inode 
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完了 ， 代 码 部 分 见 注释 吧 ， 其 实 很 简单 。 
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06 1I->i_sectors [0] = sb.data start lba; 

/ 由 于 上 面 的 memset，i sectors 数组 的 其 他 元 素 都 初始 化 为 0 

07 ide write(hd, sb.inode table lba, buf, sb.inode table sects); 
08 

09 /太太 大大 火炎 炎炎 类 类 类 类 炎炎 炎炎 炎炎 炎炎 炎炎 大火 大头 大大 类 大 大头 大 大 大 大大 大 大 

10 * 5 将 根 目录 写 入 sb.data start lba 

二 汪 类 炎炎 大 类 类 大 类 类 大 类 类 大 大 大 类 大 大 炎炎 类 大大 大 大 大 大 大 类 大 大 大大 大 大 大 大 大 大 了/ 

12 /* 写 入 根 目 录 的 两 个 目录 项 .和 .. */ 

业 仿 memset (buf, 0, buf size) 

14 struct dir entry* p de = (struct dir entry*)buf; 

二 9 

16 /* 初始 化 当前 目录 "." */ 

二 了 memcpy (p_de->filename, ".", 1); 

8 p de->i no = 0; 

19 p_de->f type = FT DIRECTORY; 

20 p_det+t+; 

21 

22 /* 初始 化 当前 目录 父 目 录 ".." */ 

23 memcpy (p_de->filename, "..", 2);，; 

24 P_de->i no = 0; // 根 目录 的 父 目录 依然 是 根 目录 自己 

25 p_de->f type = FT DIRECTORY; 

26 

27 /* sb.data start lba 已 经 分 配给 了 根 目 录 ， 是 根 目 录 的 目录 项 */ 
28 ide write(hd, sb.data start lba, buf, 1); 

29 

30 printk(" root dir lba:0x%x\n", sb.data start lba); 
31 printk("%s format done\n", part->name); 

32 Sys_free (buf); 

33. 站 


代码 第 86 行 开始 准备 将 inode 位 图 写 入 磁盘 
中 第 0 个 inode 置 为 1， 原 
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让 
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的 
在 要 
大 小 


























不 














对 额外 处 理 人 什么。 好 啦 ， 下 














初始 
， 当 








Er 


化 第 0 个 inode 为 根 日 录 的 信 | 
录 时 ， 成 员 i_size 表示 出 
表示 当前 目录 的 “.” 和 上 一 级 目录 “..” 根 目录 也 不 能 例外 ,这 














扇 区 的 剩余 部 分 。 
数组 写 入 sb.inode table lba。 
inode table_sects 是 通过 宏 DIV_ ROUND _UP 除法 向 j 
上 占据 的 全 部 扇 区 中 ， 并 不 是 所 有 空间 都 是 inode_table 的 
区 ， 剩 余部 分 肯定 不 属于 inode table 中 的 inode。 不 过 
保证 inode_bitmap 不 越界 就 行 ， 而 inode_bitmap 
而 介绍 实际 代码 。 我 1 











让 




















上 取 整 
内 容 ， 大 多 数 情 
于 inode 数量 是 





录 。 


全 4096 个 inode，inode 位 图 node bitmap 正好 
最 后 在 第 96 行将 inode 位 图 





区 中 没有 

















写 入 磁盘 。 








得 到 的 结果 ， 
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又 ， 里 











完整 1 


器 











息 。 我 们 前 面 i 





寺 论 过 的 ， 
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因此 inode table 最 终 在 磁盘 
见 下 在 其 所 占据 的 最 后 不 足 一 
inode_bitmap 来 控制 
四 没有 多 余 的 位 ， 因 此 肯定 是 正确 


区 sb.inode_bitmap lba， 第 91 行将 inode 位 图 (buf) 
是 我 们 把 inode 数组 中 第 0 个 inode 分 配给 了 根 目 

分 区 只 支持 4096 个 文件 ， 也 就 是 inode 数组 inode_table 中 
用 1 扇 区 ， 即 inode bitmap _sects 等 于 1，inode_bitmap 所 在 
block_bitmap 那样 单独 处 理 最 后 
接 下 来 准备 把 inode 





占 





余 的 无 效 位 ， 因 此 无 需 再 像 块 





的 ， 只 





门 把 第 0 个 inode 已 经 分 配给 了 根 目录 ， 








大 





此 现 
































inode 指 代 的 是 目 

















目录 下 所 有 目录 项 的 大 小 之 和 。 
录 项 的 大 小 之 和 便 是 此 inode 中 i_size 

















和 王 何 目录 








两 个 目 











当 inode 指 代 的 是 普通 文件 时 ，i_size 是 文 
默认 都 会 有 





HH- 








的 值 ， 因 此 先 在 第 103 行将 buf 转换 为 inode 结构 struct inode 型 指针 后 ， 通 过 第 104 行 的 代码 “i->i_size = 


sb.dir_ entry_ size * 2” 将 isize 赋值 为 两 个 
为 0， 表 示 出 
此 inode 的 第 0 个 数 和 


















































录 项 的 大 小 。 第 105 行 
inode 自己 是 inode 数组 中 第 0 个 inode。 
居 块 指向 sb.data_start lba， 也 就 是 我 们 把 根 





第 106 行 











的 代码 “i->i no =0” 为 inode 5 


前 号 赋值 


























录 安 排 在 最 开始 的 空闲 块 中 。 由 于 


本 











的 代码 “i->i sectors[0] = sb.data start lba” 使 


A 


名 102 行 





的 memset 清 0 工作 ，i_sectors 数组 的 其 他 元 素 也 都 被 初始 化 为 0。 最 后 在 第 107 行 ， 将 inode 数组 写 入 硬盘 。 


表示 











最 后 





上 一 级 























冰 。 





第 114 行将 buf 转换 为 目录 项 struct dir_entry 型 指针 ， 山 
初始 化 。 在 第 117 行 
赋值 为 0， 使 其 指 
行 的 p_de++ 执 行 过 
































一 | 
已 ， 力 


ely 


根 














孙 

















项 工作 是 在 根 目录 中 写 目 录 项 ”和 ”.”。 任 何 






































3?? 
。 0 


录 都 有 这 两 个 目录 项 ，”” 











时 p_de 指向 buf， 接 下 来 先 对 第 1 个 目 
通过 memcpy 函数 把 ”>” 写 入 目录 项 的 filename 成 员 , 接 下 来 的 2 行 分 别 为 目录 项 的 ino 
录 项 的 f type 赋值 为 FT DIRECTORY， 使 其 类 型 为 上 
后 ，p_de 指向 下 一 目录 项 ” 

















录 。 


表示 当前 目录 ,”..” 





录 项 ”.” 


第 120 
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第 123 一 125 行 所 做 的 工作 是 初始 化 父 目 录 “…”， 原 理 同 当前 目录 “.” 一 样 ， 不 再 歼 述 。 接 下 来 在 第 128 
行将 根 目 录 写 入 磁盘 。 最 后 第 132 行 释放 缓冲 区 buf。 
有 关 创建 文件 系统 的 代码 到 这 就 结束 了 ， 现 在 还 没有 调用 它 的 方法 ， 接 下 来 仍然 在 fs.c 中 添加 个 函数 
filesys_init， 它 是 文件 系统 初始 化 函数 ， 如 代码 14-5-4 所 示 。 


代码 14-5-4 (project/c14/a/fs/fs.c ) 
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135 /x* 在 磁盘 上 搜索 文件 系统 ， 若 没有 则 格式 化 分 区 创建 文件 系统 */ 
136 void filesys init() { 




















































































































































































































37 uint8 t channel no = 0, dev no, part idx = 0; 
138 
139 /* sb_buf 用 来 存储 从 硬盘 上 读 入 的 超级 块 */ 
140 struct super block* sb buf = \ 
(struct super block*)sys malloc (SECTOR SIZE); 
141 
142 if (sb buf == NULL) { 
143 PANIC ("alloc memory failed!"); 
144 ‘ 
145 printk ("searching filesystem...... NE 呵 沪 
146 while (channel no < channel cnt) { 
147 dev no = 0; 
148 while(dev no < 2) { 
149 if (dev no == 0) { // 跨 过 裸 盘 hd60M. img 
150 dev_not++;} 
十 54 continue; 
152 } 
53 struct disk* hd = &channels[channel no] .devices[dev nol]; 
154 struct partition* part = hd->prim parts; 
155 while(part idx < 12) { // 4 个 逻辑 
156 if (part idx == 4) {  // 开始 处 理 逻 辑 分 区 
157 part = hd->logic parts; 
158 } 
E59 
160 /* channels 数组 是 全 局 变量 ， 默 认 值 为 0，disk 属于 其 岁 套 结构 ， 
161 * partition 又 为 disk 的 嵌 套 结构 ， 因 此 partition 中 的 成 员 默 认 也 为 0。 
162 * 若 partition 未 初始 化 ， 则 partition 中 的 成 员 仍 为 0。 
163 * 下 面 处 理 存 在 的 分 区 */ 
164 if (part->sec cnt != 0) { // 如 果 分 区 存在 
:65 memset (sb buf, 0, SECTOR SIZE); 
166 
167 /* 读 出 分 区 的 超级 块 ， 根 据 魔 数 是 否 正确 来 判断 是 否 存 在 文件 系统 */ 
168 ide read(hd, part->start lba + 1, sb buf, 1); 
169 
170 /* 只 支持 自己 的 文件 系统 ， 若 磁盘 上 已 经 有 文 牛 系统 就 不 再 格式 化 了 */ 
171 if (sb buf->magic == 0x19590318) { 
B72 printk ("$s has filesystem\n", part->name); 
173 } else { // 其他 文件 系统 不 支持 ， 一 律 按 无 文件 系统 处 理 
174 printk ("formatting %s‘’s partition $s...... \n",\ 
hd->name, part->name); 
小区 区 partition format (part); 
176 } 
177 } 
178 part idxt++; 
179 part++; // 一 分 区 
180 } 
181 dev_nott+; // 下 一 磁盘 
182 } 
183 channel not+; // 下 一 通道 
184 } 
185 Sys_free(sb buf); 
186 } 























代码 比较 容易 ， 咱 们 就 不 说 那么 细 了 ， 从 第 146 行 开始 在 分 区 上 扫描 文件 系统 ， 我 们 这 里 只 支持 
partition format 创建 的 文件 系统 ， 其 魔 数 等 于 0x19590318， 如 果 未 发 现 魔 数 为 0x19590318 的 文件 系统 就 
调用 partition_format 去 创建 。 这 里 面 是 通过 三 层 循环 完成 的 ， 最 外 层 循环 用 来 遍历 通道 ， 中 间 层 循环 用 来 
遍历 通道 中 的 硬盘 ， 最 内 层 循 环 用 来 遍历 硬盘 上 的 所 有 分 区 。 
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咱们 对 每 个 硬盘 最 多 支持 12 个 分 
时 只 需要 


全 部 主 分 



































区 ， 即 4 个 





区 都 处 理 完了 , 于 是 在 第 157 行将 part 指向 硬盘 的 逻辑 分 


主 分 区 和 8 个 逻辑 分 区 ， 









































虽然 我 们 支持 12 个 分 区 ， 但 并 不 表示 硬盘 上 
区 是 否 存在 ， 这 是 通过 分 区 的 sec_cnt 是 
的 硬盘 作为 全 局 数组 channels 的 内 髓 成 


此 只 要 分 








164 行 判断 分 
因 是 分 区 
表 的 时 候 会 把 分 区 的 信息 写 到 part 中 ， 
们 这 里 用 sec_cnt 来 判断 而 

第 167 行 开 始 读 分 
就 表示 已 经 有 文件 系统 ， 不 

好 啦 ， 本 节 的 代码 就 这 些 ， 
























































Lo 





























马上 


去 格式 它 








FP 存在 12 个 分 











区 ， 因 此 在 进行 格式 


区 数组 ， 也 就 是 第 一 


比分 








此 在 第 155 行 遍 历 硬 盘 分 
循环 12 次 。part 用 于 指向 每 一 个 分 区 , 在 第 156 行 ， 当 分 区 索引 变量 part idx 等 于 4 时 ， 这 表示 
区 的 地 二 
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o 





个 逻辑 分 
区 之 前 ， 
































I 





否 为 0 来 判 
号 
JN， 





断 的， 之 所 以 可 以 
全 局 变量 会 被 初始 化 为 





























大 











区 的 超级 块 ， 目 的 是 获取 超级 块 中 的 
。 和 否则 在 第 175 








有 译 运行 ， 看 看 效果 ， 如 




















又 不 存在 ， 分 任意 成 员 的 




















X. part : 





AAA 
FE 
2 








魔 数 。 在 第 171 行 若 判 断 出 
对 此 分 区 执行 格式 化 。 其 人 
14-12 所 示 。 








et 
































Bochs x86 emulator, http://bochs.sourceforge.net/ 


inode_ 


inode bitmap_sec 


inode_table_lhb 
inode_table_se 
data_start_lba 


inode_cnt 

LT 
block_bitmap_s 
inode_bitmap_lba 
inode_bitmap_sec 
inode_table ai 








itmap_lba:9x162 


h9 


9x1 









































] 此 变量 来 





0。 我 们 在 扫 








先 在 
断 ， 


分 














描 
只 是 





直 都 会 是 0， 























"AE 


湛 风 河流 


魔 数 为 0x19590318， 
也 部 分 不 多 说 了 。 






























































































































































Sdb9 format done 
IPS: 28.946N um laps leca lo:onlkn:osl TT TT 1 1 
4 图 14-12 分 区 格式 化 
硬盘 hd80M.img 中 分 区 较 多 ， 包 括 1 个 主 分 区 、5 个 逻辑 分 区 ， 因 此 输出 信息 较 多 ， 图 14-12 所 示 是 
最 后 两 个 分 区 的 格式 化 信息 。 当 下 一 次 运行 时 ， 由 于 已 经 有 了 文件 系统 ， 因 此 不 会 再 进行 格式 化 工作 ， 运 
行 结果 如 图 14-13 所 示 。 
all partition i 
start_lba 
5 start_lba 
start_lba 
start_lba 
start_lba:Qx1629F, sec_cnt 
9 start_lba:OQx1D8BF, sec_cnt :Ox 
CTRL + 3rd button enables nouse NM lcars cPL hoomlhn:osl | 1 1 1 1 
4 图 14-13 ”检测 到 文件 系统 
本 节 有 些 长 ， 不 过 总 算 结 束 了 ， 大 人 辛苦 了 ， 咱 们 下 节 继 续 。 
14.2.3 挂 载 分 区 
如 果 大 伙 儿 最 先 使 用 的 操作 系统 是 Windows 的 话 ， 想 必 您 还 记得 刚 接触 过 Linux 的 时 候 ， 一 定 对 其 目录 
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09 


结构 很 不 适应 。Windows 系统 的 分 区 盘 符 简单 日 
和 大 不 相同 ， 分 区 使 用 的 时 候 可 以 单独 “ 拿 ” 蝇 











有 了 ，C、D、E 盘 直 接 摆 在 那 ， 用 不 用 都 看 得 
8 来 ， 不 用 的 时 候 还 可 以 “ 收 ” 起 来 。 


到 。 而 Linux 中 















































Linux 内 核 所 在 的 分 区 是 默认 分 区 ， 
的 ， 要 想 使 用 其 他 新 分 区 的 话 ， 需 要 用 mount 命 























自 系统 启动 后 就 以 该 分 


今 


令 手动 把 新 的 分 区 挂 载 到 


区 为 默认 分 区 ， 该 分 区 的 根 目录 是 固定 存 


默认 分 区 的 某 个 目录 下 ， 这 就 



















































































上 面 所 说 的 “ 拿 ” 出 来 。 尽 管 其 他 分 区 都 有 自 
忆 此 挂 载 分 区 之 后 ， 整 个 路 径 树 就 像 一 串 葡萄 。 
看 所 说 的 “ 收 ” 起 来 。 

我 们 要 想 实现 文件 操作 ， 肯 定 要 
们 需要 随意 操作 任何 一 个 分 区 ， 


| 
但 又 不 完全 是 


但 又 不 完全 是 ， 








[= 
日 


































































































己 的 根 


肯定 操作 哪个 分 区 ， 对 骨 
因此 我 介 
因为 mount 命令 是 把 一 个 分 
3 们 的 操作 系统 安装 到 裸 盘 hd60M.img 上 ， 上 面 没 有 
k 实 要 想 把 操作 系统 安装 到 文件 系统 上 ， 必 须 在 实现 内 核 这 


日 是 默认 分 区 的 根 目 录 才 是 所 有 分 区 的 父 目 
的 时 候 还 可 以 通过 umount 命令 扼 载 ， 这 就 











水 ， 
区 不 























分 








个 分 区 上 的 文件 执行 读 写 操作 。 磁盘 上 的 分 
实现 分 区 挂 载 的 功能 。 此 功能 类 似 Linux 的 mount 
区 挂 载 到 默认 分 区 《操作 系统 所 在 分 区 ) 的 某 个 
分 区 ， 更 谈 不 上 文件 系统 了 。 


分 
前 先 实现 文件 系统 模块 至少 得 完成 写 文 








] 有 要 









































件 的 功能 ， 然 后 把 操作 系统 通过 写 文件 功能 写 到 文人 
吧 ， 无 论 是 安装 Windows， 还 是 Linux， 安 装 过 程 中 


系统 来 格式 化 i 














玄 分 区 ，Windows 系统 通常 是 fat32 或 ntfs，Linux 系统 通 


F 系 统 上 。 举 个 例子 ， 大 伙 儿 还 对 安装 操作 系统 有 印象 
都 是 先 选择 安装 到 哪个 分 区 上 ， 然 后 选择 以 什么 文件 
常 是 ext2 或 ext3， 在 为 该 分 区 格 









































式 化 出 文件 系统 之 后 才 开始 正式 的 安装 ,安装 界 














通 

















常 是 介绍 系统 的 最 新 特性 之 类 ， 最 终 操作 系统 就 被 安 





























但 这 村 


做 的 话 我 怕 会 在 本 书 的 开头 就 吓 跑 很 多 兄弟 ， 一 














装 到 某 种 文件 系统 上 了 。 尽 管 我 们 也 可 以 这 么 做 ， 

















开始 就 很 麻烦 的 话 确实 会 打击 学 习 兴 趣 ， 毕 竞 虽 1 


门 是 在 学 习 操作 系统 的 实现 原理 


E， 而 不 是 真 的 像 商 业 操作 
























































系统 那样 做 得 有 模 有 样 , 而 且 不 怕 您 笑话 , 小 弟 我 确 
哈哈 。 好 啦 ， 回 来 说 正经 的 ， 既 然 操作 系统 不 在 文 伯 
到 哪个 目录 下 ， 因 此 咱们 要 实现 的 提 


提 


















































心 > 台 已 


头 尼 
载 功能 很 简单 一 一 
载 分 区 的 实质 是 把 该 分 区 文件 系统 的 元 信息 从 硬盘 














有 限 , 也 不 曾 想 过 先 创建 文人 
系统 上 ， 也 就 没有 默认 目录 ， 那 就 不 用 考虑 分 
直接 选择 待 操作 的 分 
8 来 加 载 到 内 存 中 , 这 样 硬 盘 资 源 的 变化 都 


系统 再 创建 内 核 ， 
区 挂 载 
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[| 
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上 读 昌 














用 内 存 中 元 信息 来 跟踪 ， 如 果 有 写 操作 ， 
们 对 持久 化 的 讨论 吗 ? 就 是 为 了 现在 做 + 


























及 时 将 内 存 中 的 元 信息 同步 写 入 到 硬盘 以 持久 化 。 还 记 
全 备 ， 不 多 说 了 ， | 


得 上 节 咱 


村 











上 代码 ， 见 代码 14-6。 



















































































代码 14-6 (project/c14/b/fs/fs.c ) 
… 略 
14 struct partition* cur part; // 默认 情况 下 操作 的 是 哪个 分 区 
15 
16 /* 在 分 区 链表 中 找到 名 为 part_name 的 分 区 ， 并 将 其 指针 赋值 给 cur _ part */ 
17 static bool mount partition(struct list elem* pelem, int arg) { 
1 char* part name = (char*)arg; 
19 struct partition* part = elem2entry(struct partition, part tag, pelem); 
之 日 if (!strcmp (part->name, part name)) 
21 cur part = part; 
22 struct disk* hd = cur part->my disk; 
23 
24 /* sb_buf 用 来 存储 从 硬盘 上 读 入 的 超级 块 */ 
25 struct super block* sb buf = \ 
(struct super block*)sys malloc (SECTOR SIZE); 
26 
27 /* 在 内 存 中 创建 分 区 cur_part 的 超级 块 */ 
28 cur part->sb = (struct super block*)\ 
sys malloc(sizeof (struct super block)); 
29 if (cur part->sb == NULL) { 
30 PANIC ("alloc memory failed!"); 
31 } 
32 
33 /* 读 入 超级 块 */ 
34 memset (sb buf, 0, SECTOR SIZE); 
35 ide read(hd, cur part->start lba + 1, sb buf, 1); 
36 
37 /* 把 sb_buf 中 超级 块 的 信息 复制 到 分 区 的 超级 块 sb 中 */ 
38 memcpy (cur part->sb, sb buf, sizeof(struct super block)); 
39 
40 /大业 火炎 炎炎 火炎 六 大 将 硬盘 上 的 块 位 图 读 入 到 内 存 六 大 类 类 火炎 炎炎 类 类 炎炎 类 类/ 
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14.2 

41 cur part->block bitmap.bits =\ 

(uint8 t*)sys malloc(sb buf->block bitmap sects * SECTOR SIZE); 
42 if (cur part->block bitmap.bits == NULL) { 
43 PANIC("alloc memory failed!"); 
44 } 
45 cur part->block bitmap.btmp bytes len =\ 

sb buf->block bitmap sects * SECTOR SIZE; 
46 /* 从 硬盘 上 读 入 块 位 图 到 分 区 的 block bitmap.bits */ 
47 ide read(hd, sb buf->block bitmap lba, \ 

cur part->block bitmap.bits, sb buf->block bitmap sects); 
48 /类 太 大业 炎炎 炎炎 炎炎 炎炎 类 类 类 大 类 类 大 类 类 大 类 类 类 大 炎炎 大 类 类 大 类 类 类 大 大 类 大 类 类 大 类 大 大 大 大 大 大 大 类 大 大 大 大 大 大 大 大 大 大 了 
49 
50 /六 炎炎 炎炎 火炎 炎炎 大 将 硬盘 上 的 inode 位 图 读 入 到 内 存 六 类 类 类 类 炎炎 次 类 类 类 大/ 
51 cur part->inode bitmap.bits =\ 

(uint8 t*)sys malloc(sb buf->inode bitmap sects * SECTOR SIZE); 
52 if (cur part->inode bitmap.bits == NULL) { 
53 PANIC ("alloc memory failed!"); 
54 } 
与 与 cur part->inode bitmap.btmp _ bytes len =\ 

sb buf->inode bitmap sects * SECTOR SIZE; 
56 /* 从 硬盘 上 读 入 inode 位 图 到 分 区 的 inode bitmap.bits */ 
5 ide read(hd, sb buf->inode bitmap lba \ 

cur part->inode bitmap.bits, sb buf->inode bitmap sects); 
58 /类 太 大业 炎炎 类 炎炎 炎炎 大 类 类 类 大 类 类 大 类 类 大 类 大 类 大 大 类 大 大 类 大 类 类 类 大 类 类 大 类 类 大 大 大大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 了 
59 
60 list init(&cur part->open inodes); 
61 printk ("mount %s done!\n", part->name); 
62 





63 /* 此 处 返回 true 是 为 了 迎合 主 调 函 数 1ist_traversal 的 实现 ， 


* 与 函数 本 身 功能 无 关 。 














64 * 只 有 返回 true 时 1ist traversal 才 会 停止 遍历 ， 



































* 减少 了 后 面 元 素 无 意义 的 遍历 */ 
65 return true; 
66 } 
67 return false; // 使 1ist_traversal 继续 遍历 
68 } 
… 略 


192 void filesys init() { 








… 略 

243 /* 确定 默认 操作 的 分 区 */ 

244 char default part[8] = "sdbl"; 

245 /* 挂 载 分 区 */ 

246 list traversal(&partition list, mount partition, (int)default part); 
247 } 





我 们 先 看 代码 第 244 行 ，default_part 为 默认 分 区 的 名 称 ， 其 值 为 sdb1， 也 就 是 说 我 们 默认 操作 的 分 
载 是 借助 函数 list_traversal 完成 的 ， 第 246 行 的 “list_traversal(&partition_list, mount_partition, 
] mount_partition(default_part) 处 理 每 一 个 分 区 。 其 中 partition_list 是 所 


是 sdbl。 分 区 挂 
(inbdefault parb;”， 功 能 相当 了 


有 分 区 的 列表 ， 





list_traversal(struct list* plist function func, int arg)” 其 功能 是 遍历 plist 中 所 有 元 素 , 直到 func(arg) 返 







































































+ 








x| 





mount_partition 是 一 会 我 们 要 介绍 的 挂 载 分 区 的 函数 ，(int)default_part 将 数组 地 址 转换 
成 整 型 作为 mount_partition 的 参数 ， 参 数 转换 为 整 型 的 原因 是 list_traversal 原型 是 “struct list_elem* 












































或 者 列表 元 素 全 


部 遍历 结束 。 








好 啦 ， 我 们 介绍 下 mount partition， 请 移 步 代 码 第 17 行 。 


函数 mount partition 是 list_traversal 的 回调 函 








I 





true 





数 ， 其 接受 两 个 参数 ，pelem 是 list_traversal 传 给 它 的 列 


表 中 的 元 素 ， 在 此 处 pelem 是 分 区 partition 中 的 part tag 的 地 址 。arg 是 待 比 对 的 参数 ， 此 处 是 分 区 名 。 函 


























数 功能 是 在 分 区 链表 中 找到 免 为 part_ name 的 分 区 ， 并 将 其 指针 赋值 给 cur_part。cur_part 是 在 第 14 行 定义 














的 全 局 变量 ， 它 用 来 记录 默认 操作 的 分 区 。 
第 18 行将 arg 还 原 为 字符 指针 ， 赋 值 给 part name。 第 19 行将 pelem 通过 宏 elem2entry 还 





Para 


所 20 行 ， 


























原 为 分 区 part。 





通过 strcmp 比 对 part->name 和 part name， 如 果 相 等 则 找到 了 该 分 区 ， 接 下 





来 开始 加 载 该 
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区 的 元 信息 。 
































获 








第 25 行 申请 了 一 扇 
28 行 创 建 分 区 cur part 的 超级 块 cur part->sb， 为 此 在 第 28 行 日 











合生 


和 朱 








先 在 第 21 行将 找到 的 分 区 指针 part 赋值 
得 分 区 所 在 的 硬盘 hd，hd 将 作为 后 续 硬 盘 操 作 的 参数 。 
区 大 小 的 内 存 作 为 缓冲 区 sb buf，sb_buf 用 于 容纳 从 硬盘 读 取 的 1 扇 
请 超级 块 大 小 的 内 存 ， 然 后 赋 但 

















第 








请 成 功 后 ， 在 





2 





给 cur_part->sb。 内 存 ! 














给 

















cur_part， 也 就 是 说 找到 了 默认 的 分 区 。 然 后 在 第 22 行 




















35 行 读 入 超级 块 到 sb_ buf， 然 后 在 第 38 行将 缓冲 
区 ， 但 我 们 的 struct super block 结构 


区 大 小 的 超级 块 。 
































区 sb buf 中 超 


























级 块 的 信息 复制 到 cur part->sb， 这 么 做 的 原因 是 超级 块 虽然 占 一 扇 
并 没有 一 局 区 大 小 ， 所 以 只 把 超级 块 中 有 用 的 信息 复制 过 来 ， 那 些 














pad[460] ”就 不 要 了 ， 


第 41 行为 当前 分 区 cur_part 的 块 位 





SECTOR SIZE。 


A 


条 








45 行 初始 化 块 位 
数 block_bitmap_sects 乘 
第 47 行将 硬盘 上 的 块 位 图 读 入 到 内 存 ， 











毕竟 没 用 ， 还 占 内 存 。 




















图 申 











多 





的 btmp_bytes_len， 

















区 越 大 ， 块 位 
都 容纳 不 了 的 





分 














| 





情况 ， 




















图 占用 的 





内 存 就 越 多 ， 因 此 物 






































于 填充 的 超级 块 
请 内 存 ， 内 存 大 小 是 超级 块 中 的 block_bitmap_sects 乘 以 


上 节 讨 论 持久 化 元 信息 的 时 候 
以 扇 区 大 小 SECTOR_SIZE 的 值 作为 位 图 btmp_bytes_len 的 值 。 


也 就 是 读 到 cur part->block bitmap.bits， 完 成 了 块 位 








的 数组 “uint8 _t 




















j 块 位 





剧 透 过 ， 占用 的 扇 





加 
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的 加 载 。 




















上 
里 说 的 是 咱 1 


哈哈 ， 我 这 




































































内 存 一 定 要 匹配 ， 不 要 出 现 物 理 











内 存 太 小 而 分 区 太 大 ， 连 块 位 





门 虚拟 机 的 配置 ， 线 上 服务 器 都 不 会 。 


































































































第 50 一 58 行 是 将 inode 位 图 读 入 到 内 存 ， 与 载 入 块 位 图 同 理 ， 不 说 了 。 
第 60 行 初始 化 分 区 的 open_inodes 列表 。 到 此 函数 mount_partition 介绍 完了 。 
编译 运行 ， 结 果 如 图 14-14 所 示 。 

start_lba:Ox1629F, sec_ 

start_lba:Qx1D8BF, sec_cnt: 

8 filesystem 

db1l donet! 

IPS: 29.560M um lears lscre lm:onlm:osl | | Ti 
4 图 14-14 分 区 挂 载 演示 

哈哈 ， 图 上 并 没有 什么 实质 的 信息 ， 就 在 最 下 面 打 印 出 








好 啦 ， 本 节 就 到 这 ， 下 节 再 

















见 啦 。 








文件 描述 符 简介 





14.3.1 














文件 描述 符 














原理 




















“mount sdbl done!”， 挂 载 显得 好 “低调 ” 


Linux 中 所 有 文件 操作 都 基于 文件 描述 符 ， 为 此 咀 们 简短 介绍 一 下 这 个 概念 。 























述 符 ”( 纯 属 个 人 杜撰 ， 仪 是 为 了 突显 与 文件 描述 符 的 区 别 )， 用 于 
操作 系统 为 自己 的 文件 系统 准备 的 数据 结构 ， 它 用 于 文件 存储 的 管理 ， 与 用 
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在 这 之 前 ， 我 们 已 经 知道 文件 是 用 inode 来 表示 的 ， 个 人 觉得 ，inode 其 实 也 可 称 为 “文件 数据 块 描 
i 述 文件 的 存储 、 权 限 等 。 












































日 inode 是 





























] 户 关系 不 大 ， 咀 们 要 介绍 的 文 


件 描 


象 是 











述 符 才 是 与 用 户 上 息息相关 的 。 
文件 描述 符 即 file descriptor， 但 凡 叫 “ 






























































述 符 ” 的 数据 结构 都 用 于 描述 一 个 对 象 ， 文 件 描述 符 所 描述 的 对 











文件 的 操作 。 为 了 搞 清 楚 文 件 描述 符 的 意义 ， 虽 们 先 看 下 它 与 inode 的 区 别 和 联系 。 
还 是 拿 Linux 举例 ， 读 写 文件 的 本 质 是 : 先 通过 文件 的 inode 找到 文件 数据 块 的 扇 区 地 址 ， 随 后 读 写 














该 肩 


不 关 


区 ， 从 而 实现 了 文件 的 读 写 。 几 乎 所 有 的 操作 系统 都 允许 一 个 进程 同时 、 多 次 、 打 开 同 一 个 文件 (并 
闭 )， 同 样 该 文件 也 可 以 被 多 个 不 同 的 进程 同时 打开 。 为 实现 文件 任意 位 置 的 读 写 ， 执 行 读 写 操作 时 














可 以 























指定 偏 移 量 作 为 该 文件 内 的 起 始 地 址 ， 此 偏 移 量 相 当 于 文件 内 的 指针 。 也 就 是 说 ,该 文件 每 被 打开 一 




















次 ， 
操作 


文件 读 写 的 偏 移 量 都 可 以 任意 指定 ， 





即 对 














同一 个 文件 的 多 次 读 写 都 是 各 自 操 作 各 自 的 ,任意 一 个 文件 















































的 偏 移 量 都 不 影响 其 他 文件 操作 的 偏 移 量 。 注意 ， 这 里 所 说 的 是 “ 互 不 影响 ”是 指 文件 内 的 “ 偏 移 量 ”， 




















并 不 




















的 操 
缓冲 














作 都 只 是 读 写 文件 的 一 小 部 分 数据 ， 
区 较 小 , 所 以 文件 的 读 写 并 不 是 一 次 








完成 
录 下 





的 ， 下 一 次 读 写 的 位 置 必须 以 上 一 次 
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中 


民 























把 有 
称 为 
打开 
现 了 
如 图 





该 数 


急 ， 
用 于 
































是 文件 内 容 ， 因 为 文件 内 容 是 共享 的 ， 对 文件 内 容 的 修改 必然 会 相互 影响 。 另 外 ， 通 常情 况 下 对 文件 
使 想 读 写 整个 文件 的 话 ， 由 于 一 般 文件 的 体积 都 较 大 ， 而 内 存 
性 从 头 到 尾 操作 整个 文件 ,往往 是 通过 连续 多 次 的 小 数据 量 读 写 
的 读 写 位 置 为 起 始 ， 因 此 , 文件 系统 需要 把 任意 时 刻 的 偏 移 量 记 
来 。 问 题 来 了 ， 偏 移 量 应 该 记录 在 哪里 呢 ? inode 中 肯定 不 记录 这 些 与 文件 操作 相关 的 数据 ， 人 家 只 
限 的 空间 记录 与 存储 相关 的 信息 。 为 解决 这 个 问题 ，Linux 提供 了 称 为 “文件 结构 ”的 数据 结构 (也 





































































































file 结构 )， 专 门 用 于 记录 与 文件 操作 相关 的 信息 ， 每 次 打开 一 个 文件 就 会 产生 一 个 文件 结构 ， 多 次 
该 文件 就 为 该 文件 生成 多 个 文件 结构 ,各 
“即使 同一 个 文件 被 同时 多 次 打开 ,各自 操作 的 偏 移 量 也 互 不 影响 ”的 灵活 性 。 文 件 结构 的 逻辑 表示 


























14-15 所 示 ， 这 是 文件 结构 中 最 基本 的 数据 成 员 。 
Linux 把 所 有 的 “文件 结构 ”组 织 到 一 起 形成 数组 统一 管理 ， fdflag  ”// 文件 打开 的 标志 如 0_CREAT 






































毕竟 我 还 没 介绍 完 呢 ， 虽 们 一 步 一 个 








组 称 为 文件 表 ， 咳 咳 ， 我 们 要 多 次 引用 
也 许 现在 您 感觉 有 些 模糊 ， 似 乎 无 法 将 相关 概念 贯穿 起 来 ,不 
脚印 ， 先 总 结 一 下 ，inode $ 







































































描述 文件 存储 相关 信息 ， 文 件 结构 用 了 





此 概念 。 fd_inode // inode 指针 











自 文件 操作 的 偏 移 量 分 别 记录 在 不 同 的 文件 结构 中 ， 从 而 实 
























































fd_pos // 文件 偏 移 量 





















































到 14-15 文件 描述 符 逻 辑 结 构 





























描述 “文件 打开 ”后 ， 文 件 读 写 偏 移 量 等 信息 。 文 件 与 inode 
对 应 ， 一 个 文件 仅 有 一 个 inode， 一 个 inode 仅 对 应 一 个 文件 。 一 个 文件 可 以 被 多 次 打开 ， 因 此 一 个 





inode 可 以 有 多 个 文件 结构 ， 多 个 文件 结构 可 以 对 应 同一 个 inode。 


个 例 
路 径 








现在 该 说 说 文件 描述 符 了 ， 在 Linux 中 ， 我 们 读 写 函 数 文 件 时 都 是 通过 操作 文件 描述 符 来 完成 的 。 举 
子 ， 拿 open 函数 来 说 ， 其 原型 为 int open(const char *pathname, int flags)，pathname 是 待 打开 的 文件 

























































































及 文件 名 ，flag 是 打开 标识 ， 调 用 它 之 后 ， 系 统 会 返回 文件 pathname 的 文件 描述 符 。 不 过 这 些 都 不 











重要 , 重要 的 是 返回 值 类 型 为 int, 这 说 明 返 回 





没 错 
整数 ， 准 确 地 说 ， 它 是 PCB 中 文件 描述 符 数 组 元 素 的 下 标 ， 只 不 过 此 数字 并 不 用 来 表示 “数量 ”， 而 是 用 
来 表示 “位 置 ” 它 是 位 于 进程 PCB 



































值 是 个 整 型 数字 。 数字 ? 我 怎么 记得 返回 的 是 文件 描述 符 ? 























， 这 不 冲突 ，open 是 返回 一 个 数字 ， 而 该 数字 就 是 我 们 所 说 的 文件 描述 符 ， 文 件 描述 符 确 实 只 是 个 


























FP 的 文件 












































TT 














蕴 述 符 数 组 的 元 素 的 下 标 ， 而 文件 描述 符 数组 元 素 中 的 信息 














又 指向 文件 表 中 的 某 个 文件 结构 。 对 此 感到 费解 ?咱们 慢 慢 说 。 
在 Linux 中 每 个 进程 都 有 单独 的 、 完 全 相同 的 一 套 文件 描述 符 ， 因 此 它们 与 其 他 进程 的 文件 描述 符 互 不 


干涉 ， 这 些 文件 描述 符 被 组 织 成 文件 描述 符 数组 统一 管理 。 您 看 到 了 ， 图 14-15 是 最 基本 的 文件 结构 ， 这 3 
员 要 占用 十 几 字 节 的 空间 ， 前 面 说 过 了 ， 打 开 一 个 文件 时 会 产生 一 个 文件 结构 ， 这 要 是 该 任务 同时 打开 


个 成 
N 多 
























































































































































个 文件 ,文件 表 可 就 大 了 。 通 常情 况 下 为 避免 文件 表 占 用 过 大 的 内 存 空 间 ,文件 结构 的 数量 必须 是 有 限 














的 ， 这 就 是 进程 可 打开 的 最 大 文件 数 有 限 的 原 
3 个 都 是 标准 的 文件 描述 符 ， 如 文件 描述 符 0 表示 标准 输入 ，1 表示 标准 输出 ，2 表示 标准 错误 。 为 什 


的 前 
么 文 





文件 
9 指 





















































忆 《〈 在 Linux 中 可 用 ulimit 命令 来 修改 )。 文 件 描述 符 数组 中 
























































































































































件 描述 符 是 数字 ， 而 不 是 像 其 他 描述 符 那 样 ， 是 个 具有 多 个 成 员 属性 的 复合 数据 结构 ? 原因 有 两 个 。 

(1) 为 了 一 视 同 仁 ， 使 各 进程 可 打开 的 文件 数 是 一 样 的 ， 各 进程 必须 有 独立 的 、 大 小 完全 一 样 的 一 套 
描述 符 数组 ， 而 不 能 所 有 进程 共享 同一 套 文 件 描述 符 数组 ， 比 如 A、B 两 个 进程 都 可 以 用 文件 描述 符 
向 任意 文件 (相同 或 不 同 的 文件 都 可 以 )。 相 反 ， 如 果 所 有 进程 共享 同一 套 文件 描述 符 数组 的 话 ， 如 
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而 PCB 占用 的 
合 以 上 两 个 原因 ， 通 常情 况 下 不 会 把 “真正 的 、 庞 大 
PCB 中 建立 个 文件 描述 符 数组 就 可 以 了 ， 该 数组 成 员 不 需要 是 真 J 
于 简单 处 理 ， 咱 们 用 int 整 型 就 足够 了 ， 用 它 存 储 文 伯 














结 






































F 描 述 符 9， 进 程 B 只 有 使 用 其 

(2) 文件 结构 中 包含 进程 执行 文件 操作 的 偏 移 
PCB 中 管理 。 但 当 进 程 打开 的 文件 数 增多 的 时 候 ， 文 件 表 ( 
内 存 通常 就 是 几 个 页 框 ，Linux 中 的 PCB 也 只 是 2 页 框 大 小 ， 纶 


也 空闲 的 文 位 
它 属于 与 各 个 任务 单独 绑 定 的 资源 ， 因 此 最 好 放 在 
结构 组 成 的 数组 ) 占用 的 空间 较 大 ， 
们 PCB 只 占用 1 页 框 。 

F 表 塞 到 狭小 的 PCB 中 ， 一 般 只 要 在 











描述 符 。 












































1 文 介 























的 ”文人 












































数 传 给 












































图 或 链表 为 任务 支持 更 多 ， 甚 至 无 限 的 最 大 打开 文 伯 
回 的 是 该 进程 PCB 中 文件 描述 符 数组 下 标 值 ， 也 就 是 文件 

Linux 中 的 文件 操作 通常 是 先 用 open 打开 文 从 
read 或 write 等 函数 对 该 文件 进行 读 写 操 作 
也 就 是 文件 描述 符 来 找到 文件 数据 块 的 ， 话 说 要 想 
了 解 此 过 程 ， 必 须要 了 解 此 过 程 涉及 的 数据 结构 及 
过 程 组 织 形 式 。 咱 们 就 不 卖 关 子 了 ， 整 个 过 程 全 景 
图 如 图 14-16 所 示 。 
14-16 是 Linux 通 过 文件 描述 符 碍 找 文 件数 据 
块 的 过 程 ， 这 涉及 到 以 下 三 个 数据 结构 ， 它 们 都 是 


































































































位 于 内 存 中 的 。 


(1) PCB 中 的 文件 描述 符 数组 。 











(2) 存储 所 有 文件 结构 的 文件 表 。 
(3) inode 队列 ， 也 就 是 inode 缓存 。 


现 




















在 从 左 到 右 梳理 一 下 图 14-16， 某 进程 把 文人 
件 描述 符 在 该 进程 的 PCB 中 












































下 标 ， 





























数 时 会 再 次 提 到 。 


以 上 描述 的 是 Linux 如 何 通过 文件 描述 符 “曲折 地 ”找到 文 伯 
于 有 了 文件 描述 符 之 后 的 事 了 ， 文 件 描述 符 是 如 何 创 建 的 呢 ? ” 



























































(1) 在 全 


述 符 
建 好 的 全 局 数 








| 数 。 当 








结构 〈 至 少 包括 3 个 成 员 )， 出 
F 表 中 文件 结构 的 下 标 ， 如 果 您 愿意 的 话 ， 可 以 用 位 


























以 获取 该 文人 















































































































































j 户 进程 打开 文件 时 ,文件 系统 给 用 户 进 程 返 
述 符 。 

的 文件 描述 符 ， 然 后 将 文件 描述 符 作为 参 
。 大 家 肯定 想 知 道 Linux 是 如 何 通 过 一 个 简单 的 数字 ， 





































































































该 下 标 在 文件 表 中 索引 相应 的 文件 结构 ， 从 该 文 伯 
的 数据 块 。 提 示 一 下 ， 若 该 inode 在 inode 队列 中 不 存在 ， 此 时 会 多 一 个 处 理 雯 
上 将 该 inode 加 载 到 inode 队列 中 ， 并 使 文件 结构 中 














PCB 
inode 队列 

文 文件 结构 inod 
售 | | 的 下 宗 了 和 
数 文件 结构 inode 
组 的 下 标 网 

es 

A F 描 述 符 与 inode 关联 关系 














F 描 述 符 作为 参数 提交 给 文 
的 文件 描述 符 数组 中 索引 对 应 的 元 素 ， 从 该 元 素 中 获取 对 应 的 文件 结构 的 
的 inode， 最 终 找 到 了 文件 
是 :文件 系统 会 从 硬盘 
的 fd_inode 指向 它 ， 将 来 介绍 inode 操作 相关 的 函 














结构 中 获取 文件 























系统 时 ， 文 件 系统 用 此 文 


























数据 块 ， 聪 明 的 您 一 定 在 暗 想 :“ 这 属 
其 实 open 操作 的 本 质 就 是 创建 相应 文件 


























的 过 程 ， 剧 透 一 下 ，PCB 中 文件 描述 符 数组 是 提前 在 task_struct 中 构建 好 的 ， 文 件 表 也 是 提前 构 






































居 结 构 ，inode 队列 也 已 经 构建 好 了 ， 因 此 笼统 地 说 ， 创 建文 件 描述 符 的 过 程 就 是 逐 层 在 
这 三 个 数据 结构 中 找 空位 ， 在 该 空位 填充 好 数据 后 返回 该 位 置 的 地 址 ， 比 如 : 


























局 的 inode 队列 中 新 建 一 inode (这 肯定 是 在 空位 置 处 新 建 )， 然 后 返回 























该 inode 地 址 。 








(2) 在 全 局 的 文件 表 中 的 找 一 空位 ， 在 该 位 置 填充 文件 结构 ， 使 其 全 inode 指向 上 一 步 中 返回 的 inode 
地 址 ， 然 后 返回 本 文件 结构 在 文件 表 中 的 下 标 值 。 


(3) 在 PCB 中 的 文件 描述 符 数组 中 找 一 空位 ， 使 该 位 置 的 值 指向 




































































返回 本 文件 描述 符 在 文件 描述 符 数 组 中 的 下 标 值 。 
以 上 过 程 正 是 咱们 要 实现 的 。 











您 看 ,为 了 实现 文件 自由 访问 的 需求 ,我们 先 要 构建 这 一 套 逻 辑 ， 然 后 按照 这 套 逻 辑 去 访问 文件 


型 的 自 


该 说 的 都 说 了 ， 有 关 文 人 






























































圆 其 说 的 过 程 ， 其 实 只 要 协调 好 就 可 以 了 。 
































14.3.2 ”文件 描述 符 的 实现 


话说 文人 
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描述 符 的 介绍 就 到 这 了 ， 








系统 对 外 是 一 个 子 系统 ,但 对 内 它 是 一 个 








下 节 了 咱们 开始 动手 实践 。 


队 ， 实 现 新 功能 需 














的 文件 结构 下 标 ， 并 























团队 内 部 之 间 的 合作 ,为 了 


实现 文件 描述 符 ， 我 们 不 仅 要 添加 单独 的 文件 处 理 模块 ， 还 需要 改进 pcb。 
我 们 马上 要 做 的 就 是 创建 图 14-16 左 侧 pcb 中 的 文件 描述 符 数组 ， 见 代码 14-7。 


代码 14-7 (project/c14/c/thread/thread.h ) 
8 #define MAX FILES OPEN PER PROC 8 































































































77 /* 进程 或 线程 的 pcb， 程 序 控 制 块 */ 
78 struct task struct 并 


88 uint32 t elapsed ticks; 


90 int32 t fd table[MAX FILES OPEN PER PROC];  // 文件 描述 符 数 组 























92 /* general tag 的 作用 是 线程 在 一 般 的 队列 中 的 结 点 */ 


93 struct list elem general tag; 























103 1}; 
fd table 是 任务 的 文件 描述 符 数组 ， 其 类 型 是 int32 t， 即 每 个 成 员 都 是 int32 t 整数 ， 其 长 度 是 

宏 MAX FILES OPEN PER PROC， 此 宏 的 值 是 8， 也 就 是 每 个 任务 可 以 打开 的 文件 数 是 8， 是 有 点 少 ， 
从 要 意思 到 了 就 行 。 
这 个 数组 还 需要 被 初始 化 ， 具 体 代码 在 init_thread 函数 中 实现 ， 见 代码 14-8。 


代码 14-8 (project/c14/c/thread/thread.c ) 






























































68 /* 初始 化 线程 基本 信息 */ 


69 void init thread(struct task struct* pthread, char* name, int prio) { 










































































88 /* 预 留 标准 输入 输出 */ 

89 pthread->fd table[0] = 0; 

90 pthread->fd table[1] = 1; 

9 pthread->fd table[2] = 2; 

92 /* 其 余 的 全 置 为 -1 */ 

93 uint8 tta. idx = 3 

94 while (fd idx < MAX FILES OPEN PER PROC) { 
95 pthread->fd table[fdq idx] = -1; 

96 EQ Ont 

97 } 

98 

99 pthread->stack magic = 0x19870916; // 自 定义 的 魔 数 
100 } 

… 略 














六 | 


























有 三 个 标准 的 文件 描述 符 ，0 是 标准 输入 ，1 是 标准 输出 ，2 是 标准 错误 ， 
fd_table[0 一 2] 分 别 置 为 0、1、2， 也 就 是 预 留 出 了 这 3 个 文件 描述 符 。 
接着 在 第 93 一 97 行将 fd_table 中 其 余 的 文件 描述 符 初始 化 为 -1， 在 这 里 -1 表示 该 文件 描述 符 可 分 
配 ， 为 空位 。 将 来 会 通过 此 值 来 找 可 分 配 的 文件 描述 符 。 

有 关 线程 的 部 分 就 修改 这 些 ， 后 面 我 们 该 介绍 其 他 文件 模块 了 ， 大 伙 儿 下 节 见 。 


本 文件 操作 相关 的 基础 函数 


在 本 节 我 们 要 想 实现 文件 及 目录 的 创建 
一 个 脚印 ， 慢 慢 走 向 目的 地 。 

为 了 帮助 大 伙 儿 理 清楚 函数 间 的 依赖 关系 ， 本 文 按照 它们 的 调用 关系 来 介绍 相关 的 文件 ， 同时 为 了 减 
学 习 的 复杂 性 , 根据 实际 情况 有 可 能 只 会 列 出 文件 中 的 部 分 代码 ， 并 不 是 一 股 脑 地 把 不 相关 的 内 容 也 搬 
出 来 ， Ee es he 因此 有 可 能 同一 件 文件 会 在 不 同 功能 的 讲解 中 反 
复 更 新 ， 请 您 知晓 。 





此 在 代码 第 89 一 91 行将 

































































































































































打开 、 读 、 写 操作 ， 必 须 建 设 好 基础 设施 ， 现 在 咀 们 要 一 
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b> 
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14.4.1 inode 操作 有 关 的 函数 


既然 文件 、 目 录 本 质 上 都 是 inode， 因 此 任何 有 关 文 件 及 目录 的 操作 都 离 不 开 inode 的 处 理 ， 咱 们 有 
必要 先 从 inode 开始 介绍 , 与 inode 实现 相关 的 代码 在 fs/inode.c 中 , 这 是 新 创建 的 文件 , 请 见 代码 14-9-1。 


代码 14-9-1 (project/c14/c/fs/inode.c ) 










































































… 略 
13 /* 用 来 存储 inode 位 置 */ 













































































14 struct inode _ Position { 

于 9 bool two sec; // inode 是 否 跨 扇 区 

16 uint32 t sec lba; // inode 所 在 的 扇 区 号 

17 uint32 t off size; // inode 在 扇 区 内 的 字 节 偏 移 量 

8: 

19: 

20 /* 获取 ijnode 所 在 的 扇 区 和 扇 区 内 的 偏 移 量 */ 

21 static voidq inode locate (struct partition* Part uint32 七 inode no, \ 





struct inode positionx inode pos) { 








































































































































































































































































































22 /* inode table 在 硬盘 上 是 连续 的 */ 
23 ASSERT (inode no < 4096) ; 
24uint32 t inode table lba = part->sb->inode table lba; 
25 
26 uint32 七 inode size = sizeof (struct inode); 
27 uint32 t 和 = inode no * inode size; 
// 第 inode_no 号 工 结 点 相对 于 inode _ table lba 的 字 节 偏 移 量 
28 uint32 t off sec = off size / 512; 
// 第 inode_no 号 工 结 点 相对 于 ijnode table lba 的 扇 区 偏 移 量 
29 uint32 t off size in sec = off size %$ 512; 
// 待 查找 的 inode 所 在 扇 区 中 的 起 始 地 址 
30 
31 /* 判断 此 i 结 点 是 否 跨越 2 个 扇 区 */ 
32 uint32 七 left in sec = 512 - off size in sec; 
33 if (left in sec < inode size ) { 
// 若 扇 区 内 剩 下 的 空间 不 足以 容纳 一 个 inode， 必 然 是 工 结 点 跨越 了 2 个 扇 区 
34 inode pos->two sec = true; 
35 } else { // 否则 ， 所 查找 的 inode 未 跨 扇 区 
36 inode pos->two sec = false; 
号 学 } 
38 inode pos->sec lba = inode table lba + off sec; 
39 inode pos->off size = off size in sec; 
40 } 
41 
42 /* 将 inode 写 入 到 分 区 part */ 
43 void inode sync(struct partition* part, struct inode* inode, void* io buf) { 
// io buf 是 硬盘 io 的 缓冲 区 
44 uint8 t inode no = inode->i no; 
45 struct inode position inode pos; 
46 inode locate(part, inode no &inode pos); 
// inode 位 置信 息 会 存 入 inode pos 
47 ASSERT (inode pos.sec lba <= (part->start lba + part->sec cnt)); 
48 
49 /* 硬盘 中 的 inode 中 的 成 员 inode_tag 和 i open _cnts 是 不 需要 的 ， 
50 * 它们 只 在 内 存 中 记录 链表 位 置 和 被 多 少 进程 共享 */ 
和 struct inode pure inode; 
与 之 memcpy (&pure inode, inode, sizeof(struct inode)); 
53 
54 /* 以 下 inode 的 三 个 成 员 只 存在 于 内 存 中 ， 
现在 将 inode 同步 到 硬盘 ， 清 掉 这 三 项 即 可 */ 
55 pure inode.i open cnts = 0; 
56 pure inode.write deny = false; 
// 置 为 false， 以 保证 在 硬盘 中 读 出 时 为 可 写 
57 pure inode.inode tag.prev = pure inode.inode tag.next = NULL; 
58 
59 char* inode buf = (char*)io buf; 
60 if (inode pos.two sec) { 
// 若是 跨 了 两 个 扇 区 ， 就 要 读 出 两 个 扇 区 再 写 入 两 个 扇 区 
61 /* 读 写 硬盘 是 以 扇 区 为 单位 ， 若 写 入 的 数据 小 于 一 扇 区 ， 
将 原 硬 盘 上 的 内 容 先 读 出 来 再 和 新 数据 拼 成 一 扇 区 后 再 写 入 */ 
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// inode 在 format d 


64 4 


67 / 


69 } 


3 } 





ide read(part->my disk, inode pos.sec lb 








Ph 写 入 硬盘 时 是 连续 写 入 的 ， 所 以 读 入 2 块 扇 区 


ar inode buf, 2); 


























* 开始 将 待 写 入 的 inode 拼 入 到 这 2 个 扇 区 中 的 相应 位 




















*/ 





memcpy ((inode buf + inode pos.off size), 
&pure inode, sizeof (struct inode)); 


* 将 拼接 好 的 数据 再 写 入 磁盘 */ 


ide write (part->my disk, inode pos.sec 1 









































六 


ba, inode buf, 2);，; 








else { // 若 只 是 一 个 扇 
ide read(part->my disk, inode pos.sec lb 
memcpy ((inode buf + inode pos.off size), 
&pure inode, sizeof (struct inode)); 

ide write (part->my disk, inode pos.sec 1 











区 
ar inode buf, 1); 


SN 


ba, inode buf, 1); 











程序 开头 定义 的 struct inode_position 用 于 记录 inode 所 在 的 扇 区 地 址 及 在 扇 区 内 的 偏 移 量 ， 也 就 是 用 于 和 定 


位 inode 在 磁盘 上 的 位 置 ， 其 中 two_sec 用 于 标识 inode 是 否 跨 扇 区 ， 即 占用 2 个 扇 区 的 情况 ， 这 种 情况 通 
的 空间 又 不 足 侨 容纳 完整 inode 的 时 候 。sec_ lba 是 inode 的 扇 区 地 











常 出 现在 inode 在 扇 区 末 创 建 ， 且 扇 区 末尾 
址 ，off size 是 node 在 扇 区 内 的 偏 移 字 节 ， 我 们 后 面 的 函数 会 用 到 此 结构 。 

函数 inode_ locate 接受 3 个 参数 ， 分 区 part、inode 编号 inode no 及 inode pos，inode pos 类 型 是 上 面 
提 到 的 struct inode_position, 用 于 记录 inode 在 硬盘 上 的 







































































































































































的 偏 移 量 ， 将 其 写 入 inode_pos 中 。 





我 们 已 经 在 函数 partition format 中 把 inode table 连续 地 写 入 到 磁盘 上 ， 在 这 之 前 ， 我 们 已 经 将 分 区 











立 置 ， 函 数 功能 是 定位 inode 所 在 的 扇 区 和 扇 区 内 























通过 函数 mount_partition 挂 载 了 ， 因 此 可 以 在 第 24 行 从 分 区 超级 块 的 inode table lba 中 获取 inode table 








的 扇 区 地 址 ， 


off sec 是 该 


对 于 inode table lba 的 扇 区 偏 移 量 。 























存 入 到 同名 变量 inode table lba 中 。 第 26 一 29 行 ， 获取 编号 为 inode_no 对 应 的 inode 的 位 置 ， 























inode 偏 移 扇 区 地 址 ，off size_in_sec 是 该 inode 在 扇 区 中 的 偏 移 字 节 ， 注 意 啦 ，off sec 是 相 


























inode table 是 连续 写 入 多 个 扇 区 中 的 ,因此 在 扇 区 的 结尾 处 ， 有 可 能 存在 inode 路 扇 区 的 情况 , 即 Inode 











的 一 部 分 在 当前 扇 区 末尾 ， 另 一 部 分 在 下 一 扇 区 的 开头 处 





























。 在 第 32 行 ， 判 断 此 inode 是 否 跨越 展区 ， 风 








辑 很 简单 ， 只 要 判断 出 该 inode 所 在 扇 区 的 起 始 地 址 到 扇 区 结束 之 间 的 “剩余 空间 ”是 否 大 于 inode 尺寸 




















就 行 了 ， 有 点 抛 口 ， 这 个 剩余 空间 等 于 扇 区 大 小 512 减 去 inode 在 扇 区 内 的 偏 移 字 节 off size in_sec 的 差 ， 
也 就 是 变量 left_in_ sec 的 值 ,第 33 行 判 断 若 left_in_sec 小 于 inode_size, 则 将 inode_pos->two_sec 置 为 true， 






















































































否则 置 为 false。 

off sec 是 相对 于 inode table 的 扇 区 偏 移 量 ， 因 此 inode 的 绝对 扇 区 地 址 inode_pos->sec_lba 等 于 
inode table lba 加 上 off sec， 而 inode 扇 区 内 的 字 节 偏 移 量 inode_ pos->off size 仍然 等 于 off size_in_sec。 
inode_locate 到 这 就 介绍 完了 。 


下 面 是 函数 inode_sync， 它 接受 3 个 参数 ， 分 区 part、 待 同步 的 inode 指针 、 操 作 组 ; 





数 功 能 是 将 inode 写 入 到 磁盘 分 区 part。 


解释 一 下 ，io_buf 是 主 调 函 数 提供 的 组 ; 














区 io_buf， 函 





















































' 区 ， 原 因 是 必须 要 保证 把 内 存 数据 成 功 同步 到 硬盘 ， 同 步 数 










































































据 需要 缓冲 区 ， 一 般 情况 下 把 内 存 中 的 数据 同步 到 硬盘 都 是 最 后 的 操作 ， 其 前 肯定 已 经 做 了 大 量 工作 ， 您 














想 ， 若 到 这 最 后 一 步 〈《 也 就 是 执行 到 此 函数 ) 时 才 申 请 内 存 失败 ， 前 面 的 所 有 操作 都 白费 了 不 说 ， 还 要 回 


滚 到 之 前 的 旧 状 态 ， 代 价 太 大 ， 因 此 io_buf 必须 由 主 调 函 数 提前 申请 好 。 






















































































inode_sync 的 内 容 看 上 去 有 些 多 ， 但 实际 上 很 简单 ， 要 想 往 硬盘 上 写 入 inode， 必 须 得 知道 inode 的 局 










































































置信 息 在 inode_pos 中 保存 。 














inode ! 








区 地 址 ， 也 就 是 说 得 知道 往 硬盘 哪里 写 ， 因 此 在 第 46 行 先 通过 函数 inode locate 定位 该 inode 的 位 置 ， 位 

















的 三 个 成 员 i open_cnts、write_ deny 和 inode tag， 它 们 用 于 统计 inode 操作 状态 ， 只 在 内 存 
中 有 意义 ， 为 避免 下 次 将 该 inode 加 载 到 内 存 时 出 现 混乱 的 情况 ， 最 好 是 把 它们 写 入 到 硬盘 之 前 就 将 这 三 












































个 成 员 的 值 ; 








青 挤 。 原 inode 就 不 动 了 ， 这 里 新 建 一 局 部 变 





量 pure inode， 第 52 行将 原 inode 的 值 拷贝 到 





617 


pure_ inode 中 ， 然 后 在 第 $5$ 一 57 行 清空 pure node 中 的 那 3 个 变量 ， 后 续 操 作 的 都 是 pure_inode。 

第 59 行将 io_buf 转换 为 mode_buf， 此 缓冲 区 用 于 拼接 同步 的 inode 数据 。 

第 60 行 判 断 inode 是 否 跨 扇 区 ， 如 果 inode pos.two_sec 为 tue， 说 明 该 inode 横 跨 两 个 扇 区 ， 因 此 在 
第 62 行 连续 读 入 2 个 扇 区 到 inode buf， 第 65 行 通过 memcpy 函数 将 pure_ inode 拷贝 到 inode buf 中 的 相 
应 位 置 ， 第 66 行将 inode_buf 中 两 个 扇 区 大 小 的 数据 写 入 硬盘 。 
第 69 一 72 行 是 处 理 未 跨 扇 区 的 情况 ， 原 理 更 简单 ， 主 要 区 别 是 读 写 1 个 扇 区 的 大 小 。 
下 面 继续 看 inode.c 的 后 半 部 分 ， 见 代码 14-9-2。 


代码 14-9-2 (project/c14/c/fs/inode.c ) 


76 /* 根据 i 结 点 号 返回 相应 的 i 结 点 */ 
77 struct inode* inode open (Struct partition* part, uint32 七 inode no) { 


78 /* 先 在 已 打开 的 inode 链表 中 找 inode， 此 链表 是 为 提速 创建 的 缓冲 区 */ 











el 




































































































































































口 















































































































































































































































































































































79 struct list elem* elem = part->open inodes.head.next; 
80 struct inode* inode found; 
81 while (elem != &part->open inodes.tail) { 
82 inode found = elem2entry(struct inode, inode tag elem); 
83 if (inode found->i no == inode no) { 
84 inode found->i open cntst+t+; 
85 return inode found; 
86 } 
87 elem = elem->next; 
88 } 
89 
90 /* 由 于 open_inodes 链表 中 找 不 到 ， 
下 面 从 硬盘 上 读 入 此 inode 0 入 到 此 链表 * 
91 struct inode position inode pos; 
92 
93 /* inode 位 置信 息 会 存 入 inode_pos， 
包括 inode 所 在 扇 区 地 址 和 房 区 内 的 字 节 偏 移 量 */ 
94 inode locate(part, inode no &inode pos); 
95 
96 /* 为 使 通过 sys_malloc 创建 的 新 inode 被 所 有 任务 共享 ， 
97 * 需要 将 inode 置 于 内 核 空 间 ， 故 需要 临时 
98 * 将 cur_pbc->pgdir 置 为 NULL */ 
99 struct task struct* cur = running thread(); 
100 uint32 tx cur pagedir bak = cur->pgdir; 
101 cur->pgdir = NULL; 
102 /* 以 上 三 行 代 码 完成 后 下 面 分 配 的 内 存 将 位 于 内 核 区 */ 
03 inode found = (struct inode*)sys malloc(sizeof (struct inode)); 
104 /* 恢复 pgdir */ 
105 cur->pgdir = cur pagedir bak; 
106 
107 char* inode buf; 
108 if (inode pos.two sec) { // 考虑 跨 扇 区 的 情况 
109 inode buf = (char*)sys _ malloc(1024) 7 
二 坟 Q 
111 /* i 结 点 表 是 被 partition format 函数 连续 写 入 扇 区 的 ， 
Ey * 所 以 下 面 可 以 连续 读 出 来 */ 
于 二 和 ide read (part->my disk, inode pos.sec lba, inode buf, 2); 
114 } else { // 否则 所 查找 的 inode 未 跨 扇 区 ， 一 个 扇 区 大 小 的 缓冲 区 足够 
业主 交 inode buf = (char*)sys _ malloc(512) 
116 ide read(part->my disk, inode pos.sec lba, inode buf，1) 
二 下 学 } 
和 8 memcpy (inode found, inode buf + \ 
inode pos.off size, sizeof (struct inode)); 
9 
120  /* 因为 一 会 很 可 能 要 用 到 此 inode， 故 将 其 插入 到 队 首 便于 提前 检索 到 */ 
121 list push(&part->open inodes, &inode found->inode tag); 
122 inode found->i open cnts = 1; 
123 
124 sys_free(inode buf); 
125 return inode found; 
126 } 
7 
128 /* 关闭 inode 或 减少 inode 的 打开 数 */ 
129 void inode close (struct inode* inode) 
130 /* 若 没 有 进程 再 打开 此 文件 ， 将 此 inode 半 掉 并 释 空间 */ 


























618 









































14.4 文件 操作 相关 的 基础 函数 

131 enum intr status old status = intr disable(); 
L132 if (--inode->i open cnts == 0) { 
L133 list remove(&inode->inode tag); 

// 将 工 结 点 从 part->open inodes 中 去 掉 
134 /* inode_open 时 为 实现 inode 被 所 有 进程 共 
135 * 已 经 在 sys_malloc 为 inode 分 配 了 内 核 空 间 ， 
136 * 释放 inode 时 也 要 确保 释放 的 是 内 核 内 存 池 */ 
3 struct task struct* cur = running thread(); 
138 uint32 t* cur pagedir bak = cur->pgdir; 
139 cur->pgdir = NULL; 
140 sys_free (inode); 
141 cur->pgdir = cur pagedir bak; 
142 4 
143 intr set status(old status);} 
144 } 
145 
146 /* 初始 化 new inode */ 
147 void inode init (uint32 t inode no, struct inode* new inode) { 
148 new inode->i no = inode no; 
149 new inode->i size = 0; 
150 new inode->i open cnts = 0; 
15. new inode->write deny = false; 
oz 
153 /* 初始 化 块 索 引 数 组 i_sector */ 
154 uint8 t sec idx = 0; 
人 while (sec idx < 13) { 
156 /* i_sectors[121] 为 一 级 间接 块 地址 */ 
157 new_ inode->i sectors[sec idx] = 0; 
158 sec_idx++}; 
159 } 
160 } 





函数 inode_open 接受 两 个 参数 , 分 
的 i 结 点 指针 。 











区 part 及 inode 编号 inode_no, 函数 功 





返回 相应 


能 是 根据 inode_no 返 




















磁盘 是 
频繁 访问 磁盘 ， 我 们 早已 在 内 存 中 为 各 分 

















一 种 低速 设备 ， 因 此 文件 系统 的 设计 原则 是 
区 创建 了 inode 队列 ， 即 part->open inodes， 很 久 以 前 就 创建 了 ， 只 


尽量 减少 人 硬盘 操作 。inode 是 存储 在 磁盘 上 的 ， 为 减少 




















是 现在 才 用 上 。 从 名 字 上 看 , 这 个 队列 应 该 称 关 
时 ， 先 在 此 缓存 中 查找 该 node， 找 到 后 则 直接 返 
中 ， 然 后 再 返回 
85 行 执行 “return inode found” 返 回 找到 
如 果 inode 队列 中 没有 该 inode， 下 面 开 














区 回 









































口 









































已 打开 
inode 指针 ， 若 未 找到 ，] 
其 指针 。 查 找 过 程 就 是 遍历 part->open_inodes， 对 应 的 代码 是 第 79 一 88 行 ， 如 果 找 到 后 就 在 第 
的 inode 指针 。 

始 从 硬盘 上 读 取 。 先 





的 inode 队列 , 它 是 inode 的 缓存 。 以 后 每 打开 1 个 inode 
从 磁盘 上 加 载 该 node 到 此 缓存 


























py 











ara 
PP 


1 行 创建 inode_pos， 接 着 在 第 94 




















行 调用 inode_locate 去 定位 该 inode， 位 置 存 储 到 inode_pos 中 。 




















inode 队列 中 的 所 有 inode 应 该 被 所 有 任务 共享 ， 包括 内 核 线 程 和 i 
都 有 独立 的 页 表 ， 因 此 为 保证 所 有 任务 都 共享 inode 队列 ， 需 要 将 整个 





























进程 ， 
个 inode 队列 创建 在 内 


这 样 的 缓存 才 有 意义 。 各 


核 空 间 中 。 

















进程 


还 








有 ， 为 了 使 inode 长 久 存 在 ，inode 队列 中 的 所 有 
的 局 部 变量 。 故 下 硬 
题 终于 来 了 ， 由 于 用 户 进程 有 自 
从 该 用 户 进程 自己 的 堆 中 分 配 内存 ， 显 然 ， 这 样 

























































































结 点 必须 在 内 核 的 堆 
我 们 从 硬盘 上 获取 到 的 inode， 其 所 
己 的 页 表 ， 即 pcb- 
改 的 话 该 inode 只 会 被 该 进程 E 


























而 不 是 简单 使 用 栈 中 
sys_malloc 从 堆 中 分 配 的 。 问 
按照 sys_malloc 的 规则 ， 这 会 
己 访问 到 ， 失 去 了 共享 的 





空间 中 创建 ， 


占 的 内 存 是 我 们 用 
>pgdir 的 值 不 为 NULL， 

























































































意义 。 因 此 , 为 了 使 inode 置 于 内 核 空间 被 所 有 
为 inode 完成 内 存 分 配 后 再 将 全 





















































户 进 程 , 采取 了 统一 处 理 ， 因 为 此 处 判断 的 代价 和 直接 赋值 的 代价 是 一 档 
在 第 101 行将 pgdir 置 为 NULL 后 ， 接 着 在 第 103 行 














页 表 地 址 备份 到 变量 cur pagedir bak : 
分 配 1 个 inode 大 小 的 内 
然后 在 第 105 行将 pgdir 恢复 为 cur pagedir_ bak。 汉 
中 呢 ， 它 可 

inode_found 的 内 存 分 配 好 之 后 ， 下 硬 











3 










































































于 





任务 
E 务 的 pgdir 恢复 。 为 简单 省 事 ， 这 里 并 未 判 出 


存 ， 指 针 存 入 变量 inode_found， 
主意 , 整个 操作 过 程 不 是 在 更 换 页 表 , 页 表 在 寄存 器 CR3 
直 没 有 变动 。 这 里 仅仅 是 修改 了 pcb->pgdir 而 已 
始 读 取 硬盘 了 ， 














E 务 pcb->pgdir 置 为 NULL， 待 
王 务 是 内 核 线程 ， 还 是 用 
前 任务 的 
调用 sys_malloc 
配 的 内 存 变量 。 


前 外 
当前 
的 。 先 在 第 100 行将 当 


< 享 ， 需 要 临时 将 当 












































tk 



































它 是 我 们 为 磁盘 上 的 inode 所 分 


























Lo 








A 


和 2 一 
== 
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08 行 还 是 先 判断 该 inode 是 否 跨 扇 








了 2 个 扇 区 大 小 的 缓冲 区 赋值 给 inode _ buf， 之 


果 是 的 话 ， 剖 








有 
后 在 多 











| 


pos.off size 处 ， 


到 inode 队列 的 最 育 


硬盘 的 读 写 单位 是 
此 在 第 


根 





被 打 


开 














区 大 小 的 内 存 做 缓冲 区 


涉及 到 2 个 局 
蔬 113 行 读 取 2 个 扇 





区 的 读 写 ， 





大 














XxX 





的 数 和 











多 
































然后 将 1 扇 区 


118 行 




















调用 











天 
中 程 








据 程序 局 部 性 


和 


























1 次 。 


呆 





接 下 来 是 函数 inode_close， 它 


里 ， 通 常 异 
钾 ， 以 便 下 次 更 
然后 释放 缓冲 区 inode_buf， 返 回 inode found 指针， 

接受 1 个 参数 ，inode 指针 inode， 
| 说 明 此 inode 未 被 打开 














是 将 inode 的 iopen_cnts 减 1， 若 其 值 为 0， 














I 














块 索引 表 ] 
置 为 0， 这 里 为 了 可 


真 了 





收 空 


sys_malloc 在 内 核 空 
将 内 核 地 址 在 用 户 内 存 ; 
正确 释放 内 核 中 的 inode。sys_free 之 后 ， 再 把 页 表 和 





s 间 了 。 相 关 代码 是 











间 














bb 中 释 





第 132 一 142 行 。 要 提 一 
在 用 inode open 打开 inode 时 ， 为 了 确保 inode 被 所 有 
为 inode 分 配 内 存 ， 现 在 释放 inode 的 内 存 时 ， 当 前 人 
放 ， 这 肯定 是 错 的 ， 所 以 第 137 一 139 行 只 





此 第 109 行 申 
居 到 inode buf 中 。 和 否则 
广 的 数据 读 入 到 该 缓冲 区 ， 
嚼 区 ， 我 们 想 要 的 inode 还 混在 这 些 扇 
memcpy 函数 将 扇 区 中 
青 况 下 此 inode 会 被 
快 被 找到 。 












































inode 未 路 扇 区 的 话 ， 就 在 


























第 115 行 只 申请 1 个 














区 中 呢 ， 

















的 inode 复 秆 























次 使 用 


到 ， 





秘 











贝 


第 122 行将 





名 全 
[一 
这 








功 


因此 在 第 121 行 
的 iopen_cnts 置 为 1， 
至 此 inode 


怠 有 日 
用 征 


L 体 地 址 是 在 inode buffinode 

jinode found 中 。 

通过 list push 将 它 插入 
表示 目前 此 inode 仅 

_open 函数 结束 。 

闭 inode。 关 闭 inode 的 思 E 











| 至 





















































关 











点 的 是 inode 要 先 被 “打开 


8 此 时 吕 j 





以 将 其 从 inode 队列 中 去 掉 


” 才 谈 得 上 “关闭 ”前面 
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口 











来 。 








进程 共享 ， 特 意 把 页 表 置 为 NULL 使 内 存 分 配 函 数 









































E 务 有 可 能 是 进程 ， 因 此 会 导致 











们 又 将 页 表 置 为 NULL， 使 sys_free 

















最 后 一 个 函数 是 inode init， 它 接受 2 个 参数 ，inode 编号 inode_ no 及 待 初始 化 的 inode 指针 new_inode， 


baza 


外 





接 下 来 是 初始 化 i_sec 
地 址 ， 在 此 统统 置 为 0。 
读 性 好 一 


也 


许 有 同 








功能 是 初始 化 new_inode。 
148 一 151 行 是 初始 



































FE 写 


区 都 是 ; 








文件 时 才 分 本 








义 ， 理 





已 而 

















是 首 

















良 费 空间 。 


次 ,文件 色 





























分 配 月 


好 





啦 ， 有 关 











耻 区 ， 效率 更 高 一 些 。 
inode 操作 的 代码 暂时 只 需要 这 么 多 ， 本 节 也 至 


化 inode 中 的 i_no 为 参数 inode no,i size 和 i open_cnt 为 0, write _deny 为 false。 














配 届 区 ? 





记 


古 








这 














样 的， 创建 









































| 建 后 未 必 马 上 


Aa 写 数据 ， 











14.4.2 文件 相关 的 函数 


吧 ， 


文件 操作 相关 的 函数 我 们 定义 在 fs/file.c 和 fs/file.h 中 , 它 俩 是 新 创建 的 文件 





代码 14-10 


出 
和 








不 知道 分 西 





实 经 sys_malloc i 


忆 多 少 个 局 











tors 数组 ， 该 数组 大 小 是 13 个 元 素 ， 前 12 个 是 直接 块 地 址 ， 第 13 个 一 级 间接 
inode 是 由 sys_malloc 分 配 的 ， 
些 还 是 显示 初始 化 。 
学 在 想 ， 为 什么 不 提前 为 inode 分 区 
先 不 知道 文件 大 小 ， 医 








返回 的 内 存 内 容 已 被 

















Inode 时 不 为 其 分 配 扇 区 ， 只 有 在 


区 合适 ， 提 前 分 配 的 扇 
































E 需 要 往 文件 


中 写 数据 时 根据 实际 数据 量 大 小 














| 此 结束 了 ， 


( project/c14/c/fs/file.h ) 


// 记录 当 前 文件 操作 的 偏 移 地 址 ， 以 0 为 起 始 ， 最 大 为 文件 大 小 -1 



































// inode 位 医 











先 介绍 下 头 文件 fleh， 见 代码 14-10。 
… 略 
8 /* 文件 结构 */ 
9 struct file { 
10 En 
让 uint32 七 fq flag; 
a struct inode* fd inode; 
工 3 
14 
15 /* 标准 输入 输出 描述 符 */ 
16 enum stqd fd { 
17 stdin no, // 0 
18 stdout no A 
19 stderr no A/- 2 
20 1}; 
244 
22 /* 位 图 类 型 */ 
23 enum bitmap type { 
24 INODE BITMAP, 
25 BLOCK_BITMAP 
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// 块 位 区 














以 后 需要 时 还 会 在 inode.c 中 更 新 。 




















并 二 


们 还 是 在 实践 中 了 解 























#define MAX FILE OPEN 32 // 系统 可 打开 的 最 大 文件 数 

struct file 就 是 所 说 的 文件 结构 ， 其 中 的 fd_pos 用 于 记录 当前 文件 操作 的 偏 移 地 址 ， 该 值 最 小 是 0， 最 
大 为 文件 大 小 减 1。fd flag 是 文件 操作 标识 ， 如 O RDONLY，fd inode 是 inode 指针 ， 用 来 指向 inode 队 
列 (part-> open inodes) 中 的 inode。 
enum std_fd 是 标准 文件 描述 符 ， 在 Linux 中 0 表示 标准 输入 ，1 表示 标准 输出 ，2 表示 标准 错误 ， 咱 们 未 打 
算 实现 标准 错误 ， 因 此 只 定义 了 前 两 个 ，stdin_no 表示 标准 输入 ， 其 值 为 0，stdout_no 表示 标准 输出 ， 其 值 为 1。 

enum bitmap type 是 位 图 类 型 ， 包 括 INODE BITMAP 和 BLOCK _BITMAP， 我 们 以 后 在 往 硬盘 上 同 
步 位 图 的 时 候 会 用 到 此 结构 。 

宏 MAX_FILE_OPEN 的 值 是 32， 这 是 系统 可 打开 的 最 大 文件 数 。 

好 啦 ， 下 面 介 绍 file.c， 见 代码 14-11。 


代码 14-11 (project/c14/c/fs/file.c ) 








































































































































































































略 

15 /* 文件 表 */ 

16 struct file file table[MAX FILE OPEN]; 
于 这 

18 

19. 


























/* 从 文件 表 file_table 中 获取 一 个 空闲 位 ， 成 功 返 回 下 标 ， 失 败 返 回 -1 */ 
int32 七 get free slot in global (void) { 






































20 iint32 t fd idx = 33 

21 while (fd idx < MAX FILE OPEN) { 

22 if (file table[fd idx] .fd inode == NULL) { 
23 break; 

24 } 

2.5: fd idxt++; 

26 } 

27 if (fd idx == MAX FILE OPEN) { 

28 printk ("exceed max open files\n"); 

29 return -1; 

30 } 

31 return fd idx; 

32 } 

33 

34 /* 将 全 局 描述 符 下 标 安 装 到 进程 或 线程 自己 的 文件 描述 符 数 组 fa_table 中 ， 




















35 * 成 功 返回 下 标 ， 失 败 返回 -1 */ 
36 int32 t pcb fd install(int32 七 globa fd idx) { 





























人 struct task struct* cur = running thread(); 

38 uint8 t local fd idx = 3; // 跨 过 stdin,stdout,stderr 
39 while (local fq idx < MAX FILES OPEN PER PROC) { 

40 if (cur->fd table[local fdq idx] == -1) { // -1 表示 free slot， 可 
41 cur->fd table[local fd idx] = globa fd idx; 

42 break; 

43 } 

44 local fqd idx++; 

45 } 

46 if (local fd idx == MAX FILES OPEN PER PROC) { 

47 printk ("exceed max open files per proc\n"); 

48 return -1; 

49 } 

50 return local fd idx; 

ee | 

52 





53 /* 分 配 一 个 i 结 点 ， 返 回 i 结 点 号 */ 
54 int32 七 inode bitmap alloc(struct partition* part) { 











. 药 int32 t bit idx = bitmap scan(&part->inode bitmap, 1); 
56 if (bit idx == -1) { 

S37 retuir = 

58 } 

59 bitmap set (&part->inode bitmap, bit idx, 1); 

60 return bit idx; 

61 } 

62 

















63 /* 分 配 1 个 房 区 ， 返 回 其 扇 区 地 址 */ 
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64 int32 七 block bitmap alloc(struct partition* part) { 


65 int32 t bit idx = bitmap scan(&part->block bitmap, 1) 
66 if (bit idx == -1) { 

67 return -1; 

68 } 

69 bitmap set (&part->block bitmap, bit idx, 1); 

















70 /* 和 inode bitmap malloc 不 同 ， 此 处 返回 的 不 是 位 图 索引 ， 
而 是 具体 可 用 的 扇 区 地 址 */ 

?4 return (part->sb->data start lba + bit idx); 

了 2. 1} 


















































74 /* 将 内 存 中 bitmap 第 bit_idx 位 所 在 的 512 字 节 同步 到 硬盘 */ 
75 void bitmap sync(struct partition* part, uint32 t bit idx, uint8 七 btmp) { 
76 uint32 t off sec = bit idx / 4096; 




































































// 本 i 结 点 索引 相对 于 位 图 的 扇 区 偏 移 量 
时 了 uint32 七 off size = off sec * BLOCK SIZE; 
// 本 i 结 点 素 引 相对 于 位 图 的 字 节 偏 移 量 
| uint32 t sec lba; 
79 Uinte.t* bitinad. off; 
80 
81 /* 需要 被 同步 到 硬盘 的 位 图 只 有 inode bitmap 和 block bitmap */ 
82 Switch (btmp) { 
83 case INODE BITMAP: 
84 sec lba = part->sb->inode bitmap lba + off sec; 
85 bitmap off = part->inode bitmap.bits + off size; 
86 break; 
87 
88 case BLOCK BITMAP: 
89 sec lba = part->sb->block bitmap lba + off sec; 
90 bitmap off = part->block bitmap.bits + off size; 
9 于 break; 
92 } 
93 ide write (part->my disk, sec lba, bitmap off, 1); 
94 } 
… 略 














代码 中 的 file table 是 文件 表 ， 也 就 是 文件 结构 数组 ， 它 的 长 度 是 MAX FILE OPEN， 也 就 是 最 多 可 
同时 打开 MAX_FILE_OPEN 次 文件 ， 由 于 一 个 文件 可 以 被 多 次 打开 ， 甚 至 把 file_table 占 满 ， 故 此 处 用 的 
单位 是 “次 ” 而 不 是 “个 ”( 想 想 这 么 严谨 也 是 醉 了 )。 

函数 get_free_slot_in_global 功能 是 从 文件 表 file table 中 获取 一 个 空闲 位 ， 成 功 则 返回 空闲 位 下 标 ， 
失败 则 返回 -1。 实 现 原理 是 遍历 file table， 找 出 他 inode 为 null 的 数组 元 素 ， 该 元 素 表 示 为 空 ， 将 其 下 
标 返 回 即 可 。 另外, file table 中 的 前 3 个 成 员 预 留 给 标准 输入 、 标 准 输出 及 标准 错误 ， 以 后 需要 用 到 它们 。 

函数 pcb_fd_install 接受 1 个 参数 ， 全 局 描述 符 下 标 globa fd idx， 也 就 是 数组 fle table 的 下 标 。 函 数 
功能 是 将 globa 亿 idx 安装 到 进程 或 线程 自己 的 文件 描述 符 数 组 fd table 中 ， 成 功 则 返回 外 table 中 空位 
的 下 标 ， 失 败 则 返回 -1。 位 于 pcb 中 的 fd _table， 前 3 个 元 素 是 标准 文件 描述 符 ， 分 别 表 示 标 准 输入 、 标 
准 输出 和 标准 错误 ， 不 能 占用 ， 其 余 的 都 是 可 分 配 的 描述 符 ， 我 们 已 在 初始 化 线程 时 将 这 些 可 分 配 的 描述 
符 置 为 -1。 因 此 只 要 fd_table 数组 元 素 为 -1 就 表示 空位 、 可 分 配 的 文件 描述 符 ， 有 具体 实现 是 第 38 一 50 行 
代码 ， 很 简单 ， 不 多 说 了 。 

函数 inode_ bitmap alloc， 它 接受 1 个 参数 ， 分 区 part， 功 能 是 分 配 一 个 i 结 点 ， 返 回 i 结 点 号 。 位 图 
操作 大 伙 儿 都 已 经 清楚 了 ， 不 多 说 了 。 

函数 block bitmap alloc 接受 1 个 参数 ， 分 区 part， 功 能 是 分 配 1 个 扇 区 ， 返 回 其 扇 区 地 址 。 其 实现 
也 是 位 图 操作 ， 很 简单 不 说 了 。 

函数 bitmap_sync 接受 3 个 参数 ， 分 区 part、 位 索引 bit idx、 位 图 类 型 btmp_type， 功 能 是 将 内 存 : 
bitmap 第 bit_ idx 位 所 在 的 512 字 节 同步 到 硬盘 。 因 为 硬盘 是 以 扇 区 为 读 写 单 位 ， 所 以 内 存 中 的 数据 也 要 
一 次 操作 1 扇 区 , 函数 开头 要 确定 竺 同步 的 位 属于 哪 一 个 512 字 节 中 ,第 76 行 用 bit_ idx/4096 计算 第 bit_idx 
位 相对 于 位 图 的 以 扇 区 为 单位 的 偏 移 量 ， 结 果 存 入 off sec， 也 就 是 说 第 bit idx 位 属于 位 图 中 第 off sec 个 
户 区 大 小 的 内 存 中 ， 不 过 off_sec 用 于 计算 写 入 硬盘 的 扇 区 地 址 ， 下 一 行将 off sec 乘 以 BLOCK _SIZE 获 
得 该 位 相对 于 位 图 的 字 节 偏 移 量 , 结果 存 入 off size, off size 才 用 于 待 写 入 硬盘 的 内 存 数据 , 它 是 第 bit idx 
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位 所 在 位 
































图 中 以 512 字 节 为 单位 的 起 始 地 址 。 文 件 系统 中 目前 有 两 种 位 图 ，inode 位 图 及 块 位 图 ， 下 面 的 


























switch 结构 通过 位 图 类 型 btmp_type 来 判断 同步 哪 种 位 图 ,分别 计 算出 位 图 的 扇 区 地 址 sec_lba 和 字 节 偏 移 


Im| 








量 bitmap_off，bitmap _o 任 是 竺 同步 数据 的 起 始 地 址 ， 最 后 通过 ide_write 将 位 图 写 入 硬盘 。 






























































将 录 


14.4.3 














咱们 还 会 在 fle.c 中 新 建 一 些 代 码 ， 用 到 的 时 候 再 讨论 吧 ， 本 节 先 到 这 ， 下 节 再 见 。 
目录 相关 的 函数 














目录 对 文件 系统 来 说 是 非常 重要 的 概念 , 目录 大 家 都 知道 , 相当 于 普通 文件 的 容器 , 为 支持 目录 操作 ， 











ER 












































3 们 先 定义 好 一 些 基 础 方法 。 有 关 目 录 操 作 的 函数 我 们 定义 在 fs/dir.c 中 ， 好 啦 ， 上 荣 喉 ， 见 代码 14-12-1。 


























代码 14-12-1 (project/c14/c/fs/dir.c ) 












































































































































































































































































































































































































































… 略 
14 struct dir root dir; // 根 目录 
15 
16 /* 打开 根 目录 */ 
17 void open root dirl(struct partition* part) { 
18 root dir.inode = inode open (part, part->sb->root inode no); 
19 root dir.dir pos = 0; 
20.:} 
2 二 
22 /* 在 分 区 part 上 打开 i 结 点 为 ijnode_no 的 目录 并 返回 目录 指针 */ 
23 struct dir* dir open(struct partition* part, uint32 七 inode no) { 
24 struct dir* pdir = (struct dir*)sys malloc(sizeof (struct dir)); 
2 pdir->inode = inode open(part, inode no); 
26 pdir->dir pos = 0; 
27 return pdir; 
28 } 
29 
30 /* 在 part 分 区 内 的 pdir 目录 内 寻找 名 为 name 的 文件 或 目录 ， 
31 * 找到 后 返回 true 并 将 其 目录 项 存 入 dir_e， 否 则 返回 false */ 
32 bool search dir entry(struct partition* part, struct dir* pdir, \ 
33 const char* name, struct dir entry* dir e) { 
34 uint32 t block cnt = 140; // 12 个 直接 块 +128 个 一 级 间接 块 =140 块 
5 
36 /* 12 个 直接 块 大 小 +128 个 间接 块 , 共 560 字 节 */ 
3 uint32 t* all blocks = (uint32 t*)sys malloc(48 + 512); 
SS if (all blocks == NULL) 1{ 
39 printk("search dir entry: sys malloc for all blocks failed"); 
40 return false; 
41 下 
42 
43 uint32 t block idx = 0; 
44 while (block idx < 12) { 
45 all blocks [block idx] = pdir->inode->i sectors[block idx]; 
46 block idxt++; 
47 } 
48 block idx = 0; 
49 
50 if (pdir->inode->i sectors[12] != 0) { // 若 含有 一 级 间接 块 表 
S| ide read(part->my disk, \ 
pdir->inode->i sectors[12], all blocks + 12, 1); 

52 } 
53 /* 至 此 ，all_blocks 存储 的 是 该 文件 或 目录 的 所 有 扇 区 地 址 */ 
54 
55 /* 写 目 录 项 的 时 候 已 保证 目录 项 不 跨 扇 区 ， 
56 * 这 样 读 目 录 项 时 容易 处 理 ， 只 申请 容纳 1 个 扇 区 的 内 存 */ 
57 uint8 t* buf = (uint8 t*)sys malloc (SECTOR SIZE); 
58 struct dir entry* p de = (struct dir entry*)buf; 

// p_de 为 指向 目录 项 的 指针 ， 值 为 puf 起 始 地 址 
59 uint32 t dir entry size = part->sb->dir entry size; 
60 uint32 七 dir entry cnt = SECTOR SIZE / dir entry size; 

// 1 扇 区 内 可 容纳 的 目录 项 个 数 
61 
62 /* 开始 在 所 有 块 中 查找 目录 项 */ 
63 while (block idx < block cnt) { 
64 /* 抉 地 址 为 0 时 表示 该 块 中 无 数据 ， 继 续 在 其 他 块 中 找 */ 
65 if (all blocks[block idx] == 0) { 
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66 block tdx++t} 

67 continue; 

68 } 

69 ide read(part->my disk, all blocks[block idx], buf, 1); 
70 

了 半 uint32 t dir entry idx = 0; 

了 2 /* 遍历 扇 区 中 所 有 目录 项 */ 

while (dir entry idqx < dir entry cnt) { 

74 /* 若 找 到 了 ， 就 直接 复制 整个 目录 项 */ 

75 if (!lstrcmp(p de->filename, name)) { 

76 memcpy (dir e, p de, dir entry size); 
77 SYS_free (buf) ; 

78 SYS_free (al1l blocks); 

79 return true; 

80 } 

81 dir entry idx++; 

和 去 p_dett+; 

83 } 

84 block idxt+t+; 

85 pde = (struct dir entry*)buf; 









































// 此 时 p_qde 已 经 指向 扇 区 内 最 后 一 个 


完整 目录 项 ， 
// 需要 恢复 p_de 指向 为 buf 



































86 memset (buf, 0, SECTOR SIZE); // 将 buf 清 0， 下 次 
87 } 

88 sys_free (buf); 

89 sys_freel(all blocks); 

90 return false; 

yl. 








程序 开头 定义 了 root dir， 它 是 分 区 的 根 目录 。 

函数 open root dir 接受 一 个 参数 ， 分 区 part， 功 能 是 打开 分 区 part 的 根 目 录 。 实 现 非常 简单 ， 先 调用 
inode_open 打开 根 目录 的 inode， 然 后 将 其 赋值 给 根 目录 的 inode 指针 。 随 后 将 根 目录 的 dir_pos 置 为 0。 
好 啦 ， 完 成 。 

接 下 来 是 函数 dir_ open， 它 接受 两 个 参数 ， 分 区 part 和 inode 编号 inode_ no， 功能 是 在 分 区 part 上 打 
开 i 结 点 为 inode_no 的 目录 并 返回 目录 指针 。 此 函数 与 open_root_ dir 类 似 ， 区别 是 根 目录 root_dir 是 提前 
定义 好 的 全 局 变量 ， 免 去 了 为 其 申请 内 存 的 过 程 ， 这 里 要 为 其 他 目录 单独 申请 内 存 ， 也 就 是 第 24 行 代码 
的 功能 。 其 他 都 一 样 ， 不 说 了 。 
下 面 的 函数 search_dir_entry 可 是 个 大 活 儿 ， 内 容 有 点 多 ， 它 接受 4 个 参数 ,分 区 part、 目录 指针 pdir、 
文件 名 name、 目 录 项 指针 dir e， 函 数 功能 是 在 part 分 区 内 的 pdir 目录 内 寻找 名 为 name 的 文件 或 目录 ， 
找到 后 返回 true 并 将 其 目录 项 存 入 dir e， 和 否则 返回 false。 

函数 开头 定义 了 变量 block_cnt， 表 示 inode 总 的 块 数 ， 其 值 为 140， 即 12 个 直接 块 +128 个 一 级 间接 块 。 
接 下 来 第 37 行为 这 140 个 扇 区 地 址 申请 内 存 ， 返 回 地 址 赋值 给 all blocks， 这 样 做 是 为 了 方便 检索 此 inode 
的 全 部 扇 区 地 址 ， 我 们 以 后 对 此 目录 inode 所 在 的 扇 区 地 址 都 统一 从 all_blocks 中 获取 ， 因 此 在 第 43 一 
47 行 ， 先 将 目录 inode 的 i sectors 中 的 前 12 个 扇 区 地 址 录入 到 all blocks 中 ， 随 后 在 第 50 行 判断 是 否 有 一 
级 间接 块 索引 表 ， 只 要 i_sectors[12] 不 为 0 就 表示 有 一 级 间接 块 索 引 表 ， 如 果 有 ， 就 从 硬盘 的 扇 区 地 址 
i_sectors[12] 处 获取 1 扇 区 数据 ， 此 数据 是 128 个 间接 块 地 址 , 将 其 复制 到 all blocks+12 字 节 处 。 至 此 ，all blocks 
被 写 满 了 ， 其 存储 的 是 目录 pdir 的 所 有 扇 区 地 址 。 
我 们 在 处 理 inode table 时 ， 是 将 它 连 续 写 在 多 个 户 区 中 ， 也 就 是 除 最 后 一 个 扇 区 外 ， 其 他 几 个 鹿 
都 写 满 了 inode， 从 而 导致 了 inode 跨 扇 区 的 情况 ， 以 至 于 在 获取 inode 的 时 候 要 做 额外 判断 ， 比 较 麻 烦 。 
吸取 经 验 教训 , 我 们 在 往 目 录 中 写 目 录 项 的 时 候 , 写 入 的 都 是 完整 的 目录 项 , 避免 了 目录 项 跨 扇 区 的 情况 ， 
因此 在 实际 搜索 目录 项 的 时 候 每 次 只 从 硬盘 读 取 一 扇 区 就 好 了 ， 所 以 在 第 57 行 ， 我 们 为 缓冲 区 buf 申请 
的 内 存 大 小 是 SECTOR_SIZE, 即 1 扇 区 。 第 58 行将 缓冲 区 转换 为 目录 项 struct dir_entry 类 型 ,赋值 给 p_de， 
后 面 将 开始 用 p_de 遍历 buf。 第 $9 一 60 行 计算 一 扇 区 内 容纳 的 目录 项 数 ， 结 果 存 入 变量 dir_entry_cnt。 

由 于 我 们 不 知道 目录 项 在 目录 的 哪个 扇 区 中 存在 ， 所 以 在 第 63 行 的 while 循环 开始 ， 我 们 在 该 目录 
所 有 的 扇 区 中 查找 目录 项 。 目 录 的 所 有 扇 区 地 址 已 经 被 收录 到 all blocks 中 , 在 第 65 行 判断 ， 如 果 扇 区 地 
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址 为 0， 这 说 日 
时 ， 是 优先 在 
用 新 的 扇 








inode->i sectors 局 

















TE 
出 











乍 的 扇 区 。 知 目录 中 
看 扇 区 中 ， 后 





的 文件 或 子 




















区 。 但 将 来 我 们 还 会 实现 删除 文件 和 目录 的 功能 ， 




















掉 启 




















用 的 扇 区 : 
i_sector[0] 回 收 ， 那 时 
所 以 扇 区 地 址 为 0 时 还 要 继续 在 后 本 

回 到 代码 ， 若 在 第 65 行 判 断 all blocks[block idx] 不 为 0， 这 表示 已 分 配 
地 址 all_blocks[block idx] 读 入 1 扇 区 数据 到 buf， 在 第 73 
目录 项 的 p_de->filename 是 否 和 待 查找 的 文件 名 name 相等 ， 若 相等 则 表 
F， 然 后 第 76 行将 该 目录 项 p_de 复制 到 参数 dir e 中 ， 


从 该 扇 区 
内 的 所 有 目录 项 , 在 第 75 行 比较 
示 找 到 该 文 们 





ji sector[0] 处 ， 正 巧 这 个 扇 区 中 














区 中 的 文 伯 








台 bR 


只 能 容 





F 还 在 ， 比 如 目录 a 中 
纳 10 个 日 


未 分 配 扇 区 ， 跳 过 ， 继 续 下 一 次 循环 。 这 里 要 说 明 一 下 ， 尽 管 我 
区 数组 中 靠 前 的 局 














录 项 ， 后 来 又 在 目 




















地 址 是 i_sector[1]， 现 在 将 前 10 个 文件 全 部 删除 ， 删 除 后 ， 扇 区 i_sector[0] 上 已 无 文件 ， 
会 将 i_sector[0] 赋 值 为 0, 但 

















录 a 的 





怖 


















































| 的 索引 块 ! 


查找 ， 不 能 放弃 。 








区 中 写 入 ， 前 面 
删除 文件 的 顺序 可 是 随机 的 ， 这 取决 于 文件 
录 过 多 ， 占 用 了 多 个 遍 区 ， 执 行 删除 文件 时 ， 有 可 能 被 删除 的 文件 位 于 
生成 了 10 个 文件 ， 假 如 这 10 个 文件 位 于 局 


区 地 址 








门将 来 往 目录 中 写 
的 扇 区 无 法 容纳 完整 目录 项 后 










































































录 a 中 生成 了 第 11 个 文件 ， 该 文件 占 
对 此 将 
区 中 还 有 文件 ， 



































i_sector[1] 不 为 0， 该 局 































































































































































































扇 区 地 址 了 ， 于 是 在 第 69 行 
一 83 行 用 目录 项 指针 p_de 遍历 该 硬 区 











之 后 释放 缓冲 





区 和 all_ blocks， 成 功 返 





























































































































































































































可 。 否 则 ， 在 第 81~82 行 更 新 为 下 一 个 目录 项 继续 在 该 肩 区 中 查找 。 若 该 扁 区 中 未 找到 该 文件 的 话 ， 在 
第 84 行使 block_idx++， 更 新 为 all_blocks 中 的 下 一 个 扇 区 ， 读 取 新 的 扇 区 ， 重 复 以 上 查找 过 程 。 如 果 到 
最 后 都 未 找到 该 文件 ， 在 第 88 一 90 行 释放 buf 和 all blocks， 返 回 false， 至 此 函数 search_dir_entry 结束 。 
下 面 看 dire 的 中 间 部 分 ， 见 代码 14-12-2。 
代码 14-12-2 (project/c14/c/fs/dir.c ) 
… 略 
93 /* 关闭 目录 */ 
94 void dir close(struct dir* dir) { 
95 /类 类 太太 炎炎 类 大 大 大 大 类 大 录 不 能 闭 让 
96  *1 根 目 录 自 # 后 就 不 应 该 关闭 ， 否 则 还 需要 再 次 open root _ dir (); 
97 *2 root dir 所 在 的 内 存 是 低 端 1MB 之 内 ， 并 非 在 堆 中 ，free 会 出 问题 */ 
98 if (dir == &root dir) { 
99 /* 不 做 任何 处 理 直 接 返回 */ 
100 return; 
04 } 
102 inode close (dir->inode); 
103 sys_free (dir); 
104 } 
105 
106 /* 在 内 存 中 初始 化 目录 项 p_de */ 
107 void create dir entryl(char* filename, uint32 t inode no \ 
uint8 t file type, struct dir entry* p de) { 
108 ASSERT (strlen (filename) <= MAX FILE NAME LEN); 
109 
110 /* 初始 化 目录 项 */ 
水 和 十 memcpy (p_de->filename, filename, strlen(filename)); 
112 p_de->i no = inode no; 
113 p_de->f type = file type; 
114 } 
… 略 
这 部 分 很 短小 ， 就 两 个 功能 。 
函数 dir_ close 接受 1 个 参数 ,目录 指针 dir, 功能 是 关闭 目录 dir。 关 闭 目录 的 本 质 是 关闭 目录 的 inode 
并 释放 目录 占用 的 内 存 ， 这 分 别 是 通过 第 102 一 103 行 的 代码 实现 的 。 不 过 有 两 条 注释 说 明了 我 们 对 根 目 








录 做 了 特殊 处 理 ， 根 目 




















它 是 所 有 








位 于 低 端 1MB 之 内 ， 并 3 
函数 create_dir_entry 接受 4 个 参数 ， 文 从 

指针 p_de。 功 能 是 在 内 存 : 

p_de->filename 中 ， 用 inode no 为 P_de->i no 赋值 ， 
下 面 看 dire 的 最 后 部 分 ， 见 代码 14-12-3。 














目录 的 父 目 录 ， 查 找 文 从 





录 不 能 被 真正 地 关闭 














是 在 














中 






































创建 目录 项 p_de。 函 数 


名 filename 





， 不 做 任何 处 理 直 接 返回 。 
F 时 必须 要 从 根 目录 开始 找 。 其 次 是 根 
! 请 的 ， 不 能 将 其 释放 。 















































、inode 编号 inode no、 文件 类 型 file type、 目 录 项 
的 实现 就 是 在 初始 化 目录 项 p_de: 将 文件 名 拷贝 到 目录 项 
j file_type 为 p_de->f type 赋值 。 














原因 是 首先 根 目 录 始 终 应 该 是 打开 的 ， 
录 root_dir 占用 的 是 静态 内 存 ， 它 
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代码 14-12-3 (project/c14/c/fs/dir.c ) 







































































116 /* 将 目录 项 p_de 写 入 父 目 录 parent dir 中 ，io_buf 调 函 数 提供 */ 
117 bool sync dir entry(struct dir* parent dir, \ 
struct dir entry* p de, void* io pbuf) { 




































































上 二 8 struct inode* dir inode = parent dir->inode; 

119 uint32 t dir size = dir inode->i size; 

120 uint32 七 dir entry size = cur part->sb->dir entry size; 

121 

122 ASSERT (dir size % dir entry size == 0); 
// dir_size 应 该 是 dir entry size 的 整数 倍 

123 

124 uint32 t dir entrys per sec = (512 / dir entry size); 
// 每 扇 区 最 大 的 目录 项 数 

二 25 int32 t block lba = -1; 

126 

127 /* 将 该 目录 的 所 有 扇 区 地 址 

( 12 个 直接 块 + 128 个 间接 块 ) 存 入 all blocks */ 


















































































































































































































































































































































128 uint8 t block idx = 0; 
129 uint32 t all blocks[140] = {0};  // all blocks 保存 目录 所 有 的 块 
130 
131 /* 将 12 个 直接 块 存 入 all blocks */ 
132 while (block idx < 12) { 
133 all blocks[block idx] = dir inode->i sectors[block idx]; 
134 block idxt++; 
135 } 
136 
137 struct dir entry* dir e = (struct dir entry*)io buf; 
// dir_e 用 来 在 io_buf 中 遍历 目录 项 
138 int32 t block bitmap idx = -1; 
39 
140 /* 开始 遍历 所 有 块 以 寻找 目录 项 空位 ， 若 已 有 扇 区 中 没有 空闲 位 ， 
141 * 在 不 超过 文件 大 小 的 情况 下 申请 新 扇 区 来 存储 新 目录 项 */ 
142 block idx = 0; 
143 while (block idx < 140) { 
// 文件 ( 包括 目录 ) 最 大 支持 12 个 直接 块 +128 个 间接 块 = 140 个 块 
144 block bitmap idx = -1; 
145 if (all plocks[block idx] == 0) {  // 在 三 种 情况 下 分 配 块 
146 block lba = block bitmap alloc (cur part); 
147 if (block lba == -1) { 
148 printk("alloc block bitmap for sync dir entry failed\n"); 
149 return false; 
50 } 
151 
152 /* 每 分 配 一 个 块 就 同步 一 次 block pitmap */ 
153 block bitmap idx = block lba - cur part->sb->data start lba; 
154 ASSERT (block bitmap idx != -1); 
吉方 bitmap sync (cur part, block bitmap idx, BLOCK BITMAP); 
156 
Tz block bitmap idx = -1; 
158 iE. (BLOck. Tdxi< "12 // 若是 接 块 
159 dir inode->i sectors[block idx] = \ 
all blocks[block idx] = block i 
160 } else if (block idx == 12) { 
// 若是 尚未 分 配 一 级 间接 块 表 ( block_idx 等 于 12 表示 第 0 个 间接 块 地 址 为 0 ) 
161 dir inode->i sectors[12] = block lba; 
// 将 上 面 分 配 的 块 作为 一 级 间接 块 表 地 址 
162 block lba = -1; 
163 block lba = block -bitmap,: alloc(cur part); 
// 再 分 配 一 个 块 作为 第 0 个 间接 块 
164 if (block lba == -1) 
1€5 block bitmap idx = dir inode->i sectors[12] - \ 
cur part->sb->data start, lbay 
166 bitmap set (&cur part->block bitmap \ 
block bitmap idx, 0); 
163 dir inode->i sectors[12] = 0; 
168 printk("alloc block bitmap for sync dir entry failed\n"); 
69 return false; 
170 } 
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于 二 
1:72 /* 每 分 配 一 个 块 就 同步 一 次 block pbitmap */ 
a block bitmap idx = block lba - cur part->sb->data start lba; 
174 ASSERT (block bitmap idx != -1); 
IE bitmap sync (cur part, block bitmap idx, BLOCK BITMAP); 
176 
17 all blocks[12] = block lba; 
178 /* 把 新 分 配 的 第 0 个 间接 块 地 址 写 入 一 级 间接 块 表 */ 
179 ide write(cur part->my disk, \ 

dir inode->i sectors[12], all blocks + 12, 1);} 
180 } else { // 若是 间接 块 未 分 配 
小 全 入 all blocks[block idx] = block lba; 
182 /* 把 新 分 配 的 第 (block_igdx-12) 个 间接 块 地 址 写 入 一 级 间接 块 表 */ 
183 idqe_write (cur part->my disk, \ 

dir inode=>i sectors[12], all blocks + 12, 1)} 
184 } 
185 
186 /* 再 将 新 目录 项 p_de 写 入 新 分 配 的 间接 块 */ 
半生 了 memset (io buf, 0, 512); 
188 memcpy (io buf, p de, dir entry size); 
189 ide writel(cur part->my disk, all blocks[block idx], io buf, 
190 dir inode->i size += dir entry size; 
194 return true; 
192 } 
193 
194 /* 若 第 block idqx 块 已 存在 ， 将 其 读 进 内 存 ，\ 

然后 在 该 块 中 查找 空 目录 项 */ 
195 ide readq(cur part->my disk, all blocks[block idx], io buf, 1); 
196 /* 在 扇 区 内 查找 空 目录 项 */ 
E97 uint8 t dir entry idx = 0; 
198 while (dir entry idx < dir entrys per sec) { 
199 if ((dir e + dir entry idx)->f type == FT UNKNOWN) { 
// FT_UNKNOWN 为 0， 无论 是 初始 化 ， 或 是 删除 文件 后 ， 

// 都 会 将 type 置 为 FT_UNKNOWN 
200 memcpy (dir e + dir entry idx, p de, dir entry _ size) 
201 ide writel(cur part->my disk, all blocks[block idx], io buf, 1); 
202 
203 dir inode->i size += dir entry size; 
204 return true; 
205 } 
206 dir entry idxt++; 
207 } 
208 block idxt++; 
209 } 
210 printk ("directory is full!l\n"); 
2 二 return false; 
212 

也 许 此 时 您 还 沉浸 在 代码 14-12-2 内 容 较 少 的 欣慰 中 ， 现 在 该 醒 醒 了 ， 这 最 后 一 部 分 代码 中 只 有 函数 











sync_dir_ entry， 它 的 内 容 很 多 ， 因 此 把 它 放 在 最 后 介绍 。 





























sync_dir_entry 接受 3 个 参数 ， 父 目录 parent_dir、 日 录 项 p_de、 绥 冲 区 io buf， 功 能 是 将 目录 项 p_de 




















写 入 父 目录 parent_dir 中 ， 其 中 io_buf 由 主 调 函 数 提供 。 





























当 inode 是 目录 时 ， 其 isize 是 目录 中 目录 项 的 大 小 之 和 ， 父 目录 的 大 小 是 dir_inode->i_ size， 第 119 行将 
其 赋值 给 变量 dir_size。 目 录 项 大 小 记录 在 超级 块 中 ， 第 120 行 获取 了 超级 块 的 大 小 ， 存 入 变量 dir_entry size。 





















































第 124 行 计 算 1 扇 区 可 容纳 的 完整 的 
search_dir_entry 中 所 说 的 : 写 入 目录 项 时 已 保证 目录 项 不 会 跨 扇 区 。 




































































在 第 128 一 135 行 ， 将 目录 的 12 个 直接 块 地 址 收集 到 数组 all_blocks， 下 面 将 优 








录 项 数 ， 结 果 写 入 变量 dir entrys per sec， 此 处 就 是 在 函数 


检查 这 12 个 扇 区 。 





第 137 行使 目录 项 指针 dir e 指向 缓冲 区 io _ buf， 这 里 为 目录 项 指针 变量 起 名 为 dir e 是 避免 与 参数 p_de 





























I 估 。 


























由 于 删除 文件 时 会 造成 目录 中 存在 空洞 ， 也 就 是 文件 系统 内 的 碎片 ， 所 以 在 写 入 文件 时 ， 要 逐个 目录 





























项 查找 空位 , 避免 一 味 在 目录 的 末尾 添加 目录 项 , 而 前 面 所 有 文件 已 被 删除 时 , 却 还 占 
所 以 第 143 行 开始 从 头 在 这 12 个 扇 区 中 找 空 闲 目录 项 位 置 。 虽 然 我 们 只 在 all_blocks ' 









































TT 






































j 多 个 扇 区 的 情况 ， 
































收集 了 12 个 直接 


























块 的 地 址 ， 但 依然 要 遍历 140 个 请 区 ， 因 为 要 是 在 这 12 个 扇 区 中 找 不 到 目录 项 空位 时 ， 在 文件 大 小 未 超 
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过 140 个 扇 区 的 情况 下 ， 我 们 还 会 为 3 
未 分 配 ， 在 第 146 行 通过 函数 block bitmap alloc 为 其 分 配 一 扇 区 ， 
block bitmap alloc 仪 是 操作 内 存 中 的 块 位 图 
日 对 于 data_start_lba 的 偏 
第 158 行 判断 当前 为 空 的 块 是 直接 块 ， 还 是 间接 块 ， 若 块 索引 小 于 12， 则 








153 行 计算 block lba 改 
































其 分 配 新 户 区 以 容纳 








录 项 。 代 码 第 1 

















45 行 先 判断 扇 区 是 否 分 配 ， 知 





























， 为 保持 数据 同步 ， 现 在 要 将 


移 ， 第 155 行 调 


I 






































入 i_sectors[block idx] 和 all blocks[block idx]。 若 正好 


























行将 分 配 的 扇 区 地 址 写 
引 表 地 址 为 空 ， 下 面 就 
引 表 的 地 址 写 入 i_sectors[12]， 在 第 163 习 








引 区 地 二 





























肩 区 地 二 








ti 该 创建 间接 块 了 ， 在 第 161 行将 刚才 分 配 的 扇 
新 再 分 配 一 局 
[将 作为 第 0 个 间接 块 。 如 果 block lba 为 -1， 也 就 是 分 配 扇 区 失败 了 , 在 第 165 一 169 行 执行 一 些 
滚 操作 。 如 果 分 配 成 功 的 话 ， 
上 更 新 到 all blocks[12]， 这 是 第 0 个 间接 块 的 











接着 在 第 1 














入 一 级 间接 块 索引 表 所 在 的 





让 





义 。 


在 第 180 行 , 知 block idx 已 经 超过 了 12， 这 说 明 已 经 遍历 到 间接 块 了 ，; 











区 ， 此 时 block lba 


] bitmap_sync 将 块 位 图 同步 到 硬盘 。 























扇 区 地 址 写 入 变量 block lba。 由 于 
块 位 图 同步 到 硬盘 ， 是 在 第 


























有 159 
12 个 块 , 即 一 级 间接 块 索 


属于 直接 块 ， 故 在 多 








旧作 


候 宙 


区 地 址 block lba 作为 一 级 间接 块 索 








更 新 为 新 分 配 的 鹿 区 地 址 ， 该 











73 一 175 行将 块 位 图 





同步 到 硬盘 








。 然 后 在 第 177 行将 新 分 配 的 








也 址 ， 随 后 在 第 179 行 





7 调用 ide_write 将 间接 块 地址 写 

















第 最 初 分 配 的 





扇 区 地 址 block lba 











录入 all blocks， 然 后 在 第 183 行将 间接 块 地 址 写 入 一 级 间接 块 索引 表 所 在 的 扇 区 。 最 后 在 第 187 一 189 行 























录 项 写 入 局 区 ， 然 后 入 








将 
































用 190 行 更 新 目录 大 小 ， 使 




















第 195 行 



































行将 该 局 区 读 到 io_buf 


录 项 的 f type 为 FT UNKNOWN, 这 表示 该 目录 项 未 分 配 , F 














录 的 isize 加 上 1 个 目录 项 大 小 dir_entry size。 











于 始 处 理 块 已 存在 ， 不 需要 分 配 块 的 情况 ， 也 就 是 要 在 该 扇 区 中 寻找 空闲 的 目录 项 ， 
， 接 着 在 第 198 行 通过 while 循环 遍历 dir_ entrys_per sec 个 目录 项 , 第 199 行 判 断 若 
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先 在 第 195 



































J] 以 




















接着 调用 ide_write 将 目 
扇 区 都 满 了 ， 直 接 输 昌 
好 啦 ， dir.c 目前 入 











1 
时 | 























更 新 至 
14.4.4 路径 解析 相关 的 函 











一 档 





EF 的 路 径 规则 。 


什么 是 路 径 解析 呢 ? 简单 来 说 ， 就 是 


这， 以 后 
数 

本 节 咱 们 要 完成 路 径 解 析 的 功能 。 
“home”。 在 这 两 种 路 径 中 都 有 路 径 分 


录 项 同步 到 硬盘 ,最 后 使 目录 的 i_size 加 
“directory is full! ”并 以 false 返 





,于 是 在 第 200 行将 











录 项 p_de 写 入 io_buf， 

















上 1 个 


录 项 
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3 HE 








大 小 dir_entry_size。 如 果 所 有 的 




















百 友 舍 


半 付 -， 





TH 女 


路 径 大 家 都 ; 

















于 添加 新 





时 











三 = 
青 楚 ， 


Window 中 的 路 径 分 隔 


比如 Windows 中 


za 
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十 | 








是 \， 


功能 ， 兄 弟 们 真 的 注音 了 ， 下 


Linux 的 是 /， 纶 


再 见 。 





的 “Ci\windows”，Linux 中 的 
们 采取 和 Linux 























路 径 按照 路 径 分 隔 符 拆 分 成 多 层 文件 名 ， 逐 层 在 磁盘 上 查找 以 








确认 文件 名 是 否 存 在 。 比 如 路 径 “/a/b/c” 会 被 分 别 拆 分 成 “a”，“b”，“c”。 Linux 中 一 切 皆 文件 ， 因 此 同 





台 已 品 


Bed 
口 ”EE 














录 下 不 











H 现 同名 的 普通 文件 














FE 和 








了 水 。 

















户 误 把 它 当 成 目录 ),“c” 可 





斤 
个 首 














只 是 通 文件 ， 用 
系统 必须 逐 层 到 目录 1] 








硕 中 去 确认 。 最 左边 的 /表示 根 目录 ， 首 先 在 根 














型 ， 发 现 它 是 目录 ， 继 续 在 a 目录 中 查找 b， 同 样 发 现 

















件 ， 也 可 能 是 目 














LT 6 多 
mm a 














从 路 径 上 咱们 可 以 猪 





和 “b” 都 是 目 

















录 ( 但 也 有 可 能 “a” 








台 明 . 纶 3 


能 是 普通 能 是 


用 十 











也 可 


文件 








》 








录 。 不 管 猜 的 对 不 对 ， 文 件 
































录 下 





查找 a， 根 据 目录 项 的 文件 类 



































其 是 目录 ， 然 后 在 b 








录 ， 这 还 是 要 根据 目录 项 来 判断 。 当 然 了 ， 在 逐 层 查找 的 过 程 中 ， 也 许 某 层 路 径 就 不 存在 








录 中 查找 c，e 也 许 是 普通 文 












































了 ， 比 如 在 
大 伙 儿 不 要 觉 泊 
“cd /a/b” 也 要 先 从 根 目 





























E a 目录 中 未 找到 文 从 
只 有 在 查找 文件 时 才 需 要 路 径 解析 ， 路 径 解 析 是 在 作 
录 / 开 始 ， 逐 层 解析 a 和 b 目录 。 有 关 路 径 解析 的 代码 是 在 8.c 中 ， 紫 


Fb 时 ， 后 本 











[的 子路 径 c 就 不 需要 再 查 了 。 



























































分 别 介绍 ， 见 代码 14-13。 
代码 14-13 (project/c14/c/fs/fs.c ) 
… 略 
192 /* 将 最 上 层 路 径 名 称 解 析出 来 */ 
193 static char* path parse(char* Pathname char* name store) { 
194 if (pathname[0] == '/') {  // 根 目 录 不 需要 单独 解析 
195 /* 路 径 中 出 现 1 个 或 多 个 连续 的 字符 '/'， 将 这 些 '/' 跳 过 ， 如 "///a/b" 
196 while(*(++pathname) == '/'); 
T9737 } 
198 
199 /* 开始 一 般 的 路 径 解 析 */ 
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E 何 时 刻 都 需要 的 功能 ， 比 如 命令 








们 从 简 入 深 
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名 ，name store 是 主 1 


200 while (xpathname != '/' && xpathname != 0) { 

2.01 *name storet++ = *pathnamet++; 

202 } 

203 

204 if (pathname[0] == 0) {  // 若 路 径 字符 串 为 空 ， 则 返回 NULL 

205 return NULL; 

206 } 

207 return pathname; 

208 } 

209 

210 /* 返回 路 径 深 度 ， 比 如 /a/b/c， 深 度 为 3 */ 

211 int32 t path depth cnt (char* pathname) { 

212 ASSERT (Pathname != NULL); 

213 char* p = pathname; 

214 char name [MAX FILE NAME LEN]; 

// 用 于 path_parse 的 参数 做 路 径 解 析 

2 生生 uint32 t depth = 0; 

216 

217 /* 解析 路 径 ， 从 中 拆 分 出 各 级 名 称 */ 

218 p = path parse(p, name); 

21:9 while (name[0]) { 

220 deptht++; 

221 memset (name, 0, MAX FILE NAME LEN); 

222 4 // 如 果 pp 不 等 于 NULL， 继 续 分 析 路 径 

223 p = path parse(p, name); 

224 } 

225 } 

226 return depth; 

227 } 

… 略 

path_parse 函数 接受 2 个 参数 ，pathname 是 字符 串 形 式 的 路 径 及 文 从 
的 缓冲 区 ， 用 于 存储 最 上 层 路 径 名 ， 此 函数 功能 是 























结束 后 返回 除 项 层 路 径 之 外 的 子路 径 字 符 串 的 地 址 。 每 次 刘 


顶层 的 路 径 名 ， 例 如 要 是 解析 路 径 “/a/b/c” 的 话 ， 调 

















图 

















































































































将 最 上 层 路 径 名 称 解析 出 来 存储 到 name_store 中， 调用 














] path_parse 只 会 解析 一 层 路 径 名 ， 也 就 是 最 
] path parse 时 ，name store 的 值 是 “a”， 然 后 返回 




































































由 函数 提供 




















子路 径 字 符 串 “/b/c” 的 地 址 。 下 次 再 调用 path_parse 时 , 主 调 函 数 若 传 给 pathname 的 参数 是 “/b/c” path_parse 
执行 后 name _ store 中 的 值 变 为 “b” 然后 返回 子路 径 “/c” 的 地 址 。 

函数 开头 先 判断 路 径 名 第 0 个 字符 是 否 为 0， 也 就 是 说 类 似 这 样 的 路 径 “/a/b/c”。 首 先 ， 任 何 时 候 路 
径 中 最 左边 的 % 都 表示 根 目录 ， 根 目录 不 需要 单独 解析 ， 因 为 它 是 已 知 的 ， 并 且 已 经 被 提前 打开 了 。 其 次 ， 
路 径 中 的 % 仅 表示 路 径 分 隔 符 ， 我 们 并 不 关心 它 ， 只 关心 路 径 分 隔 符 之 间 的 路 径 名 ， 因 此 无 论 % 表 示 根 目 
录 ， 还 是 路 径 分 隔 符 ， 我 们 始终 要 跨 过 路 径 中 最 左边 的 /。 

接 下 来 在 第 196 行 通过 while 循环 去 掉 路 径 中 连续 重复 的 多 个 /， 也 许 您 可 能 会 想 ， 路 径 中 的 各 层 目 录 间 





























不 是 只 有 一 个 / 吗 ， 顶 多 去 掉 1 个 /就 可 以 了 ， 去 掉 多 个 /是 什么 情况 ? 确实 ， 一 般 情 况 下 我 们 输入 的 路 径 都 是 








以 1 个 /作为 分 隔 符 ， 但 在 Linux 中 各 层 路 径 间 
们 也 兼容 此 方式 ， 因 此 必须 要 去 掉 路 径 中 连续 习 
第 200 行 的 while 循环 开始 路 径 解 
name_ store。 比如 若 此 时 的 pathname 经 过 196 行 的 处 理 
为 a。 
若 pathname 已 经 结束 ， 指 向 末尾 的 结束 字符 \0' ( 
则 pathname 依然 包含 子路 径 ， 将 其 返回 














E 复 的 多 个 /。 

























































































o 





径 “/a/b/c”， 深 度 为 3。 不 过 ， 这 里 不 能 简单 地 根 扩 





径 名 ， 通 过 变量 depth 来 累计 路 径 层 数 ， 不 多 说 了 。 





函数 path_depth_cnt 接受 1 个 参数 ，pathname 表示 待 分 析 的 路 径 。 函 数 功 
路 径 分 隔 符 /来 统计 目录 深度 ， 前 面 说 过 在 Linux 中 


Wa/b//e" 这 样 的 路 径 是 合法 的 ， 我 们 也 是 如 此 。 函 数 实 现 较 简 单 ，3 path_parse 统计 各 级 路 
































的 分 隔 符 可 以 是 多 个 "， 比 如 "Wa/b/We" 这 样 的 路 径 是 合法 的 , 我 


fT， 也 就 是 解析 出 参数 pathname 中 最 顶层 (最 左边 ) 的 路 径 名 存 入 
后 已 变 为 “a/lb ”的话 ， 循 坏处 天 


后 ，name store 








ASCII 值 为 0)， 就 返回 NULL 表示 处 悍 


能 是 返 


能 是 返回 























要 是 循环 调用 














还 有 个 文件 搜索 的 函数 未 介绍 ， 该 函数 有 占 长 ， 只 


会 。 


们 单独 拿 H 





1 
时 | 















































结束 ， 口 


路 径 深度 ， 比 如 路 


介绍 吧 ， 本 节 到 此 结束 ， 大 伙 儿 下 节 
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14.4.5 ”实现 文件 检索 功能 
在 打开 文件 之 前 ， 








在 创建 文件 之 前 , 文件 
存在 同名 的 文件 。 





























您 看 ， 这 实际 上 就 是 文件 搜索 上 
































咱们 要 确认 文件 是 否 在 磁盘 上 存在 ， 毕 竟 只 
系统 也 要 确认 被 创建 的 文件 所 在 






















































































的 功能 
























































































































































有 已 存在 的 文件 才 谈 得 上 “打开 ”。 同样 
的 目录 中 是 否 已 有 同名 文件 存在 ,毕竟 目录 下 不 允许 
， 本 节 继 续 完善 fs.c， 在 其 中 添加 函数 search_file。 











在 头 文件 fs.h 中 又 更 新 了 一 些 结构 ， 咱 们 先 看 看 里 面 有 什么 ， 见 代码 14-14。 
代码 14-14 (project/c14/c/fs/fs.h ) 
10 #define MAX PATH LEN 512 // 路 径 最 大 长 度 
] 江 
12 /* 文件 类 型 */ 
13 enum file types { 
14 FT_UNKNOWN, // 不 支持 的 文件 类 型 
15 FT_REGULAR, // 普通 文件 
16 FT DIRECTORY  ”// 目录 
17 }; 
18 
19 /* 打开 文件 的 选项 */ 
20 enum oflags { 
21 O_RDONLY, // 只 读 
2 O_WRONLY, // 只 与 
23 O_RDWR, // 读 写 
24 O CREAT = 4 // 创建 
25 }3; 
26 
27 /* 用 来 记录 查找 文件 过 程 中 已 找到 的 上 级 路 径 ， 
也 就 是 查找 文件 过 程 中 “ 走 过 的 地 方 ” */ 
28 struct path search record { 
29 char searched path [MAX PATH LEN]; // 查找 过 程 中 的 父 路 径 
30 struct dir* parent dir; // 文件 或 目录 所 在 的 直接 父 目录 
341 enum file types file type; 
// 找到 的 是 普通 文件 ， 还 是 目录 ， 找 不 到 将 为 未 知 类 型 (FT_UNKNOWN) 
32. }; 
略 


iO 





宏 MAX PATH LEN 表示 路 径 名 最 大 的 长 度 ， 这 里 其 值 为 512。 
枚 举 结构 enum oflags 是 打开 文件 时 的 选项 ， 


了 ， 要 不 到 时 候 就 为 这 几 
您 就 会 知道 , 其 





A 











将 来 




















实现 fle_create 和 open 函数 时 会 用 到 ， 提 前 就 放 这 


























人 
“int 





定义 再 重复 说 明 fs.h 真是 不 从 


open(const char *pathname, int flags) ’, 它 





2 二 和 放 


当 的 。 简 单 说 一 下 flags， 查 看 











提供 一 些 标识 选项 ， 








open 函数 的 帮助 
也 就 是 参数 flags， 








可 选 的 值 一 般 有 O_ RDONLY、O_WRONLY、O_ RDWR、O_CREAT、O_EXCL 等 ， 它 们 是 定义 在 文 








多 














们 enum o 























和 























定义 了 struct 





单独 解析 





牛 “/usr/include/asm-generic/fentl.h ”中 的 宏 ， 如 
14-17 所 示 。 
目前 只 
识 ， 这 里 是 按 “ 位 ”来 定义 各 标识 的 ， 按 二 进 制 
来 说 , O_RDONLY 的 值 为 000b, O_WRONLY 的 
值 为 001b，O_RDWR 的 值 为 010b，O_CREAT 
的 值 为 100b， 这 样 的 好 处 是 当 
或 “|” 闭 加 到 一 起 作为 复合 参 
与 运算 “&” 
下 国 





flags 结构 中 只 支持 4 个 标 











这 几 个 标识 通过 位 
数 时 ， 可 以 通过 位 
出 各 位 以 反 推 标识 位 。 


path_search_ record， 它 是 路 



































径 搜 




















索 ; 
处 理 过 的 上 级 路 径 ， 也 就 是 查找 文件 ; 
比如 查找 文件 “/a/b/c”， 知 找 不 至 














searched path 就 是 查找 过 程 
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记录 ， 此 结构 




















] 来 记录 查找 文件 过 程 中 已 
































| 的 话 
中 不 存在 
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受 | 














层 目 


14- 
才 程 中 " 走 过 的 地 方 。 用 此 结构 的 目的 是 想 获取 路 径 ， 
， 我 们 想 知 道 是 不 存在 ， 还 是 上 





17 flags 定义 








“ 断 链 ” 的 部 分 ， 


中 成 员 
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录 b 或 a 就 不 存在 ， 





的 路 径 ， 还 是 拿 查 找 “/a/b/e” 来 说 ， 若 仅 是 c 不 存在 ，searched path 的 值 





为 “/a/bjc” 若是 b 就 不 存在 ，searched path 的 值 为 “/a/b”。 成 员 parent dir 





于 记录 文件 或 目录 所 在 的 直接 
































父 目录 ， 成 员 file type 是 找到 的 文件 类 型 ， 若 找 不 到 文人 
好 啦 ， 头 文件 结束 啦 ， 下 硬 




















代码 14-15 
.上 略 
229 /* 搜索 文件 pathname， 若 找到 则 返 











口 














inode 号 ， 否 则 返 


F 的 话 ， 该 值 为 未 知 类 型 FT_UNKNOWN。 


| 看 实现 ， 见 代码 14-15。 


( project/c14/c/fs/fs.c ) 





口 








一 工 */ 





230 static int search file(const char* pathname, 
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struct path search record* searched record) 
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231 /* 如 果 待 查找 的 是 根 目 录 ， 为 避免 下 面 无 用 的 查找 ， 
直接 返回 已 知 根 目录 信息 */ 
232 if (!strcmp (pathname, "/") | I!strcmp (pathname, "/.") | 人 
lstrcmp (pathname, "™/.."™)) { 
233 searched record->parent dir = &root dir; 
234 searched record->file type = FT DIRECTORY; 
235 searched record->searched path[0] = 0; // 搜索 路 径 置 空 
236 return 0; 
237 } 
238 
239 uint32 t path len = strlen (pathname); 
240 /* 保证 pathname 至 少 是 这 样 的 路 径 /x， 且 小 于 最 大 长 度 */ 
241 ASSERT (Pathname [0] == '/' && path len > 1 &&\ 
path len < MAX PATH LEN); 
242 char* sub path = (char*)pathname; 
243 struct dir* parent dir = &root dir; 
244 struct dir entry dir e; 
245 
246 /* 记录 路 径 解 析出 来 的 各 级 名 称 ， 如 路 径 "/a/b/c"， 
247 * 数组 name 每 次 的 值 分 别 是 "a", "b","c" */ 
248 char name [MAX FILE NAME LEN] = {0}; 
249 
250 searched record->parent dir = parent dir; 
251 searched record->file type = FT UNKNOWN; 
252 uint32 t parent inode no = 0; // 父 目 录 的 inode 号 
253 
254 sub path = path parse(sub path, name)，; 
255 while (name[0]) { // 若 第 一 个 字符 就 是 结束 符 ， 结 束 循环 
256 /* 记录 查找 过 的 路 径 ， 但 不 能 超过 searched patn 的 长 度 512 字 节 */ 
之 与 了 ASSERT (strlen(searched record->searched path) < 512) 
258 
259 /* 记录 已 存在 的 父 目录 */ 
260 strcat (searched record->searched path, "™/"); 
261 strcat (searched record->searched path, name); 
262 
263 /* 在 所 给 的 目录 中 查找 文件 */ 
264 if (search dir entryl(cur part, parent dir, name, &dir e)) { 
265 memset (name, 0, MAX FILE NAME LEN); 
266 /* 若 sub_patnh 不 等 于 NULL， 也 就 是 未 结束 时 继续 拆 分 路 径 */ 
267 if (sub path) { 
268 sub path = path parse(sub path, name); 
269 } 
270 
271 if (FT DIRECTORY == dir e.f type) {  // 如 果 被 打开 的 是 目录 
272 parent inode no = parent dir->inode->i no; 
2 dir close(parent dir); 
274 parent dir = dir open(cur part，dir e.i no); // 更 新 父 目 录 
275 searched record->parent dir = parent dir; 
276 continue; 
277 }) else if (FT REGULAR == dir e.f type) {  // 若是 普通 文件 
278 searched _ record->file type = FT REGULAR; 
279 return dir e.i no; 
280 } 
281 } else { // 若 找 不 到 ， 则 返回 -1 
282 /* 找 不 到 目录 项 时 ， 要 留 着 parent_dir 不 要 关闭 ， 
283 * 若是 创建 新 文件 的 话 需 要 在 parent _dir 中 创建 */ 
284 return -1;} 
285 } 
286 } 
287 
288 /* 执行 到 此 ， 必 然 是 遍历 了 完整 路 径 ， 
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并 且 查 找 的 文件 或 目录 只 有 同名 目录 存在 */ 






































289 dir close(searched record->parent dir); 

290 

291 /* 保存 被 查找 目录 的 直接 父 目录 */ 

292 searched record->parent dir = dir openl(cur part, parent inode no); 
293 searched record->file type = FT DIRECTORY; 

294 return dir e.i no; 

295 } 

… 略 


函数 search_file 接受 2 个 参数 , 被 检索 的 文件 pathname 和 路 径 搜索 记录 指针 searched _ record， 功能 是 














搜索 文件 pathname， 若 找到 则 返 
























































































































































免 内 存 泄漏 。 下 面 开 始 介 绍 函数 实现 。 










































































其 inode 号 ， 否 则 返回 -1。 其 中 参数 pathname 是 全 路 径 ， 即 从 根 
开始 的 路 径 。 参 数 searched _ record 由 主 调 函 数 提 供 , 主 调 函 数 只 关注 该 结构 中 的 信息 , 并 不 关注 搜索 过 程 ， 
该 结构 中 的 数据 由 函数 search file 填充， 其 中 的 成 员 parent dir 记录 的 是 待 查找 目标 〈 文 件 或 目录 ) 的 直 
接 父 目录 ， 原 因 是 主 调 函 数 通常 需要 获取 目标 的 父 目 录 作 为 操作 对 象 ， 比 如 将 来 创建 文件 时 ， 需 要 知道 在 
哪个 目录 中 创建 文件 ， 因 此 所 有 调用 search_file 的 主 调 函数 记 得 释放 目录 searched_record->parent_dir， 避 





有 时 候 用 户 输入 的 路 径 可 能 仅 是 根 目录 /， 不 包括 子路 径 ， 比 如 执行 命令 “1s/” 就 是 这 样 的 愉 
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出 








况 。 因 






































此 在 代码 第 232 一 236 行 判 断 ， 如 果 待 查找 的 是 根 目录 ， 为 避免 后 续 无 用 的 查找 工作 ， 直 接 在 searched record 








中 写 入 根 目录 信息 后 返回 。 















































第 242 一 244 行 用 指针 sub_path 指向 路 径 名 pathname， 我 们 后 








看 的 处 理 主要 





] sub_path 变量 ， 声 明 目 录 


外 针 parent_dir 指向 根 目录 ， 我 们 要 从 根 目 录 开 始 往 下 查找 文件 ， 然 后 声明 了 目录 项 dir_e。 























了 ，name 必然 会 作为 函数 path_parse 的 参数 。 



























































析 路 径 ， 因 此 初始 化 parent inode_no 为 根 目录 的 inode 编号 0。 




















下 面 开 始 搜索 文件 啦 。 搜 索 文 件 的 原理 是 路 径 解 析 ， 也 就 是 把 路 径 按照 分 隔 
路 径 名 就 去 目录 中 确认 相应 的 目录 项 , 与 目录 项 中 的 名 ename 比 对 ， 找 到 后 继续 路 径 解 析 ， 直 到 路 径 解析 


YH 


















































完成 或 找 不 到 某 个 中 间 目 录 就 返回 。 





第 254 行 执行 “sub_path = path parse(sub path, name)” 开 始 路 径 解析 ，path parse 返 








第 248 行 声明 了 数组 name[MAX _ FILE NAME LEN]， 它 用 来 存储 路 径 解析 中 的 各 层 路 径 名 ， 您 猜 到 








第 230 一 252 行 也 是 一 些 准备 工作 ， 其 中 parent inode no 是 父 目 录 inode 编号 ， 它 的 作用 是 备份 各 层 
解析 出 来 的 路 径 的 父 目 录 的 inode 编号 (有 点 嘿 喧 ,但 是 无 比 精确 ， 忽 略 我 吧 ^^)。 我 们 从 根 目 录 开 始 解 























符 /' 拆 分 ， 每 解析 出 一 


Ml 














ke 





后 ， 最 上 层 的 路 径 


























名 会 存储 在 name 中 ， 返 世 








Sy 
















































































\0' (其 ASCII 码 值 为 0)， 就 表示 name 不 是 空 字 符 串 ， 路 径 解析 尚未 结 























直 存 入 sub path， 此 时 的 sub_path 己 经 剥 去 了 最 上 层 的 路 径 。 
第 255 行 ， 使 用 while 循环 处 理 各 层 路 径 ， 其 判断 条 件 是 name[0]， 只 要 name[0] 不 等 于 字符 串 结束 符 




















循环 体 中 的 第 260 一 261 行 ， 每 次 解析 过 的 路 径 都 会 追加 到 searched record->searched path 中 ， 


searched_path 用 于 记录 已 解析 的 路 径 ， 由 于 是 先 调用 path_parse 解析 路 径 , 再 调用 search_dir_entry 去 验证 路 


























径 是 否 存 在 ， 因 此 searched_record->searched_path 中 的 最 后 一 级 目录 未 必 存 在 
的 。 第 260 行 的 代码 在 第 一 次 执行 时 所 添加 的 "表示 根 目 录 ， 后 续 循 环 中 添 力 

































































pe 








其 前 的 所 有 路 径 都 是 存在 





[的 "是 路 径 分 隔 符 。 
接着 在 第 264 行 调用 search_dir_entry 判断 解析 出 来 的 上 层 路 径 name 是 否 在 父 目录 parent_dir 中 存在 ， 
如 果 存 在 ， 也 就 是 被 找到 了 ，dir_e 中 会 被 录入 目录 项 的 信息 。 接 着 调用 memset 将 name 清 0， 因 为 后 面 





我 们 要 继续 用 name 来 存储 新 的 路 径 。 第 267 行 判 断 sub_ path 是 否 为 null， 它 是 由 函数 path parse 赋值 的 ， 
该 函数 总 是 返回 最 上 层 路 径 之 外 的 子路 径 。 若 sub_path 不 为 null， 这 说 明 路 径 解 析 未 完成 ， 还 有 子路 径 未 
拆 出 来 ， 在 第 268 行 再 次 执行 “sub_path = path parse(sub path, name)” 进 行 下 一 步 的 路 径 解 析 。 




























































































经 过 前 面 的 search dir_ entry 调用 ，dir e 中 已 经 是 目录 项 的 信息 了 ， 在 第 271 行 通过 “ifFT 


















































DIRECTORY == dir_e.f type)” 来 判断 解析 出 的 最 上 层 路 径 name 是 否 为 目录 ， 若 是 目录 ， 就 将 父 目录 的 











inode 编号 赋值 给 变量 parent inode no， 此 变量 用 于 备份 父 目 录 的 inode 编号 ， 


















































它 会 在 最 后 一 级 路 径 为 目 














录 的 情况 下 用 到 ， 也 就 是 第 292 行 代码 。 接 着 在 第 273 行 关 闭 父 目录 parent _ dir， 打开 的 目录 记得 关闭 ， 



























































632 


否则 造成 内 存 泄 漏 。 注 意 , 根 目录 是 不 可 被 关闭 的 , 我 们 在 dir_close 中 有 特殊 处 理 。 接 下 来 把 目录 name 











同时 通过 第 275 行 的 代码 “ 























打开 ， 重 新 为 parent_dir 赋值 ， 此 处 对 应 的 代码 是 第 274 行 的 “parent_dir =dir open(cur part dir e.i no)”。 
‘searched record->parent dir = parent _ dir” 更 新 搜索 记录 中 的 父 
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录 。 如 果 name 


为 普通 文件 的 话 ， 在 正常 情况 下 ， 也 就 是 路 径 输 入 正确 的 情况 下 ， 这 说 明 已 经 把 路 径 从 左 到 右 处 理 完了 ， 
因此 将 搜索 记录 中 的 旬 e_ type 更 新 为 FT REGULAR, 随后 返回 普通 文件 name 的 inode 编号 , 即 dir e.i_no。 




















说 到 此 处 , 细心 的 朋友 可 能 看 出 了 一 些 端倪 , 也 许 认 为 这 检 
朵 Fa 是 目录 ， 它 应 该 在 根 目 录 中 。 若 实际 情况 是 根 目录 中 
H 提 示 没 有 目录 a， 对 吗 ? 我 必须 得 打消 您 的 疑虑 。search_file 只 负责 在 文件 系统 
周 函 数 安排 的 。 也 许 您 


来 说 ， 我 们 从 路 径 
a， 我 们 应 该 返回 -1 并 给 
上 检索 文件 ， 它 不 负责 侦 错 处 理 ， 它 是 由 主 调 函 数 调 用 的 ， 有 具体 的 处 理 方法 是 由 主 j 











































































































# 处 理 不 妥 , 您 的 想法 我 型 














































































































又 在 问 ， 主 调 函 












































E 解 ， 比 如 拿 路 径 “/a/b” 
只 有 文件 a， 并 没有 目录 

































































可 知道 search file 在 搜索 过 程 中 发 生 了 什么 ? 您 看 ，search_file 已 经 把 路 径 处 理 信息 


保存 在 “路 径 搜索 记录 ”path_search _ record 中 了 ， 每 处 理 一 层 路 径 ， 都 会 将 其 人 加 到 path_search_ record 


中 的 searched path 中 ， 因 此 主 调 函 数 可 以 根 直 

















待 将 来 我 们 有 search_file 的 应 用 环境 时 您 就 更 清楚 啦 。 
若 第 264 行 的 search_dir_entry 返回 旭 lse， 也 就 是 未 找到 name， 程 序 跳 到 第 281 行 ， 直 接 返 回 -1。 注 意 ， 未 





找到 name 时 ，parent_dir 也 不 能 关闭 ， 因 为 有 可 能 主 调 函数 会 在 parent_ dir 目录 中 创建 文人 








调 函 数 需要 知道 在 哪个 目录 中 创建 文件 , 上 





















































居 searched_path 来 判断 pathname 是 否 正确 ， 是 否 处 理 完了 ， 














F name， 也 就 是 说 ， 主 








程序 若 能 执行 到 第 289 行 ， 这 说 明 两 件 事 。 


(1) 路 径 pathname 








已 经 被 完整 地 解析 过 了 ， 各 级 都 存在 。 











(2) pathname 的 最 后 一 层 路 径 不 是 普通 文件 ， 而 是 目录 。 








是 路 径 pathname 中 下 






























































上 时 searched record->parent dir 指向 父 目 录 ,， 主 调 函 数 负责 关 闭 该 目录 。 


结论 是 待 查找 的 目标 是 目录 ,如 “/a/b/c” c 是 目录 , 不 是 普通 文件 。 此 时 searched_ record-> parent_dir 


的 最 后 一 级 目录 c， 并 不 是 倒数 第 二 级 的 父 目 录 b， 我 们 在 任何 时 候 都 应 该 使 

















searched_record->parent_dir 是 被 查找 目标 的 直接 父 目 录 ， 也 就 是 说 ， 无 论 目标 是 普通 文件 ， 还 是 目录 ， 
searched record->parent dir 中 记录 的 都 应 该 是 目录 b。 因 此 我 们 需要 把 searched record->parent dir 重新 更 新 为 















































父 目录 b。 在 重 六 
接 下 来 是 重新 打开 父 
上 用 场 的 时 候 ,在 































































































录 之 前 ， 为 避免 内 存 溢出 ， 先 调用 dir_close 关闭 目录 searched record->parent dir。 
录 , 我 们 之 前 已 经 将 父 目 录 的 inode 编号 保存 在 了 变量 parent inode no 中 ,此 时 是 它 派 











E 第 292 行 打开 父 上 











为 FT DIRECTORY， 最 后 返回 目录 的 inode 编号 。 


search_file 到 这 就 介绍 完了 ， 前 期 工作 铺垫 的 差不多 了 ， 下 节 咱 们 该 实践 了 ， 兄 弟 们 下 


创建 文件 


























经 过 前 期 大 量 的 准 












































录 并 为 searched record->parent dir 赋值 。 然 后 在 下 一 行 更 新 成 员 file type 














会 。 


We 




















E 备 工作 ， 现 在 离 目标 已 经 很 接近 了 ， 其 实 咀 们 离 创 建文 件 只 差 一步 ， 注 意 ， 这 里 


























创建 普通 文人 








F， 不 包括 目录 ,创建 目 录 的 工作 咱们 安排 在 后 续 章节 。 

















14.5.1 实现 file_create 


为 实现 文件 的 创建 
































时 一 同 讲解 ， 原 















































ft 














工作 ， 现 在 在 file.c 中 再 增加 一 个 函数 fle_create。 此 函数 之 所 以 未 在 之 前 介绍 fle.c 中 
b 函 数 中 用 到 了 当时 未 介绍 的 函数 ， 不 想 给 大 伙 儿 增加 学 习 的 麻烦 。 
在 进行 介绍 之 前 ， 下 面 讨论 下 创建 文件 需要 考虑 哪些 工作 。 


(1) 文件 需要 inode 来 描述 大 小 、 位 置 等 属性 ， 所 以 创建 文件 就 要 创建 其 node。 这 就 涉及 到 向 


inode_bitmap 申 世 


的 inode 填充 。 


(2) inode->i sectors 是 文件 具体 存储 的 扇 区 地 址 ， 这 需要 向 block bitmap 申请 可 
(在 我 们 这 里 ， 为 简化 处 理 


























位 图 来 获得 inode 号 ， 因 有 




















比 inode_bitmap 会 被 更 新 ，inode table 数组 


















































中 的 某 项 也 会 由 新 














j 位 来 获得 可 用 的 块 



































E，1 块 等 于 1 扇 区 )， 因 此 block bitmap 会 被 更 新 ， 分 


以 后 的 某 个 扇 区 会 被 分 配 。 




















xX. data start lba 
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(3) 新 增加 的 文件 必然 存在 于 某 个 目录 ， 所 以 该 目录 的 inode->i_size 会 增加 个 目录 项 的 大 小 。 此 新 增 
加 的 文件 对 应 的 目录 项 需要 写 入 该 目录 的 inode->i_ sectors[] 中 的 某 个 扇 区 ， 原 有 扇 区 可 能 已 满 ， 所 以 有 可 
能 要 申请 新 扇 区 来 存储 目录 项 。 

(4) 知 其 中 某 步 操作 失败 ， 需 要 回 滚 之 前 已 成 功 的 操作 。 

(5) inode_bitmap、block bitmap、 新 文件 的 inode 及 文件 所 在 目录 的 inode， 这 些 位 于 内 存 中 已 经 被 
改变 的 数据 要 同步 到 硬盘 。 

该 说 的 都 说 了 ， 咱 们 在 实践 中 验证 吧 ， 代 码 走 起 ， 见 代码 14-16。 


代码 14-16 (project/c14/c/fs/file.c ) 





















































































































































… 略 
96 /* 创 建文 件 ， 若 成 功 则 返回 文件 描述 符 ， 否 则 返回 -1 */ 

97 int32 七 file create(struct dir* parent dir, char* filename, uint8 t flag) { 
98 /* 后 续 操作 的 公共 缓冲 区 */ 
















































































99 void* io buf = sys malloc(1024); 

100 if (io buf == NULL) { 

101 printk ("in file creat: sys malloc for io buf failed\n"); 
102 return -1; 

103 } 

104 

105 uint8 t rollback step = 0;  // 用 于 操作 失败 时 回 滚 各 资源 状态 
106 

107 /* 为 新 文件 分 配 inoqe */ 

108 int32 七 inode no = inode bitmap alloc(cur part); 

109 if (inode no == -1) { 

小 于 站 printk ("in file creat: allocate inode failed\n"); 
4 和 十 return -1; 

112 

TL3 



































114 /* 此 inode 要 从 堆 中 申请 内 存 ， 不 可 生成 局 部 变量 ( 函数 退出 时 会 释放 )， 
115 * 因为 file table 数组 中 的 文件 描述 符 的 inodqe 指针 要 指向 它 */ 











































































































116 struct inode* new file inode =\ 
(struct inode*)sys malloc(sizeof (struct inode)); 
于 二 if (new file inode == NULL) { 
118 printk ("file create: sys malloc for inode failded\n"); 
119 rollback step = 1; 
120 goto rollback; 
121 } 
1 inode init (inode no, new file inode); // 初始 化 i 结 点 
123 
124 /* 返回 的 是 file table 数组 的 下 标 */ 
125 int fd idx = get free slot in global (); 
126 if (fd idx == -1) { 
:24 printk ("exceed max open files\n"); 
128 rollback step = 2; 
129 goto: rollbyacky 
130 } 
31 
We file tablel[fd idx] .fd inode = new file inode; 
133 file tablel[fd idx] .fd pos = 0; 
134 file tablel[fd idx] .fd flag = flag; 
.39 file tablel[lfd idx] .fd inode->write deny = false; 
136 
L337 struct dir entry new dir entry; 
.38 memset (&new dir entry, 0, sizeof(struct dir entry)); 
139 
140 create dir entry (filename, inode no, FT REGULAR, &new dir entry); 
// create dir entry 只 是 内 存 操 作 不 出 意外 ， 不 会 返回 失败 
141 
142 /* 同步 内 存 数据 到 硬盘 */ 
143 /* a 在 目录 parent_dir 下 安装 目录 项 new dir entry， 
写 入 硬盘 后 返回 true， 否则 false */ 
144 if (!sync dir entry(parent dir, &new dir entry, io buf)) { 
145 printk("sync dir entry to disk failed\n"); 
146 rollback step = 3; 
147 goto rollback; 
148 } 
149 
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168 /* 凶 


若 某 
下 695 全 


182 
183 } 


memset (io puf, 


0, 1024 














); 
/* b 将 父 录 i 结 点 的 内 容 同 步 到 硬盘 */ 








inode sync (cur 


memset (io buf, 


part, parent dir->inode, io buf); 


0, 1024); 




















Y 夫 .这 等 新 创建 文件 的 i 结 点 内 容 同步 到 硬盘 */ 


inode sync (cur 


part, new file inode, io buf); 











/* d 将 inode bitmap 位 图 同步 到 硬盘 */ 
bitmap sync (cur part, inode no INODE BITMAP); 











/* e 将 创建 的 文件 i 结 点 添加 到 open inodes 链表 */ 


list push(&cur 
new file inode-— 


part->open inodes, &new file inode->inode tag); 
>i_open cnts = 1; 


SYS_free (io puf); 
return pcb fdq install (fd idx); 








步 失 败 则 会 执行 到 





建文 件 需 要 创建 相关 的 多 个 资源 ， 











的 回 滚 步骤 */ 




















lback: 
switch (rollback step) { 
case 3: 
/* 失败 时 ， 将 file_table 中 的 相应 位 清空 */ 
memset (&file table[fdq idqxl，0，sizeof(struct file)); 
case 2: 
SYS_free (new file inode); 
case 1: 
/* 如 果 新 文件 的 i 结 点 创建 失败 ， 








之 前 位 图 











Pp 分 配 的 inode_no 也 要 恢复 */ 


bitmap set (&cur part->inode bitmap, inode no 0); 


break; 


} 





sys_free (io puf); 


return -1; 





函数 file_create 接受 3 个 参数 ， 父 目录 partent dir、 文 件 名 flename、 创 建 标识 fag， 功 能 是 在 目录 


parent dir 中 以 模式 flag 


则 返回 -1 。 














去 创建 普通 文件 flename， 若 成 功 则 返回 文件 描述 符 ， 即 pcb->fd table 中 的 下 标 ， 否 








大 伙 儿 最 好 是 结 





file_create 是 基于 之 前 介 









































合 图 14-16， 这 样 便于 理解 fle create 在 做 什么 。 
绍 的 基础 函数 ， 如 函数 inode_sync 和 sync_dir entry。 这 两 个 是 往 硬 盘 上 写 数据 
































的 函数 ， 其 原理 是 需要 先 把 



























































原 鹿 区 的 数据 读 到 内 存 , 在 内 存 中 将 数据 变更 后 再 写 入 硬盘 扇 区 ， 所 以 用 于 变更 


















































数据 的 内 存 缓 冲 区 是 不 可 少 的 。 往 硬盘 上 同步 数据 的 操作 往往 是 诸多 步骤 中 的 最 后 一 步 ， 如 果 在 这 类 函数 内 


部 申请 内 存 作 为 缓冲 区 ， 万 一 内 存 不 足 ， 则 往 硬 盘 上 同步 数据 就 会 失败 ， 那 之 前 所 做 的 所 有 工作 都 会 白费 ， 
























































所 以 在 创建 文件 之 初 就 应 该 把 组 ; 
成 数据 不 一 致 、 回 滚 操 ee 般 情 况 下 硬盘 操作 都 是 一 次 读 写 一 个 硝 区 ， 考 虑 到 有 





到 硬盘 而 造 
































区 准备 好 ,如 果 申 请 内 存 失败 了 也 不 会 多 做 无 用 功 , 也 避免 了 最 后 无 法 同步 















































rn 





















































数据 会 跨 扇 


现在 再 说 一 下 回 滚 ， 回 滚 就 是 资源 变更 后 ， 将 资源 恢复 到 未 修改 前 的 状态 。 文 件 系 统 是 一 套 资源 管理 
每 变动 一 种 数据 就 会 涉及 到 多 种 资源 的 “联动 ”” 这 里 所 说 的 “联动 ” 意 指 一 个 事物 的 状态 改变 
后 ， 周 边 事物 也 要 一 同 跟着 变动 的 连锁 反应 。 按 理 说 相关 资源 的 联动 应 该 是 一 个 事务 ,具有 原子 性 ， 即 要 








的 方法 ， 











区 的 情况 ， 故 申请 2 个 扇 区 大 小 的 组 ; 















































， 因 此 在 函数 开头 就 先 申 请 了 1024 字 节 的 缓冲 区 io_buf。 





































































































么 都 成 功 变更 ， 要 么 都 不 变 ， 万 一 在 哪个 步骤 中 失败 了 ， 其 前 所 做 的 变动 都 要 回 滚 到 之 前 的 状态 。 这 就 像 











超市 里 卖 货 一 样 ， 卖 出 去 
被 顾客 退回 的 时 候 ， 账 本 上 要 减 去 这 笔 流 水 ， 并 且 库 存 中 要 增加 一 件 商 品 。 




















件 商 品 后 ， 营 业 额 账本 上 要 增加 一 笔 流水 ， 库 存 中 要 减少 一 件 商 品 ， 当 该 商品 























创建 文件 包括 多 个 修改 资源 的 步 又 ,我 们 创建 新 文件 的 顺序 是 : 0 结 点 -> 文件 描述 符 刀 -> 目 
录 项 。 这 种 “从 后 往 前 ” 创 





























建 步骤 的 好 处 是 每 一 步 创建 失败 时 回 滚 操作 少 。 不 过 随 着 步骤 的 递增 ， 失 败 时 









































回 滚 的 步骤 也 将 递增 。 
在 第 169 行 的 标签 rollback 














处 ， 大 家 移 步 过 去 看 看 ， 那 里 有 3 部 分 的 回 深 操 作 ， 只 列 出 了 有 可 能 会 失败 的 
































操作 ， 从 上 到 下 依次 是 case 3、case2、casel， 各 case 之 间 没 有 break， 它 们 是 一 种 累加 的 回 滚 ， 因 此 case3 
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执行 的 回 深 操 作 最 多 ，casel 最 少 ， 


存 ， 如果 内 存 申 请 
的 值 ， 
inode_init 初始 化 new_file_inode。 


file_table 中 没有 空闲 位 则 返回 -1， 于 是 将 rollback step 置 为 2， 依 然 是 通 ; 
case2 处 的 代码 ， 执 行 sys_free(new_file inode) 释 放 new_file inode 的 内 存 ， 然 后 执行 casel 恢复 inode 位 图 。 




















折 文 件 分 配 inode， 第 116 行为 新 文件 
失败 , rollback step 置 为 1, 程序 昌 
会 执行 分 支 case 1， 即 执行 第 


第 108 行 调用 inode bitmap alloc 为 















































接 下 来 调用 get free slot in global 从 file talbe 中 获取 空闲 文件 乡 























通过 





A 




















































































































构 的 下 标 ， 写 入 变量 f idx 中 。 如 果 
gotoi 


需要 回 滚 时 ， 只 要 将 rollback_step 置 为 相应 的 case 就 好 了 。 

的 inode 一 一 new fle inode 申请 内 
kt 转 到 rollback 处 ,也 就 是 
178 行 的 bitmap_set 回 深 位 图 状态 。 如 果 内 存 分 配 成 功 的 话 ， 执 行 


第 169 行 , 根据 rollback_step 









































语句 跳 转 到 rollback 处 ， 执 行 

































































第 132 一 135 行 初始 化 文件 表 中 的 文件 结构 ， 第 137 一 138 行为 文件 创建 新 目录 项 new dir entry， 
将 其 清 0， 第 140 行 调用 create dir entry 用 filename、inode no 和 FT REGULAR 填充 new_dir entry。 准 备 好 
目录 项 后 ， 接 着 在 第 144 行 通 过 函数 sync_dir_entry (parent dir &new dir_ entry io buf 将 其 写 入 到 父 目 录 
parent_dir 中 ， 如 果 失 败 ，trollback step 置 为 3， 执 行 回 滚 。 

sync_dir_ entry 会 改变 父 目录 inode 中 的 信息 ， 因 此 在 第 152 行 调用 函数 inode_ sync 将 父 目 录 inode 同步 到 


硬盘 。 
各 新 文件 的 inode 添加 到 inode 列表 ， 也 就 是 cur_ part->open_inodes， 随 后 在 
就 结束 了 ， 在 第 165 行将 io buf 释放 ， 


将 
同步 操作 一 般 不 会 
然后 在 第 166 行 调用 pcb fa install(fd idx)， 在 数 纪 
位 的 


























接着 在 第 1$6 一 159 行 分 











别 将 新 文件 的 inode 同步 到 硬盘 ， 将 inode_bitmap 位 图 


























因此 这 并 未 有 相应 的 回 滚 。 硬 盘 操 作 到 这 





出 问题 ， 




















闲 

















一 1， 用 return 将 其 返回 值 返回 。 
j 它 创建 文件 了 。 





下 标 ， 若 失败 则 返 匠 
好 啦 ，file_create 就 完成 了 ， 下 节 咱 们 要 





























14.5.2 ”实现 sys_open 


很 容易 了 ,不 知道 是 否 有 同学 会 觉得 奇怪 , 哎 ? 创建 文件 不 是 应 该 用 
char *pathname, mode tmode)” 啊 ， 是 啊 ， 但 open 函数 功能 更 多 ， 它 提供 了 很 多 flag， 
件 外 ， 还 能 创建 新 文件 ， 以 下 面 的 形式 调用 open 就 相当 于 creat。 


数 实现 





终于 要 实现 创建 文件 啦 ， 等 了 好 入 终 于 等 到 今天 。 











日 pcb->fd_table 中 找 个 空闲 位 安装 fd_idx， 














同步 到 硬盘 。 第 162 行 
i_open_cnts 置 为 1。 以 上 几 个 






































Dang 
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若 成 功 则 返回 气 




















本 节 要 实现 的 函数 是 sys_open， 






















































































open(const char * pathname, (O_CREATIO_ Ce TRUNO)); 
这 里 不 打算 单独 实现 creat 函数 ，open 函数 功能 
也 很 容易 的 。 好 啦 ， 上 代码 ， 见 代码 14-17。 


代码 14-17 









































( project/c14/c/fs/fs.c ) 
… 略 

297 /* 打开 或 创建 文件 成 功 后 ， 返 回 文件 描述 符 ， 否 则 返回 -1 */ 

298 32 七 SYS_ open (Const char* pathname, uint8 t flags) { 











































































































它 是 open 函数 的 内 核 级 实现 ， 有 了 它 之 后 将 来 实现 open 系统 调用 就 
creat 函数 吗 ? 其 原型 是 “int creat(const 











大 





此 除了 能 打开 文 








， 还 是 以 它 为 主 吧 ， 了 解 了 原理 之 后 ，creat 函 





299 /* 对 目录 dir_open， 这 里 只 有 open 文件 */ 

300 if (pathname[strlen(pathname) - 1] == '/') { 

301 printk("can‘t open a directory %s\n",pathname); 

302 return -1; 

303 } 

304 ASSERT (flag <=7); 

305 int32 t fd = -1; // 默认 为 找 不 到 

306 

307 struct path search record searched record; 

308 memset (&searched record, 0, sizeof(struct path search record) ) ; 
309 

S10 /* 记录 目录 深度 ， 帮 助 判断 中 间 某 个 目录 不 存在 的 情况 */ 

311 uint32 t pathname depth = path depth cnt ((char*)pathname); 
312 

313 /* 先 检 查 文件 是 否 存 在 */ 

314 int inode no = search file(pathname, &searched record); 

二 玉生 bool found = inode no != -1 ? true : false; 

316 

317 if (searched record.file type == FT DIRECTORY) { 


636 


318 printk("can‘t open a direcotry with open(), use opendir() to instead\n"); 
319 dir close(searched record.parent dir); 

320 return -1; 

321 } 

322 

323 uint32 t path searched depth = \ 


path depth cnt (searched record.searched path); 














325 /* 先 判断 是 否 把 pathname 的 各 录 都 访问 到 了 ， 
即 是 否 在 某 个 中 间 目 录 就 失败 了 */ 

326 if (pathname depth != path searched depth) { 
// 说 明 并 没有 访问 到 全 部 的 路 径 ， 某 个 中 间 目 录 是 不 存在 的 







































































































































































































































































327 Pintk ("cannot access %s: Not a directory, subpath %s is’t exist\n", \ 

328 pathname, searched record.searched path); 

329 dir close(searched record.parent dir); 

330 Teturn ~—1y 

334 } 

332 

333 /* 若是 在 最 后 一 个 路 径 上 没 找 到 ， 并 且 并 不 是 要 创建 文件 ， 直 接 返 回 -1 */ 

334 if (!found && !(flags & O CREAT)) { 

335 printk("in path %s, file %s is‘t exist\n", \ 

336 searched record.searched path, \ 

337 (strrchr (searched record.searched path, '/') + 1)); 

338 dir close(searched record.parent dir); 

339 return -1; 

340 } else if (found && flags & 0_CREAT) { // 若 要 创建 的 文件 已 存在 

341 printk("%s has already exist!\n", pathname); 

342 dir close(searched record.parent dir); 

343 return -1; 

344 } 

345 

346 Switch (flags& O CREAT) { 

347 case O CRERAT : 

348 printk ("creating file\n"); 

349 fd = file create(searched record.parent dir, \ 

(strrchr (pathname, '/') + 1), flags); 

350 dir close(searched record.parent dir); 

351 // 其 余 为 打开 文件 

352 } 

353 

354 /* 此 faq 是 指 任务 pcb->fd table 数组 中 的 元 素 下 标 ， 

355 * 并 不 是 指 全 局 file_ table 中 的 下 标 */ 

356 return fd; 

357 

sys_open 函数 接受 2 个 参数 ，pathname 是 待 打开 的 文件 ， 其 为 绝对 路 径 ，flags 是 打开 标识 ， 其 值 便 
是 之 前 在 fs.h 头 文件 中 提前 放 入 的 enum oflags。 函 数 功 能 是 打开 或 创建 文件 成 功 后 ,返回 文件 描述 符 ， 即 








三 


—1。 











pcb 中 fa table 中 的 下 标 ， 否 则 返 


















































目录 以 字符 结尾， 如 “/a/” a 便 是 指 目录 ，sys_open 只 支持 文件 打开 ， 不 文 持 目录 打开 ， 因 此 程序 





开头 判断 pathname 是 否 为 目录 , 这 里 是 对 pathname 的 最 后 一 个 字符 尖 
- 1] 等 于 /， 就 表示 pathname 为 目录 ， 打 印 提示 信息 并 返回 -1。 

第 304 行 的 “ASSERT(flag <=7)” 是 限制 fags 的 值 在 O_RDONLY 
之 内 。 第 305 声明 了 变量 亿 ， 为 其 初始 化 为 -1， 即 默认 找 不 到 文件 。 













































































此 结构 了 解 在 哪 层 子 目 录 下 失败 了 。 和 若是 创建 文件 ， 便 可 直接 获得 所 色 





| 汤 ， 即 若 pathname[strlen(pathname) 





O WRONLY|O RDWR| O CREAT 








第 307 行 生 成 了 路 径 搜 索 记录 变量 searched record, path search_record 用 来 记录 文件 查找 时 所 遍历 过 的 
目录 ， 它 会 作为 参数 传 给 函数 search file， 其 值 由 函数 search file 填充 。 当 查找 失败 时 ， 主 调 函 数 可 以 根据 

















J 建文 件 的 父 目录 ， 即 在 哪个 目录 下 














创建 文件 。path_search_record 中 一 个 很 重要 的 成 员 是 searched_path， 它 用 来 记录 所 处 理 过 的 路 径 ， 











过 该 路 径 的 长 度 来 判断 查找 是 否 成 功 。 举 个 例子 ， 若 查找 目标 文件 c， 
















































































可 以 通 
它 的 绝对 路 径 是 “/a/b/c”， 查找 时 若 


荆 














发 现 b 目录 不 存在 ， 存 入 path search record.searched path 的 内 容 便 是 “/a/b”， 若 按照 此 路 径 找 到 了 ec， 


path_search_record.searched_path 的 值 便 是 完整 路 径 “/a/b/c”。 


第 308 行将 searched record 清 0。 由 于 searched record 位 于 栈 中 ， 























栈 中 数据 并 不 会 自动 清 0， 这 非常 
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容易 出 问题 。 尤 其 是 在 连续 无 间隔 调用 sys_open 打开 不 同文 件 的 时 候 ， 如 果 有 的 文件 不 存在 ， 有 的 中 间 路 





径 缺 失 ， 有 的 成 功 打 玫 



































F，search_file 函数 会 在 searched record 中 记录 不 同 的 状态 ， 下 一 次 调用 sys_open， 




















searched_ recored 还 是 指向 栈 中 相同 的 位 置 ， 栈 中 数据 不 会 自动 清 0， 所 以 数据 还 是 上 一 次 调用 中 的 结果 ， 这 
影响 sys_open 中 相关 代码 的 判断 结果 ， 所 以 在 使 用 前 一 定 要 先 清 0。 



































无 论 是 打开 文件 ， 


pathname， 搜 索 结果 存 入 searched record。 第 315 行为 bool 变量 found 赋值 。 
第 317 行 判断 pathname 的 判断 ， 若 为 目录 ， 在 第 318 行 打印 提示 信息 ， 接 着 调 
searched record.parent dir， 并 返回 -1。 前 面 f 









































第 311 行 通过 path_depth_cnt 计算 pathname 的 深度 ， 深 度 值 写 入 变量 pathname_depth， 计 算 目 录 深 度 


的 目的 是 帮助 判断 茶 个 目录 不 存在 的 情况 ， 一 会 儿 咱 们 就 知道 了 。 


























还 是 创建 文件 ， 都 要 先 判 断 文件 是 否 已 存在 ， 在 第 314 行 调用 search file 搜索 文件 





















































| dir close 关闭 目录 


Me 









































1 





门 说 过 ，search file 返回 的 path_search record.parent dir 由 

















主 调 函 数 负责 关闭 ， 原 因 是 主 调 函数 有 可 能 会 






































file_create 便 是 此 运 


场合 。 























j 到 此 目录 ， 也 许 会 在 该 目录 下 创建 文件 ， 后 面 第 349 行 的 






































第 323 行 调用 path _ depth_cnt 计算 searched record.searched path 的 路 径 深 度 ， 值 写 入 变量 path_searched 

















depth 中 。 接 着 在 第 326 行 





于 是 在 第 327 行 输出 
返回 -1。 

































































j 原 路 径 pathname 的 深度 值 pathname depth 与 path_searched _ depth 对 比 ， 若 不 
相等 ,说 明 查 找 文件 的 过 程 中 并 没有 访问 到 全 部 的 路 径 , 某 个 中 间 目 录 或 最 后 目标 不 存在 , 总 之 检索 失败 ， 















































及 错 信息 , 告诉 用 




















户 哪 个 子 目 录 不 存在 , 便于 用 户 知道 在 哪里 输 错 了 。 接着 关闭 目录 ， 




















当 flags 包含 O_CREAT 时 ，open 函数 可 以 创建 文件 。 在 第 334 行 判断 ， 若 目标 文件 未 找到 ， 并且 flags 
不 包含 O_CREAT， 这 说 明 想 打开 的 文件 不 存在 ， 并 不 是 想 创建 文件 ， 因 此 在 下 一 行 输出 报错 信息 ， 然 后 


关闭 目录 searched rec 

















ord.parent dir 并 返回 -1。 




















不 允许 同名 文件 存在 ， 


























第 340 行 判断 ， 若 找到 了 文件 并 且 flags 包含 O_CREAT， 这 说 明 想 创建 的 文件 名 已 存在 ， 相同 目录 下 


















































对 此 输出 报错 并 关闭 目录 ， 返 回 -1。 


经 过 重重 考验 之 后 , 终于 到 了 创建 文件 的 时 刻 , 第 346 的 switch 结构 根据 flags 中 是 否 包括 O_CREAT 
































的 情况 暂时 只 建立 了 O_CREAT 分 支 ， 即 目前 只 支持 sys_open(“xxx”,O_CREAT|IO XXX) 的 用 法 。 创 建文 
件 是 用 file_create 实现 的 ， 因 此 在 第 349 行 调用 file_create 创建 文件 ， 返 回 文件 描述 符 存 入 变量 得， 完成 


后 关闭 目录 searched record.parent dir， 并 返回 fd， 至 此 创建 文件 完成 。 
好 啦 ，sys_open 完成 了 ， 还 有 一 点 小 
把 这 部 分 代码 放 在 filesys_init 的 末尾 ， 如 











































































































尾巴 没有 介绍 ， 咱 们 还 没有 打开 根 目录 并 初始 化 文件 表 呢 ， 我 们 
代码 14-18 所 示 。 














代码 14-18 (project/c14/c/fs/fs.c ) 
… 略 
364 void filesys init() { 
415 /* 确定 默认 操作 的 分 区 */ 
416 char default part[8] = "sdbl"; 
417 /* 挂 载 分 区 */ 
418 list traversal(&partition list, mount partition, (int)default part); 
419 
420 /* 将 当前 分 区 的 根 目录 打开 */ 
421 open root dirl(cur part); 
422 
423 /* 初始 化 文件 表 */ 
424 uint32 t fq idx = 0; 
425 while (fd idx < MAX FILE OPEN) { 
426 file tablel[fd idx++] .fd inode = NULL; 
427 } 
428 } 


























代码 第 421 行 以 下 的 内 容 是 本 节 新 增 的 内 容 ， 包 括 调用 open root dir 打开 根 目 录 和 初始 化 文件 表 ， 


使 文件 结构 中 的 fd_inode 置 为 NULL， 表 示 该 文件 结构 为 空位 ， 可 分 本 
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到 这 本 节 也 就 结束 了 ， 下 节 咀 们 功能 验证 。 











CU 


o 


14.5.3 在 文件 系统 上 创建 第 1 个 文件 
本 节 是 功能 测试 ， 检 测 sys_open 创建 文 从 


代码 14-19 








略 


“ODO 
18 int main(void) { 





F 的 功能 ， 在 main.c 














调 月 





月 ， 见 代码 14-19。 





FP 加 入 


( project/c14/c/kernel/main.c ) 





























































































































































































































19 put str("I am kernel\n"); 
20 init all(); 
之 1 process execute(u prog a, "u prog a"); 
22 process execute(u prog b, "“u prog b"); 
之 3 thread start ("k thread a", 31, k thread a, "I am thread a"); 
24 thread start ("k thread b", 31, k thread b, "I am thread b") ; 
A sys_open("/filel", O CREAT); 
26 while(1); 
27 return 0; 
28 才 
… 略 
代码 就 这 些 ， 在 第 25 行 加 入 可 : . sys_open("/filel", O_ CREAT) 0 Bochs x86 emulator, http://boc 
在 根 目 录 下 创建 文件 file1。 目 前 我 们 只 有 根 目 录 这 一 个 目录 ， 因 此 
只 能 把 文件 创建 在 它 之 下 ， 待 以 后 完成 创建 目录 的 功能 后 咱们 再 自 
| 发 挥 吧 。 
在 创建 文件 之 前 ， 咀 们 先 看 下 文件 被 创建 在 哪里 ， 一 会 方便 明 mtnnnfEerioearoniT 人 和 
们 验证 ， 如 图 14-18 所 示 。 rt 
图 中 用 下 画 线 标识 的 是 数据 区 起 始 扇 区 地 址 和 根 目录 起 始 扇 区 
地 址 ， 它 们 应 该 是 相同 的 ， 毕 竟 根 目录 也 属于 数据 区 的 范围 ， 只 是 
根 目录 占据 的 空间 是 数据 区 最 开始 的 扇 区 。 根 目录 扇 区 地 址 是 十 六 


























进 制 0x2aa， 我 们 将 其 换算 成 十 进 
却 本 查看 hd80M.img， 过 程 如 
您 看 ，0x2aa 是 扇 区 ， 将 





制 的 字 节 表示 后 ， 再 
图 14-19 所 示 。 
乘 以 $12 后 ， 十 进 币 
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通过 xxd.sh 


1 结果 是 349184， 


formatting sdb s partition sdb5...... 


































































































































































































接着 调用 xxd.sh 查看 hd80Mimg 偏 移 349184 字 节 处 的 512 字 节 的 
内 容 。 目 录 中 的 内 容 是 目录 项 ， 每 个 目录 项 包括 三 部 分 的 内 容 : 16 
字 节 的 文件 名 filename，4 字 节 的 inode 编号 i_no，4 字 节 的 文件 类 型 f type， 即 目录 项 总 大 小 是 24 字 节 。 
如 图 所 示 ， 目 前 根 目 录 中 就 两 个 目录 项 ， 分 别 用 粗 线 和 细 线 分 别 标 出 。 
[workeLocathost c]$ sh ~/tool/calculator.sh Ox2aa*512 d 各 个 目 录 中 都 有 2 和 1" 它们 分 别 表 示 当 前 目 录 和 
fnori@l ocalhost <]s sh ~/tool /ocd.sh ~/ry.workspace/bochs/hdB0M. ing 349184 512 上 级 直接 父 目录 。 根 目录 是 所 有 目录 的 父 目录 ,没有 
: 2E 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ， os 
的 的 的 的 到 的 的 的 站 下 的 的 0 的 00 的 上 级 了 ， 因 此 对 根 目录 中 的 '. 做 了 特殊 处 理 ， 使 其 指 
向 根 目 录 自 身 。 
第 一 个 目录 项 是 偏 移 字 节 0x55400 字 节 处 的 连续 
^ 图 14-19 根 目录 中 的 内 容 24 字 节 ， 其 中 低 16 字 节 中 除 最 低 处 是 0x2e， 其 他 都 
是 0， 这 16 字 节 是 目录 项 中 的 文件 名 flename，0x2e 是 字符 ' 的 ASCII 码 。 第 二 段 粗 线 是 中 间 的 4 字 节 ， 
这 是 inode 编号 i no， 其 值 为 0， 这 表示 '… 的 inode 编号 就 是 根 目录 的 inode 编号 0。 第 三 段 粗 线 是 目录 项 










































































的 最 后 4 字 节 ， 这 是 文件 类 型 f type， 其 值 为 2， 表 示 '" 是 目录 类 型 FT DIRECTORY， 以 上 就 是 我 们 熟悉 
的 目录 中 的 文件 “.” 的 目录 项 。 后面 细 线 标 出 的 是 第 二 个 目录 项 ,您 也 许 猪 到 了 ， 这 是 ”..” 的 目录 项 内 容 ， 























前 16 字 节 表示 filename 是 ”.”， 第 二 段 细 线 表示 i_no， 其 值 为 0， 这 说 
明 一 下 ， 在 图 14-19 中 右边 的 显示 区 是 用 
， 每 个 .都 与 左边 的 1 个 字 节 对 应 ， 











最 后 一 段 细 线 表示 ”..” 是 目录 。 男 外 说 
的 字 节 无 法 按照 ASCII 码 解析 成 可 见 字 符 ， 就 会 用 '. 来 代 











法 








明 ”.” 是 指向 根 目 录 的 inode 编号 0， 
来 显示 字符 的 ， 如 果 左 边 
对 此 每 行 

































































共 16 个 ''。 而 实际 上 我 们 的 两 个 目录 名 '…" 和 '… 正 巧 和 表示 不 可 


人 














见 字符 的 "重合 了 , 因此 似乎 在 右边 显示 区 中 





看 不 到 文件 名 ， 其 实 是 有 的 ， 一 会 后 面 我 们 创建 flel 后 会 验证 。 
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建文 件 。 下 




















邓 [ 





目前 根 


就 只 有 目录 .和 '…， 





























下 我 们 运行 程序 , 用 














1 


了 “creating file”， 人 至 少 我 们 知道 程 请 
录 的 内 容 ， 如 
图 中 偏 移 0x55430 的 地 方 是 第 三 个 文件 
我 们 j 最 粗 的 线 标 出 了 ， 
右边 的 显示 





字 节 是 i no， 其 值 为 1， 


紧 跟 录 之 后 的 inode， 最 后 一 段 是 f type， 其 





生根 目录 下 创 轩 


建文 件 flel1， 过 程 如 图 14 
为 了 使 创建 文件 不 那么 低调 ， 这 里 





























这 说 明 根 




















“sys_open("/filel", O_ CREAT)” 
-20 所 示 。 
生 sys_open 函数 中 打印 












































图 14-21 所 示 。 

















己 经 用 














| 


字符 串 








又 中 已 经 显示 了 filel 

















根 





























说 明 是 普通 文件 FT REGULAR。 


次 程序 看 看 ， 














由 于 此 














， 它 分 








作 。 下 面 再 





前 两 类 线 是 ,…、'…" 和 目录 项 。 
别 对 应 ASCII 
码 0x66，0x69，0x6c，0x65 和 0x31。 以 0x55440 开始 的 4 
这 说 明 filel 的 inode 编号 是 1， 是 


看 下 根 目 





F filel 的 目录 项 ， 


在 





值 为 1， 











时 根 目录 中 已经 


果 如 


存在 了 filel 
14-22 所 示 。 





























[work@localhost c]$ sh ~/tool/xxd.sh 


; 算 


中 最 下 行 已 经 打印 了 “/filel has already exist! ”， 


同名 文件 ， 


好 啦 ， 


00 00 00 00 00 00 00 


00 
00 
00 
00 














， 下 由 














录 下 尚未 创 


[9 EE 


: 163296 
Y: ?9MB 


info 
:9Ox3F ， 
:9x?E3F ， 
:9xC51F ， 
:Ox127?8F, 
:OQx1629F, 
:9x1D8BF ， 


all partition 
sdb1 start_lba 
sdb5 start_lba 
sdb6 start_lba 
sdb? start_lba 
sdb8 start_lba 
sdb9 start_lba 
ide_init done 


ilesystem 

lesystem 

lesystem 

filesystem 

as filesystem 

has filesystem 
ount sdbl done! 

prog_a malloc addr: 

prog_b malloc addr :0 

thread a malloc ad 


sec_cnt:Qx?DC1 

sec_cnt :Ox46A1 
sec_cnt :OQx6231 
sec_cnt :OQx3AD1 
sec_cnt :OQx?5E1 
sec_cnt:QxAS21 


thread_b malloc addr:QxC01393QC, ,CO13940C, C913956C 


-reating file 





CTRL + 3rd button enables mouse 


14-20 





医 














创建 文件 file1 


“SECTO 


: 163296 


CAPACITY: 


?9MB 


all partition info 


sdb1 
sdb5 
sdb6 
sdb? 
sdb8 


start_lba 


start_lba:0 
start_lba: 
start_lba: 
start_lba: 


:Ox3F, 


E3F, 
OxC51F ， 
Ox12z78F ， 
Ox162Z9F ， 





14-—21 











根 


























功能 符合 预期 。 











sdb9 
ide_init 


start_lba: 
done 


s filesystem 

s filesystem 

filesystem 

lsdb9 has filesystem 
ount sdb1 done! 


thread_b malloc addr :0 
filel has already exist? 


CTRL + 3rd button enables mouse 





Ox1D8BF ， 





sec_cnt: OX?DC1 


sec _cnt: Ox3hD1 
sec_cnt:Qx?5E1 
sec_cnt:Oxh521 


prog_a malloc addr :0x804806C ,9x804810C ,9x804820C 
prog_b malloc addr :0x804806C ,9x804810C ,9x8048209C 
thread_a malloc addr :9xC9139009C ,C013910C ,C013920C 
913936C,C913946C,C913956C 





| 
创建 同名 的 文件 





到 14-22 无 法 





A 


























目前 检测 暂时 通过 了 ， 本 节 




















到 这 也 


文件 的 打开 与 关闭 





因为 有 


术 符 - 





述 符 之 后 。 


使 其 支持 更 多 
文件 的 打开 


现在 我 们 
是 file_open 完成 的 ， 它 定义 在 file.c 中 。 


1 





4.6.1 














| 











关 读 写 的 函数 都 要 用 文件 




















尽管 上 节 中 我 们 通过 sys_ope 














的 功 和 要 单独 编 


述 符 作为 参数 , 所 以 文件 
n 实现 了 文件 创建 的 功能 , 但 这 


TT 





写 关 闭 文人 





能 之 外 ， 




















已 经 在 根 
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就 结束 了 ， 兄 弟 们 休 妃 下 ， 下 节 再 


明 根 目录 下 已 存在 乌 el1， 同 一 目 











录 下 无 法 








战 。 

















rs 


A 日 


有 丰 在 文件 被 打开 返 ] 


I 























远 不 够 ， 





的 代码 ， 出 发 唉 。 



































除了 我 们 要 改进 sys_open 

















录 下 创建 了 文件 filel, 接 下 来 可 以 编 
不 耽误 各 位 客 官 的 时 间 了 ， 























写 文件 打开 的 代码 了 , 打开 文件 
上 荣 ， 见 代码 14-20。 





的 核心 操作 








代码 14-20 (projectc14/d/fs/file.c ) 





185 /* 打 开 编 号 为 ijnode_no 的 inode 对 应 的 文件 ， 
若 成 功 则 返回 文件 描述 符 ， 否 则 返回 -1 */ 
186 int32 t file open(uint32 t inode no, uint8 t flag) { 


























































































































































































































9 int fd idx = get free slot in global (); 
188 if (fd idx == -1) { 
189 printk ("exceed max open files\n"); 
190 return -1; 
E91 } 
92 file table[fdqd idqx]l .fd inode = inode open(cur part, inode no); 
193 file table[fdq idx] .fd pos = 0; 
// 每 次 打开 文件 ， 要 将 fd_pos 还 原 为 0， 即 让 文件 内 的 指针 指向 开头 
194 file table[fd idx] .fd flag = flag; 
95 bool* write deny = &file tablel[fd idx] .fd inode->write deny; 
196 
197 if (flag & O WRONLY || flag & O RDWR) { 
// 只 要 是 关于 写 文 件 ， 判 断 是 否 有 其 他 进程 正 写 此 文件 
198 // 若是 读 文件 ， 不 考虑 write_qeny 
199 /* 以 下 进入 临界 区 前 先 关中 断 */ 
200 enum intr status old status = intr disable(); 
201 if (!(*write deny)) // 若 当 前 没有 其 他 进程 写 该 文件 ， 将 其 占 
202 *write deny = true; // 置 为 true， 和 避免 多 个 进程 同时 写 此 文件 
203 intr set status (old status); // 恢复 中 断 
204 } else { // 直接 失败 返 下 
205 intr set status (old status); 
206 printk ("file can’t be write now try again later\n"); 
207 Freturil 一 下 区 
208 } 
209 } // 若是 读 文 件 或 创建 文件 ， 不 用 理会 write_deny， 保 持 默 认 
210 return pcb fdq install (fd idx); 
习 汪 六 站 
22 




















file open 接受 2 个 参数 ，inode 编号 inode no 和 打开 标识 fag， 函 数 功能 是 打开 编号 为 inode_no 的 inode 
对 应 的 文件 ， 若 成 功 则 返回 文件 描述 符 ， 否 则 返回 -1。 
函数 开头 调用 get free_ slot in global 从 文件 表 file_table 中 获取 空位 的 下 标 ， 接 着 在 第 192 一 194 行 初始 化 。 
第 195 使 变量 write_ deny 指向 该 node 的 write_ deny 位 ， 下 面 进 行 判断 和 处 理 。 第 197 行 ， 如 果 此 次 以 写 
文件 的 方式 打开 文件 ， 也 就 是 fag 中 包含 O_WRONLY (只 写 ) 或 O RDWR ( 读 和 写 )， 为 了 避免 多 个 任务 同 
时 写 该 文件 而 引起 相互 覆盖 的 混乱 ， 第 201 行 对 指针 write_deny 取 值 ， 判 断 是 否 为 tue， 检 查 是 否 已 有 别 的 但 
务 正在 写 该 文件 ， 如 果 为 false， 在 第 202 行将 其 置 为 tue， 表 示 本 任务 要 对 其 执行 写 操作 ， 否 则 就 简单 处 理 ， 
输出 提示 信息 “file can't be write now, try again later”， 也 就 是 目前 文件 不 能 写 入 ， 一 会 再 试 。 然 后 返回 -1。 
如 果 flag 是 O RDONLY 读 文 件 或 O_ CREAT 创建 文件 ， 就 不 用 理会 write_deny 的 值 了 ， 我 们 允许 写 
牛 时 对 其 执行 读 操作 。 
最 后 第 210 行将 fd_idx 安装 到 fd_table 并 返回 结果 ， 大 成 功 则 返回 文件 描述 符 ， 否 则 返回 -1。 
下 面 我 们 改进 sys_open， 见 代码 14-21 。 


代码 14-21 (project/c14/d/fs/fs.c ) 
























































a 
































HH 














































































































一 、 





文 




















































































































… 略 

297 /* 打开 或 创建 文件 成 功 后 ， 返 回 pcb 中 fq_table 中 的 下 标 ， 否 则 返回 -1 */ 

用 int32 t sys open(const char* pathname, uint8 t flag) { 

… 妖 

346 switch (flags & O CREAT) { 

347 case O_ CRERAT : 

348 printk ("creating fileNxn") 

349 fd = file create(searched record.parent dir, \ 
(strrchr (pathname, '/') + 1), flag); 

350 dir close(searched record.parent dir); 

354 break; 

352 default: 

353 /* 其 余 情况 均 为 打开 已 存在 文件 

354 * O RDONLY,O WRONLY,O RDWR */ 

355 fd = file openl(inode no, flags); 
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这 里 只 修改 对 flag 判断 的 switch 结构 ， 在 第 352 一 355 行 增加 了 其 他 标识 的 支持 ， 即 O RDONLY、 




















O_WRONLY 和 O_RDWR 默认 都 由 函数 他 e_open 处 理 。 
好 啦 ， 有 关 文 件 打 开 的 部 分 就 介绍 完了 。 
14.6.2 文件 的 关闭 


文件 有 打开 就 得 有 关闭 ，Linux 中 文件 关闭 是 close 函数 ， 当 然 还 有 其 他 函数 ， 我 人 
close 函数 的 功能 。 



































] 只 打算 实现 类 似 








close 函数 原型 是 “int close(int fd)”， 关闭 成 功 则 返回 0， 否 
件 的 核心 操作 是 包 e_ close， 见 代码 14-22。 


代码 14-22 (project/c14/d/fs/file.c ) 





污 


























… 略 

213 /* 关闭 文件 */ 

214 int32 七 file close(struct file* file) { 
之 1 9 if (file == NULL) { 

216 return -1; 

217 } 

218 file->fd inode->write deny = false; 
219 inode close (file->fd inode); 

220 file->fd inode = NULL;  // 使 文件 结构 可 
221 return 0; 

222 } 

… 略 














file_close 接受 1 个 参数 ， 文 件 le， 功能 是 关闭 文件 ， 成 功 则 返回 0， 否则 返回 -1。 



































则 返回 -1 o 咱们 的 实现 非 党 简单 ， 关 闭 文 











为 了 兼容 close 的 接口 ， 咱 们 的 实现 比较 简单 ，file_close 唯一 失败 返回 的 情况 就 是 file 为 null。 其 余 的 代 





























码 就 是 恢复 inode 的 状态 ， 不 多 说 了 ， 下 面 看 sys_close 的 实现 ， 见 代码 14-23。 


代码 14-23 (project/c14/d/fs/fs.c ) 








… 略 
363 /* 将 文件 描述 符 转化 为 文件 表 的 下 标 */ 
364 static uint32 t fd local2global (uint32 t local fd) { 
























































365 struct task struct* cur = running thread(); 

366 int32 t global fd = cur->fd table[local fd]; 

367 ASSERT (global fd >= 0 && global fd < MAX FILE OPEN); 
368 return (uint32 t)global fqd; 

369 } 

370 

371 /* 关闭 文件 描述 符 fq 指向 的 文件 ， 成 功 返回 0， 否 则 返回 -1 */ 
372 int32 t sys close(int32 t fdq) { 

373 int32 t ret = -1l;  // 返回 值 默 认为 -1, 即 失败 

374 (EE 2 

S75 Uint32 tt. .fd "fd local2globalt(fd); 

376 ret = file close(&file tablel[ fd]); 

377 running thread()->fq table[fd] = -1; // 使 该 文件 描述 符 位 可 
378 } 

379 return ret; 

380 } 

… 略 














这 里 列 出 了 两 个 函数 ，fd_local2global 和 sys_close。 











fa local2global 是 sys_close 所 依赖 的 函数 ， 它 接受 1 个 参数 ， 文 件 描述 符 local 人 包 ， 功 能 是 将 文件 描述 符 转 






































化 为 文件 表 的 下 标 。 原 理 就 是 将 local 和 作为 下 标 代入 数组 他 table，fd_table [local 各] 的 值 便 是 文件 表 的 下 标 。 
函数 sys_close 接受 1 个 参数 ， 文 件 描述 符 人， 功能 是 关闭 文件 描述 符 弓 指向 的 文件 ， 成 功 返 回 0， 










































































否则 返回 -1。 第 375 行 ， 通过 “fd_local2global(fd)” 获 取 file_table 的 下 标 ， 存 入 变量 fd， 然 后 用 _fd 索引 








文件 表 中 的 相应 文件 结构 ， 在 下 一 行 把 文件 结构 的 指针 作为 参数 调用 fle_close 关闭 文 伯 
件 描 述 符 置 为 -1， 使 其 为 空 可 分 配 。 
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F。 然 后 把 本 地 文 





关闭 文件 的 代码 就 这 样 精简 ， 没 啦 。 下 面 测试 下 文件 打开 与 关闭 的 功能 ， 还 是 老 样子 ， 在 main.c 中 
添加 测试 代码 ， 如 代码 14-24 所 示 。 


代码 14-24 (project/c14/d/kernel/main.c ) 
































… 略 

18 int main(void) { 

19 put str("I am kernel\n"); 

20 LL,()y 

21 process execute(u prog a, "u prog a"); 

2 之 process execute(u prog b, "u prog b") ; 

23 thread start ("k thread a", 31, k thread a, "I am thread a"); 
24 thread start ("k thread b", 31, k thread b, "I am thread b");，;} 
25 

26 uint32 七 fd = sys open("/filel", O RDONLY); 

27 printf (vfd:%Sd\n"; fd)s 

28 sys_close (fd) ; 

29 printf("%d closed now\n", fqd); 

30 while(1); 

号 return 0; 

32 } 

… 略 


ES 
沿 
了 





第 26 一 29 行 是 测试 代码 ， 第 26 行将 “/filel1 ”打开 ， 输 的 文件 描述 符 后 ， 接 着 在 第 28 行将 其 


关闭 ， 我 们 看 下 运行 结果 吧 ， 如 图 14-23 所 示 。 














all partition info 
sdb1 start_lba:Qx3F, sec_cnt:Qx?DC1 
sdb5 start_lba :OQx?E3F, c_cnt :9Ox46h1 
sdb6 start_lba:QxC51F, sec_cnt:Qx6231 
sdb? start_lba:Ox1l278F sec_cnt:Qx3AD1 
sdb8 start_lba:Qx1629F, sec_cnt:Qx?5E1 
sdb9 start_lba:Qx1iD8BF, sec_cnt :Oxh521 
ide_init done 


Ustem 


has filesystem 

has filesystem 

has filesystem 
ount sdb1 donet 


prog_a malloc addr :0x804800C ,0x8048106C ,9x894826C 
prog_b malloc addr :9x804806C ,9x8904816C ,9x894826C 
thread_a malloc addr :9xC9139600C ,C913916C ,C9139206C 
thread_b malloc addr :9xC9139369C,C913946C ,C913956C 
Ed:3 
B closed now 





IPS: 25.429H | | | | | | 


14-23 ”文件 打开 与 关闭 





p 
讨 




















图 中 最 后 两 行 输出 了 “fd:3” 和 “3 closed now”， 初 步 符 合 预期 ， 因 此 本 节 画 上 了 人 句号。 


实现 文件 写 入 


本 节 要 实现 的 sys_write 是 系统 调用 write 的 内 核实 现 ， 咱 们 之 前 的 write 是 个 简易 版 ， 它 是 为 了 临时 
完成 输出 打印 的 功能 ， 不 支持 文件 描述 符 。 如 今 要 让 write 支持 文件 描述 符 的 话 ， 还 要 修改 下 周边 与 此 系 
统 调用 相关 的 内 容 。 
























































14.7.1 实现 file_write 

想必 您 已 经 了 解 了 我 们 实现 文件 系统 功能 的 “套路 ”， 基 本 上 都 是 在 旭 le.c 中 添加 “file_ xxx” 的 核心 
功能 ,然后 在 fs.c 中 添加 其 外 壳 ， 好 吧 ， 走 起 ， 先 实现 file_write， 代 码 很 长 ， 由 于 这 只 是 一 个 函数 的 内 容 ， 
未 拆 分 成 多 个 部 分 ， 见 代码 14-25 。 









































643 


代码 14-25 (project/c14/e/fs/file.c ) 


224 /* 把 buf 中 的 count 个 字 节 写 入 file， 
成 功 则 返回 写 入 的 字 节 数 ， 失 败 则 返回 -1 */ 
225 int32 t file write(struct file* file const void*buf, uint32 七 count) { 

























































































































































































































































































































































































































































































226 if ((file->fd inode->i size + count) > (BLOCK SIZE * 140)) { 
// 文件 目前 最 大 只 支持 512*140=71680 字 节 
2.2°7 printk ("exceed max file size 71680 bytes, write file failed\n"); 
228 return -1; 
229 } 
230 uint8 t* io buf = sys malloc (512); 
231 if (io buf == NULL) { 
232 printk ("file write: sys malloc for io buf failed\n"); 
233 return -1; 
234 } 
235 uint32 t* all blocks = (uint32 t*)sys malloc(BLOCK SIZE + 48); 
// 用 来 记录 文件 所 有 的 块 地 址 
236 If (all blocks == NULL) { 
237 printk ("file write: sys malloc for all blocks failed\n"); 
238 return -1; 
239 
240 
241 const uint8 t* src = buf; // src 指向 buf 中 待 写 入 的 数据 
242 uint32 t bytes written = 0; // 用 来 记录 已 写 入 数据 大 小 
243 uint32 t size _ left = count; // 用 来 记录 未 写 入 数据 大 小 
244 int32 t block lba = -1; // 块 地 址 
245 uint32 t block bitmap idx = 0; 
// 用 来 记录 block 对 应 于 block_bitmap 中 的 索引 ， 作 为 参数 传 给 bitmap_sync 
246 uint32 t sec idx; // 用 来 索引 扇 区 
247 uint32 t sec lba; // 扇 区 地 址 
248 uint32 t sec off bytes; // 扇 区 内 字 节 偏 移 量 
249 uint32 t sec left bytes; // 扇 区 内 剩余 字 节 
250 uint32 t chunk size; // 每 次 写 入 硬盘 的 数据 块 大 小 
251 int32 t indirect block table; // 用 来 获取 一 级 间接 表 地 址 
252 uint32 t block idx; // 块 索引 
253 
254 /* 判断 文件 是 否 是 第 一 次 写 ， 如 果 是 ， 先 为 其 分 配 一 个 块 */ 
去 二 上 if (file->fd inode->i sectors [0] == 0) { 
256 block lba = block bitmap alloc(cur part); 
257 if (block lba == -1) { 
258 printk ("file write: block bitmap alloc failed\n") 
2.5:9 return -1; 
260 } 
261 file->fd inode->i sectors[0] = block lba; 
262 
263 /* 每 分 配 一 个 块 就 将 位 图 同步 到 硬盘 */ 
264 block bitmap idx = block lba - cur part->sb->data start lba; 
265 ASSERT (block bitmap idx != 0); 
266 bitmap sync (cur part, block bitmap idx, BLOCK BITMAP); 
267 } 
268 
269 /* 写 入 count 个 字 节 前 ， 该 文件 已 经 的 块 数 */ 
270 uint32 t file has used blocks = file->fd inode->i size / BLOCK SIZE + 1; 
2371 
272 /* 存储 count 字 节 后 该 文件 将 占用 的 块 数 */ 
273 uint32 t file will use blocks =\ 
(file->fd inode->i size + count) / BLOCK SIZE + 1; 
274 ASSERT (file will use blocks <= 140);，; 
275 
276 /* 通过 此 增 量 判断 是 否 需要 分 配 房 多 ， 如 增 量 为 0， 表 示 原 扇 区 够 用 */ 
277 uint32 t adqd blocks = file will use blocks - file has used blocks; 
278 
279 作 将 写 文件 所 用 到 的 块 地 址 收集 到 al1 blocks， 系 统 中 块 大 小 等 于 扇 区 大 小 ， 
280 * 后 面 都 统一 在 al1 blocks 人 写 入 扇 区 地 址 */ 
281 if (add blocks == 0) 
282 A* 在 同一 房 区 内 写 入 数据 ， 不 涉及 到 分 配 新 记 区 xx 
283 if (file will use _ blocks <= 12 ) { // 文件 数据 量 将 在 12 块 之 内 
284 block idx = file has used blocks - 1; 
// 指向 最 后 一 个 已 有 数据 的 扇 区 
285 all blocks [block idx] = file->fd inode->i sectors [block idx]; 
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14.7 
} else { 
/* 未 写 入 新 数据 之 前 已 经 占用 了 间接 块 ， 需 要 将 间接 块 地 址 读 进来 */ 
ASSERT (file->fd inode->i sectors[12] != 0);，} 


indirect block table 
ide read(cur part->my disk, 
all blocks + 12， 


} 


} else { 





1); 


= file->fd inode->i sectors[12]; 





indirect block table, \ 








/* 若 有 增 量 ， 便 涉及 到 分 配 新 扇 区 及 是 否 分 配 一 级 间接 块 表 ， 





下 面 要 分 三 种 情况 处 理 























/* 第 一 种 情况 :12 
if 








个 直接 块 够 











多 








(file will use blocks 


<= 12 ) { 




















/* 先 将 有 剩余 空间 的 可 继续 用 的 


block idx = 














扇 区 地 址 写 入 all blocks */ 





all blocks [block idx] 























/* 再 将 未 来 











block idx = 


while 
DLOC 
3 


2* 本 区 件 时 ， 
当 文 件 删除 时 ， 





(block lba 
printk ("file write: 


ASSERT (file-— 
// 确保 尚未 分 配 房 区 地 址 














k lba = 








for situation 
return -1; 


file has used blocks -— 1; 
ASSERT (file->fd inode->i sectors [block idx] 


!= 0); 
= file->fd inode->i sectors[block idx]; 


的 扇 区 分 配 好 后 写 入 all blocks */ 
file has used blocks; 
(block idx < file will use blocks) { 
block bitmap alloc(cur part); 
二 出 ) 寺 








// 指向 第 一 个 要 分 配 的 新 扇 区 





block bitmap alloc 
1 failed\n"); 











不 应 该 存在 块 未 使 
就 会 把 块 地 址 清 0 











>fd inode->i sectorsl[block idx] == 











但 已 经 分 配 扇 区 的 情况 ， 











*/ 
0); 


file->fd inode->i sectors[block idx] = \ 


all blocks[block idx] = 








/* 





性 分 配 一 个 块 就 将 位 医 





bloc 


bitmap sync (cur part, 


bloc 


} 


block lba; 





同步 到 硬盘 */ 








k bitmap idx = 





k idxt++; 


// 下 


block lba - cur part->sb->data start lba; 
block bitmap idx, BLOCK BITMAP); 








一 个 分 配 的 新 扇 区 





} else if (file has used blocks <= 12 && file will use blocks > 12) { 


/* 第 二 种 情况 : 旧 


数据 在 12 个 























直接 块 内 ， 新 数据 将 人 








间接 块 */ 











/* 





// 指向 旧 数 据 所 在 的 最 后 一 个 扇 区 


先 将 有 剩余 空间 的 
block idx = 





继续 用 的 




















扇 区 地 址 收集 到 all blocks */ 








file has used 


Eee Ld 二 光 











all blocks [block idx] 


/* 创建 一 级 间接 块 表 */ 





(block lba 





ST 


printk ("file writ 





situation 2 f 


return -1; 


block_ 
if 

for 
} 


ASSERT (file->fd inode->i sectors[12] 
// 确保 一 


级 间接 块 表 未 分 配 











= file->fd inode->i sectors [blLlock_ idx]; 


lba = block bitmap alloc(cur part); 


{ 
e: block bitmap alloc 
ailed\n"); 


= O00) 


/* 分 配 一 级 间接 块 索引 表 */ 


indirect block table = 


block idx = 

















// 第 


while 


block 


if 


个 未 








的 块 ， 即 本 


lba = 
(block lb 





printk ("file write: 


file->fd inode->i sectors[12] = block lba; 


file has used blocks; 


























已 经 使 用 的 








接 块 的 下 一 块 





文件 最 后 一 个 




















(block idx < file will use blocks) { 
block bitmap alloc(cur part); 


=1) 4 
block bitmap alloc 


for situation 2 failed\n"); 


return -1; 
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346 if (block EGR < IT2) 区 
// 新 创建 的 0 一 11 块 直接 存 入 all_blocks 数组 
347 ASSERT (file->fd inode->i sectors [block idx] == 0) ; 
// 确保 尚未 分 配 扇 区 地 址 
348 file->fd inode->i _ sectors [block idx] = \ 
all blocks[block idx] = block lba; 
349 } else { 
// 间接 块 只 写 入 到 all_block 数组 中 ， 待 全 部 分 配 完成 后 一 次 性 同步 到 硬盘 
350 all blocks [block idx] = block lba; 
S51 } 
352 
353 /* 每 分 配 一 个 块 就 将 位 图 同步 到 硬盘 */ 
354 block bitmap idx = block lba - cur part->sb->data start lba; 
355 bitmap sync (cur part, block bitmap idx, BLOCK BITMAP); 
356 
357 block idx++; ”// 下 一 个 新 扇 区 
358 } 
359 ide write(cur part->my disk, indirect block table, \ 
all blocks + 12，1); // 同步 一 级 间接 块 表 到 硬盘 
360 } else if (file has used blocks > 12) { 
361 /* 第 三 种 情况 :新 数据 占据 间接 块 */ 
362 ASSERT (file->fd inode->i sectors[12] != 0);，} 
// 已 经 具备 了 一 级 间接 块 表 
363 indirect block table = file->fd inode->i sectors[12]; 
// 获取 一 级 间接 表 地 址 
364 
365 /* 已 使 用 的 间接 块 也 将 被 读 入 all_blocks， 无 需 单 独 收 录 */ 
366 ide read(cur part->my disk, indirect block table, \ 
all blocks + 12，1);  // 获取 所 有 间接 块 地 址 
367 
368 block idx = file has used blocks; 
// 第 一 个 未 使 用 的 间接 块 ， 即 已 经 使 用 的 间接 块 的 下 一 块 
369 while (block idx < file will use blocks) { 
370 block lba = block bitmap alloc(cur part); 
3 if (block lba == -1) { 
372 printk ("file write: block bitmap alloc 
for situation 3 failed\n"); 
ST return -1; 
374 } 
有 证 人 all blocks[block idx++] = block lba; 
376 
377 /* 每 分 配 一 个 块 就 将 位 图 同步 到 硬盘 */ 
378 block bitmap idx = block lba - cur part->sb->data start lba; 
379 bitmap sync (cur part, block bitmap idx, BLOCK BITMAP); 
380 } 
381 ide write(cur part->my disk, indirect block table, \ 
all blocks + 12，1);  // 同步 一 级 间接 块 表 到 硬盘 
382 
383 } 
384 
385 /* 用 到 的 块 地 址 已 经 收集 到 all blocks 中 ， 下 面 开 始 写 数 据 */ 
386 bool first write block = true; // 含有 剩余 空间 的 块 标识 
387 file->fd pos = file->fd inode->i size 一 1; 
// 置 fd_pos 为 文件 大 小 -1， 下 面 在 写 数据 时 随时 更 新 
388 while (bytes written < count) 1 // 直到 写 完 所 有 数据 
389 memset (io buf, 0, BLOCK SIZE); 
390 sec idx = file->fd inode->i size / BLOCK SIZE; 
391 sec lba = all blocks[sec idx]; 
392 sec off bytes = file->fd inode->i size % BLOCK SIZE; 
393 sec left bytes = BLOCK SIZE - sec off bytes; 
394 
395 /* 判断 此 次 写 入 硬盘 的 数据 大 小 */ 
396 chunk size = size left < sec left bytes ? size left : sec left bytes; 
397 if (first write block) { 
398 ide read(cur part->my disk, sec lba, io buf, 1); 
399 first write block = false; 
400 } 
401 memcpy (io buf + sec off bytes, src, chunk size); 
402 ide writel(cur part->my disk, sec lba, io buf, 1); 
403 printk ("file write at lba Ox%x\n", sec lba); // 调试 ， 完 成 后 去 掉 
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404 

405 src += chunk_size;  // 将 指针 推移 到 下 个 新 数据 
406 file->fqd inode->i size += chunk size; // 更 新 文件 大 小 
407 file->fd pos += chunk size; 

408 bytes written += chunk size; 

409 size left -= chunk size; 

410 } 

411 inode sync(cur part, file->fd inode, io buf); 
412 Sys_free(all blocks); 

413 sys_free(io buf); 

414 return bytes written; 

415 } 








确实 好 长 , 小 两 百 行 。 整 个 代码 就 这 一 个 函数 fle_write, 它 接受 3 个 参数 , 文件 角 e、 数据 缓冲 区 buf、 
字 节 数 count， 功 能 是 把 buf 中 的 count 个 字 节 写 入 fle， 成 功 则 返回 写 入 的 字 节 数 ， 失 败 则 返回 -1。 

前 面 说 过 ， 为 实现 省 事 ， 这 里 的 块 大 小 就 是 扇 区 大 小 。 咱 们 的 文件 最 大 尺寸 是 140 个 块 ， 为 此 在 函数 
开头 便 判 断 新 加 的 数据 是 否 会 使 文件 超过 最 大 尺寸 , 如 果 超 过 了 140 个 块 的 大 小 , 即 BLOCK _SIZE * 140， 
程序 打印 提示 后 ， 返 回 -1， 其 中 宏 BLOCK SIZE 等 于 SECTOR_SIZE， 即 值 为 512。 

因为 后 面 我 们 的 磁盘 操作 都 以 1 个 扇 区 为 单位 ， 所 以 申请 了 5$12 字 节 的 缓冲 区 给 io_buf。 

为 写 硬盘 时 方便 获取 块 地 址 , 我 们 打算 把 文件 所 有 的 块 地 址 收集 到 all_blocks 中 统一 获取 , 为 此 第 235 
行 申请 了 BLOCK_SIZE + 48 大 小 的 内 容 ， 即 128 个 间接 块 +12 个 直接 块 的 大 小 。 

在 第 241 一 252 行 声明 了 一 些 变量 ， 其 意义 都 有 相关 注释 ， 后 面 可 以 结合 实际 去 理解 ， 不 解释 啦 。 

和 大 伙 儿 交待 下 , 文件 中 的 数据 是 个 整体 , 因此 是 顺序 、 连 续 写 入 块 中 的 , 并 且 是 从 最 低 块 i_sector[0] 
向 高 块 开始 写 ， 比 如 直接 块 0 写 满 后 再 写 入 直接 块 1， 写 完 直 接 块 后 再 写 第 0 个 间接 块 ， 直 到 第 127 个 间 
接 块 ， 数 据 从 前 往 后 写 ， 后 面 的 块 都 是 空白 的 ， 在 文件 中 也 不 会 出 现 空洞 、 里 块 的 情况 ， 这 和 目录 是 不 同 
的 ， 目 录 中 的 目录 项 是 单独 的 个 体 ， 它 们 可 以 分 散在 不 同 的 块 中 。 
文件 第 一 次 写 入 数据 时 要 为 其 分 配 块 地 址 ， 若 未 分 配 块 地 址 的 话 ， 块 地 址 则 为 0， 这 是 之 前 调用 
inode_init 为 其 初始 化 时 提前 安排 的 。 第 255$ 一 267 行 便 判 断 文件 是 否 是 第 一 次 写 数据 ， 如 果 是 就 通过 
block bitmap _alloc 分 配 扇 区 ， 地 址 写 入 文件 的 isectors[0]， 然 后 将 位 图 同步 到 硬盘 。 

下 面 判断 文件 是 否 要 为 这 count 个 字 节 分 配 新 块 ， 也 就 是 现 有 的 扇 区 是 否 够 用 。 变 量 file has_ 
used_blocks 是 文件 目前 使 用 的 块 数 ， 也 就 是 未 写 入 count 个 字 节 前 文件 占用 的 块 数 ， 变 量 file_will_use_blocks 
是 存储 count 字 节 后 该 文件 将 占用 的 块 数 。 变 量 add_ blocks 是 需要 为 count 个 字 节 数据 分 配 的 扇 区 数 。 

接 下 来 第 281 一 383 行 是 把 文件 现在 使 用 及 未 来 使 用 的 块 地 址 收集 到 all_blocks 中 (不 包括 那些 不 参与 
写 入 操作 的 块 地 址 )， 与 数据 写 入 无 关 。 收 集 工作 完成 之 后 ，all_block 中 包括 原 块 地 址 及 新 数据 占用 的 块 
地 址 ， 在 这 之 后 我 们 才 进 行 数据 写 入 工作 。 

第 281 行 判 断 ， 如 果 add_blocks 为 0， 这 说 明 count 值 小 于 等 于 原 有 扇 区 中 的 剩余 空间 ， 剩 余 空间 便 可 容 
纳 count 个 字 节 数 据 ， 无 需 再 申请 新 的 块 。 接 着 第 283 一 286 行 判断 原 有 块 地 址 是 否 为 直接 块 ， 第 287 一 291 行 
判断 原 有 块 地 址 是 否 是 间接 块 ， 无 论 是 直接 块 ， 还 是 间接 块 ， 文 件 的 现 有 块 地 址 都 将 收录 到 all_blocks 中 。 
第 292 行 是 处 理 需 要 分 配 新 数据 块 的 情况 ， 下 面 分 三 种 情况 讨论 。 

(1) 若 已 经 使 用 的 扇 区 数 在 12 块 之 内 ， 新 增 了 若干 块 后 ， 文 件 大 小 还 在 12 块 之 内 ， 直 接 分 配 所 需 的 
块 并 把 块 地 址 写 入 i_sectors 数组 中 即 可 。 
(2) 若 已 经 使 用 的 块 数 在 12 块 之 内 ， 新 增 了 若干 块 后 ， 文 件 大 小 超过 了 12 块 ， 这 种 情况 下 所 申请 的 
块 除 了 要 写 入 i_sector 数组 ， 还 要 创建 一 级 间接 块 表 并 写 入 块 地 址 。 

(3) 若 已 经 使 用 的 扇 区 数 超过 了 12 块 ， 这 种 情况 下 要 在 一 级 间接 块 表 中 创建 间接 块 项 ， 间 接 块 项 就 
是 在 一 级 间接 块 表 中 记录 间接 块 地 址 的 条 目 ， 姑 且 这 么 叫 吧 。 

以 上 三 种 情况 所 申请 的 块 地 址 都 要 收录 到 all blocks 中 。 

第 295 一 320 行 是 处 理 第 一 种 情况 : 新 分 配 的 块 也 属于 直接 块 的 情况 。 这 分 为 两 步 ， 第 1 步 是 先 在 第 
297 一 299 行 , 将 原 有 局 区 中 包含 剩余 空间 的 (可 继续 用 的 ) 块 地 址 收录 到 all_blocks。 第 2 步 是 在 第 302 一 
319 行 ， 再 将 未 来 要 用 的 扇 区 分 配 好 并 写 入 all_blocks。 
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359 行将 所 有 的 间接 块 地 址 同步 到 硬盘 上 的 一 级 间接 块 索 引 表 : 























第 320 一 360 行 是 处 理 第 二 种 情况 : 旧 数 据 在 12 个 直接 块 内 ， 新 数据 将 使 
在 第 324 一 325 行将 原 有 扇 区 中 包含 剩余 空间 的 块 地 址 收录 到 all blocks。 然 后 在 第 328 一 336 行 分 配 一 个 
块 作为 一 级 间接 块 索引 表 。 最 后 在 第 338 一 358 行将 未 来 要 | 的 二 分 配 好 并 收录 到 all blocks 中 。 接着 在 委 




















代码 第 360 一 383 行 处 理 第 三 种 情况 : 新 老 数据 都 在 间接 块 中 。 与 前 两 种 情况 不 




















含 莘 
























































块 地 址 ， 包 括 新 分 配 的 间接 块 地 址 一 同 写 入 硬盘 上 的 一 级 间接 块 索引 表 : 


















































地 址 。 下 面 是 开始 接着 在 含有 剩余 空间 的 块 写 入 新 数据 。 









































通常 情况 下 该 块 中 都 有 些 数据 ， 最 新 的 数据 要 从 接着 该 块 的 空闲 空间 接着 写 。 



































同 的 是 已 使 用 的 、 





吏 用 间接 块 。 这 分 为 三 步 ， 先 
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包 
余 空间 的 间接 块 都 在 一 级 间接 决 察 引 表 中 ， 忆 此 只 要 将 此 表 读 到 all blocks 中 便 获取 所 有 间接 块 地 
址 , 无需 单独 收录 。 第 368 一 380 行 开 始 分 配 间接 块 并 收录 到 all blocks 中 。 最 后 在 和 楼 





到 目前 为 止 ，all_blocks 中 包含 可 继续 使 用 的 、 含 有 剩余 空 z 间 的 块 地 址 ， 以 及 新 数据 要 占用 的 新 的 块 


第 386 行 的 变量 first_ write block 用 于 标识 本 次 写 入 操作 中 第 一 个 所 写 入 的 块 , 除 第 一 次 写 入 数据 外 ， 
因此 在 第 一 











区 381 行将 所 有 间 # 









































次 写 数 据 时 ， 要 
































将 该 块 中 的 数据 读 出 来 ,将 新 数据 写 入 该 块 中 空 亲 区域 ， 之 后 再 新 老 数据 一 同 写 入 硬 稳 ， 这 样 就 保护 好 了 











老 数据 ， 并 且 实 现 了 数据 追加 的 功能 。 















































第 388 行 开 始 循环 写 入 数据 ， 变 量 bytes_written 记录 已 写 入 的 数据 量 大 小 ， 
到 bytes_written 等 于 count 时 结束 ， Ee 写 完 为 止 。 循 环 体 中 最 先 执 行 的 是 
































是 要 往 文件 数据 块 写 入 数据 的 缓冲 区 ， 必 须要 保证 干净 。 











它 已 被 初始 为 0， 循环 直 


memset 清空 io_buf，io_buf 





























第 390 行 的 sec_idx we 块 索引 ， 也 就 是 扇 区 索引 信 



































获得 























六 坷 





在 下 一 行将 它 代 入 all_blocks 








区 地 址 sec_lba。sec_o 人 f bytes 是 数据 在 最 后 一 个 块 中 的 偏 移 量 ，sec_left_bytes 是 块 中 的 可 用 字 节 空间 。 











第 396 行 的 chunk size 是 本 次 写 入 扇 区 的 数据 量 ，size_left 表示 剩 下 未 写 入 硬盘 的 数据 量 ， 当 size_left 





小 于 本 次 所 写 入 块 的 剩余 空间 时 ，chunk size 就 等 于 size_ leftf， 这 属于 剩余 的 数据 不 足 一 个 块 ， 往 最 后 一 个 块 









































中 写 剩余 数据 时 的 情况 ， 如 果 size left 大 于 等 于 sec left bytes， 那 就 把 剩 下 的 空 
于 sec left bytes。 




















g 闲 空间 写 满 ， 即 chunk size 等 



















































































拼 好 数据 ， 在 下 一 行将 其 写 入 硬盘 。 第 403 行 的 printk 输出 信息 是 为 了 帮助 


























第 397 行 判断 ， 若 马上 要 读 写 的 块 是 本 次 操作 中 的 第 一 个 块 ， 通 常情 况 下 该 块 中 都 已 存在 数据 ， 因 此 
在 下 一 行 先 将 该 块 中 的 数据 读 出 来 ， 然后 使 first_write_block 置 为 false。 第 401 行将 数据 拷贝 到 io_buf 中 ， 
周 试 ， 下 次 就 将 它 去 掉 。 硬 盘 














写 入 后 ， 第 405 一 409 行 更 新 相应 的 数据 ， 如 使 i_size 加 上 chunk size，bytes_written 加 上 bytes_written， 剩 





余数 据 量 减 去 bytes_written 。 























量 bytes_ written， 至 此 file_write 结束 。 





将 count 个 字 节 写 完 之 后 ， 在 第 411 行 同步 inode。 最 后 释放 all blocks 和 io buf， 返回 已 写 入 的 数据 


虽然 就 这 一 个 函数 ， 内 容 还 真是 不 少 ， 大 家 辛 苗 了 ， 休 息 一 下 ， 然 后 继续 。 





14.7.2 改进 sys_write 及 write 系统 调用 


本 节 给 大 伙 儿 带 来 一 个 好 消息 和 一 个 坏 消息 ， 坏 消息 是 我 们 要 重 写 ~ write 及 周边 代码 了 ， 好 消 ) 





是 sys_wirte 非常 简单 ， 相 关 改 动 也 不 麻烦 ， 大 伙 儿 忍 一 忍 ， 本 节 下 面 


代码 14-26 (project/c14/e/fs/fs.c ) 

















383 /* 将 buf 中 连续 count 个 字 节 写 入 文件 描述 符 fq， 
成 功 则 返回 写 入 的 字 节 数 ， 失 败 返 回 -1 */ 
384 int32 t sys write(int32 t fd, const void* buf，uint32 七 count) 























385 if (fd < 0) { 

386 printk("sys write: fd error\n"); 
387 returrn —13y 

388 } 

389 if (fd == stdout no) { 

390 char tmp buf[1024] = {0}; 

391 memcpy (tmp buf, buf, count); 

392 console put str(tmp buf); 


648 








证 





见 代 码 14-26。 


{ 


393 return count; 

394 } 

395 uint32 t fd = fd local2global (fd); 

396 struct file* wr file = &file tablel[l fd]; 

397 if (wr _ file->fd flag & O WRONLY || wr file->fd flag & O RDWR) { 

398 uint32 七 bytes written = file write(wr file, buf, count); 

399 return bytes written; 

400 } else { 

401 console put str("sys write: not allowed to write file 
without flag O RDWR or O WRONLY\n"); 

402 return -1; 

403 } 

404 } 

… 略 




















sys_write 接受 3 个 参数 ， 文 件 描 述 符 但、 数据 所 在 缓冲 区 buf、 写 入 的 字 节 数 count。 

函数 中 对 标准 输出 做 了 特殊 处 理 ， 第 389 行 ， 若 发 现 人 包 等 于 stdout no， 也 就 是 往 屏幕 上 打印 信息 时 ， 

就 把 buf 中 的 count 字 节 复制 到 临时 缓冲 区 tmp_buf 中 ， 然 后 调用 console_put_str(tmp_buf) 输 出 ， 最 后 通过 
return 返回 count。 
在 其 他 情况 下 ，sys_write 都 是 往 文件 中 写 数据 ， 下 面 第 395 行 通 过 fd_local2global 获取 文件 描述 符 各 
对 应 于 文件 表 中 的 下 标 _fd，, 然后 获得 待 写 入 文件 的 文件 结构 指针 wr_file, 在 第 397 行 判断 其 fag， 只 有 flag 
包含 O_WRONLY 或 O_RDWR 的 文件 才 允 许 写 入 数据 ， 提 醒 一 下 ， 单 纯 的 O_CREAT 只 能 创建 文件 ， 不 能 
写 文件 ， 咀 们 这 里 是 参照 Linux 的 做 法 实现 的 。 如 果 符 合 条 件 ， 则 通过 file_write 完成 数据 写 入 ， 并 返回 写 入 
的 字 节 数 ， 否 则 不 允许 号 入 数据 ， 输 出 提示 信息 后 返回 -1。 

好 啦 ，sys_write 修改 完成 ， 下 面 是 修改 和 此 函数 相关 的 功能 。 

之 前 咱们 的 系统 调用 write 对 应 的 sys_write 还 是 非常 简单 的 ， 那 时 咱们 还 不 支持 文件 系统 ， 因 此 
sys_write 就 只 是 调用 console_put_str 完成 字符 串 输出 。 现 在 sys_write 已 经 改版 了 ， 原 型 不 同 ， 参 数 个 数 
不 同 了 ， 因 此 和 write 相应 的 都 要 一 同 改 进 ， 真 是 牵 一 发 而 动 全 身 啊 。 
首先 改进 的 是 lib/user/syscall.c， 见 代码 14-27。 

































































































































































































































































































































































代码 14-27 (project/c14/e/lib/user/syscall.c ) 
… 略 
56 /* 把 buf 中 count 个 字符 写 入 文件 描述 符 fd */ 
57 Uint32 t writet{int32 七 fd const volid* bufy Uint32t count}) 1 
58 return syscall3 (SYS WRITE, fd, buf, count); 
9 


-iO 


write 改动 很 小 ， 之 前 是 调用 宏 _syscalll， 现 在 改 为 了 宏 _syscall3。 男 外 记得 把 write 的 声明 在 头 文件 
lib/user/syscall.h 中 更 新 。 
下 个 要 改进 的 是 lib/stdio.c， 见 代码 14-28。 


代码 14-28 (project/c14/e/lib/stdio.c ) 


























… 略 
84 /* 格式 化 输出 字符 串 format */ 






































85Uint32 Et printt(oonmst clar* formaty ee 4 

86 va list args; 

87 va _ start (args, format); // 使 args 指向 format 
88 char buf[1024] = {0}; VA 存储 拼接 后 的 字符 串 
89 vsprintf (buf, format, args); 

90 va _ end (args); 

91 return writel(l1l, buf, strlen (buf));} 

92 

… 略 




















这 里 把 printf 中 调用 的 write 也 替换 了 ， 改 为 write(1, buf strlen(buf)， 之 前 是 write(buf)。 
接着 把 原 定义 在 usrprog/syscall-init.c 中 的 sys_write 去 掉 就 好 了 。 
好 啦 ， 周 边 代 码 就 改 好 了 ， 本 节 到 这 就 结束 了 ， 下 节 了 咱们 进行 功能 测试 。 
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14.7.3 ”把 数据 写 入 文件 


本 节 咀 


… 略 


18 int main (void) 


代码 第 26 行 以 O_ RDWR 方式 打 帮 























们 往 文 件 filel 中 写 入 数 


代码 


{ 








居 ， 在 main.e 


14-29 


put str("I am kernel\n"); 
init all(); 


process execute (u prog a, 
process execute(u prog b, 
thread start ("k thread a", 
thread start ("k thread b", 


下 瑟 32: 汪 :于 G 
BrintE ("Eads 
sys _ write (fd, 


sd\n", fqd); 
"hello,w 


sys_close (fd) ; 


printf("%d closed now\n", 


while(1); 
return 0; 











序 运行 的 结果 ， 如 图 








14-24 所 示 。 





图 中 标 有 下 画 线 的 部 分 是 我 们 在 程序 中 添加 的 调试 代码 ， 
另外 ， 我 们 顺 
这 两 类 信息 如 





看 一 下 该 地 
中 有 inode table 











止 处 的 数据 ， 
也 址 ， 该 地 址 是 0x4a， 

















"u prog a" 
Vi Brog..b" 
31; 
EN 


oxrld\n", 12)3 


EQ) ; 














xxd 





还 是 用 











的 


工具 


ES 








添加 的 测试 代码 见 代码 14-29。 


) ; 
); 


k thread a, 
k thread b, 


sys_open("/filel", O RDWR); 


F 文 件 file1， 然 后 在 第 








本 下 








Bochs x86 emulaton http://bochs.sourd 


prog_a malloc addr 
prog_b malloc addr 
thread a malloc add 
‘thread _b malloc addr: 


closed 


mow 





CTRL + 3rd button enables mouse | | | | | 








了 | 








hd80M.img 的 该 地 址 处 的 1 扇 区 ，xxd 在 右边 显示 了 字符 “hello,world”， 但 \' 是 不 可 见 字符 ， 
' 人 代替 ， 大 伙 儿 可 以 对 








受 | 








A 





14-24 文件 写 入 演示 


上 半 部 分 是 查看 文件 写 入 的 数据 。 将 局 


宁 











3 

















上 昭 


MY 


下 左边 


同一 行 的 0A， 


























































































































区 








"I am thread 
"I am thread 


输出 写 入 的 
查看 下 文件 filel 的 inode 的 信息 ， 在 
14-25 所 示 。 


( project/c14/e/kernel/main.c ) 


a 
bb" 


28 行 写 入 “hello,worldn”， 下 





") ; 
) 





三 三 
| 





了 
草 





面 我 们 看 下 和 


HTH 




















区 地 址 是 0x2ab， 下 面 我 们 查 


图 14-18 

















[work@localhost e]$ sh ~/tool/calculator.sh 0x2ab*512 d 
349696 
[work@localhost e]$ sh ~/tool/xxd.sh ~/my_workspace/bochs/hd80M.img 349696 512 
0055600: 68 65 6C 6C 6F 2C 77 6F 72 6C 64 0A 00 00 00 00 hello,world 

0055610: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 


00557f0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 
[work@localhost e]$ sh ~/tool/calculator.sh Ox4a*512 d 

37888 
mn 


h ~/tool/xxd.sh ge fe img 37888 512 
48 00 00 00 00 00 00 00 00 

00 00 00 00 00 00 00 0 0%0 

00 00 00 00 00 00 00 00 00 . 

00 00 00 00 00 00 00 0000 . 

00 00 00 00 00 00 00 0000 . 

00 .00 00 00 00 00 00 [2 

00 00 00 00 00 00 00 00 00 

00 00 00 00 00 00 00 00 00 

4 图 14-25 ”inode 及 文件 数据 验证 











它 就 是 mn' 的 ASCII 码 。 





区 地 址 0x2ab 换算 为 字 节 是 349696， 











用 xxd 脚 本 查 查 看 



































羽 此 上 只 是 以 







































































图 中 下 半 部 分 是 查看 inode table 中 的 前 两 个 inode， 我 们 目的 是 查看 inode 的 i size 和 i sectors ee 
这 里 只 显示 了 512 字 节 ， 因 此 第 二 个 inode 信息 不 完整 ， 但 已 经 足够 了 。 图 中 用 细 线 标 出 的 是 第 0 个 inode， 
即 根 目录 的 inode， 地 址 范围 是 0x9400~0x944b， 每 个 inode 的 都 是 这 么 大 。 最 后 较 长 的 we 了 8 个 字 
节 ， 它 是 inode 中 的 inode tag， 类 型 为 struct list elem， 前 4 字 节 是 指针 prev， 后 4 字 节 是 指针 next。 其 余 的 
数据 都 是 按 每 4 字 节 为 一 个 单位 ， 第 一 行 的 第 1 个 4 字 节 表示 inode 编号 1 no， 其 值 为 0， 根 目录 的 inode 编 
号 就 是 0。 第 2 个 4 字 节 表示 isize， 此 inode 表示 目录 ， 因 此 i_size 是 目录 中 目录 项 大 小 的 总 和 ， 大 家 可 以 看 
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下 目录 项 的 结构 , 其 大 小 是 24 字 节 , 根 目录 中 有 三 个 目录 项 , 分 别 是 ."、'.. ' 和 "filel', 因此 根 目录 inode 的 1 size 
































































































































































































































是 72， 即 0x48。 第 3 个 4 字 节 和 第 4 个 4 字 节 分 别 表示 iopen_cnts 和 write deny， 它 们 在 写 入 硬盘 时 就 被 清 

0 了。 第 二 行 的 第 1 个 4 字 节 是 根 目录 的 i lol 了 值 为 0x2aa, 咱们 名 el 的 数据 块 紧邻 其 后 , 是 0x2ab。 

此 inode 其 余 的 是 i_sector[1 一 12] 的 值 ， 都 为 0。 图 中 男 粗 下 画 线 的 是 filel 的 inode， 第 1 个 粗 线 表示 i_ no， 即 

inode 编号 为 1。 第 2 个 粗 线 表示 i_size， 其 值 为 0xc， 即 12， 咱 们 确实 写 入 了 12 个 字 节 的 数据 。 第 5 个 粗 线 

表示 i _Sector[0]， 其 地 址 确实 是 0x2ab， 符 合 预 期 。 [work@localhost e]$ sh ~/tool/xxd.sh ~/my_workspace/bochs/hd8@M.img 349696 512 

0055600: 68 65 6C 6C 6F 2C 77 6F 72 6C 64 OA 68 65 6C 6C hello,world.hell 

好 啦 ， 下 面 再 执行 一 次 程序 ， 看 看 数据 是 否 更 。 | 下 0 机 人生 全 

新 正确 ， 由 于 还 是 写 入 12 个 字符 ， 未 超过 1 房 区 ，” 因 加 于 二 二 二 二 汪汪 二 二 的 

故 bochs 的 运行 结果 和 图 14-24 一 样 ， 不 重复 贴 医 [work@locolhost e]$ sh ~/tool/xxd.sh ~/my-workspace 

了 ， 人 硬盘 上 的 数据 如 图 14-26 所 示 。 





经 过 再 次 执行 一 次 写 入 , filel 的 内 容 变 成 了 两 




















个 “hello,worldm”， 另 外 inode 中 的 isize 变 为 了 


0x18， 即 24 字 节 ， 


符合 预期 。 


好 啦 ， 收 工 。 


读 取 文件 
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14-26 数据 变化 



















































































完成 了 写 入 文件 ， 这 下 巧 妇 也 有 米 可 炊 了 ， 现 在 咱们 得 想 办 法 把 数据 读 出 来 ， 完 成 读 取 文 件 的 功能 。 
14.8.1 实现 file_read 
文件 读 取 的 核心 函数 还 是 定义 在 file.c 中 ， 这 次 咱们 添加 函数 file_ read， 见 代码 14-30。 
代码 14-30 (project/c14/f/fs/file.c ) 

… 略 
416 /* 从 文件 file 中 读 取 count 个 字 节 写 入 buf， 
返回 读 出 的 字 节 数 ， 若 到 文件 尾 则 返回 -1 */ 
417 int32 七 file _ readq(struct file* file, void* buf, uint32 七 count) { 
418 uint8 t* buf dst = (uint8 t*)buf; 
419 uint32 t size = count, size left = size; 
420 
421 /* 若 要 读 取 的 字 节 数 超过 了 文件 可 读 的 剩余 量 ， 

就 用 剩余 量 作为 待 读 取 的 字 节 数 */ 
422 if ((file->fd pos + count) > file->fqd inode->i size) { 
423 size = file->fd inode->i size - file->fd pos; 
424 size left = size; 
425 if (size == 0) { // 若 到 文件 尾 ， 则 返回 -1 
426 return -1; 
427 } 
428 } 
429 
430 uint8 t* io buf = sys malloc (BLOCK SIZE); 
431 if (io buf == NULL) { 
432 printk ("file read: sys malloc for io buf failed\n"); 
433 } 
434 uint32 t* all blocks = (uint32 t*)sys malloc(BLOCK SIZE + 48); 

// 用 来 记录 文件 所 有 的 块 地 址 
435 if (all blocks == NULL) { 
436 printk ("file read: sys malloc for all blocks failed\n"); 
437 return -1; 
438 } 
439 
440 uint32 t block read start idx = file->fd pos / BLOCK SIZE; 
// 数据 所 在 块 的 起 始 地 址 
441 uint32 t block read end idx = (file->fd pos + size) / BLOCK SIZE; 
// 数据 所 在 块 的 终止 地 址 

442 uint32 七 read blocks = block read start idx - block read end idx; 
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// 如 增 量 为 0， 表示 数据 在 同一 扇 区 



























































































































































































































































































































































































































































443 ASSERT (block read start idx < 139 && block read end idx < 139) ， 
444 
445 int32 t indirect block table; // 用 来 获取 一 级 间接 表 地 址 
446 uint32 t block idx; // 获取 待 读 的 块 地 址 
447 
448 /* 以 下 开始 构建 a11_blocks 块 地 址 数组 ， 
专门 存储 用 到 的 块 地 址 ( 本 程序 中 块 大 小 同房 区 大 小 ) */ 
449 if (read blocks == 0) { // 在 同一 扇 区 内 读数 据 ， 不 涉及 到 跨 扇 区 读 取 
450 ASSERT (block read end idx == block read start idqx) ， 
451 if (block read end idx < 12 ) // 待 读 的 数据 在 12 个 直接 块 之 内 
452 block idx = block read end idx; 
453 all blocks [block idx] = file->fd inode->i sectors[block idx]; 
454 } else { // 若 用 到 了 一 级 间接 块 表 ， 需 要 将 表 中 间接 块 读 进来 
455 indirect block table = file->fd inode->i sectors[12]; 
456 ide read(cur part->my disk, \ 
indirect block table, all blocks + 12, 1); 
457 } 
458 } else { // 若 要 读 多 个 块 
459 /* 第 一 种 情况 : 起 始 块 和 终止 块 属于 直接 块 */ 
460 if (block read end idx < 12 ) { // 数据 结束 所 在 的 块 属 接 块 
461 block idx = block read start idx; 
462 while (block idx <= block read end idx) { 
463 all blocks[block idx] = file->fd inode->i sectors [block idx]; 
464 block idxt++; 
465 } 
466 } else if (block read start idx < 12 && block read end idx >= 12) { 
467 /* 第 二 种 情况 : 待 读 入 的 数据 跨越 直接 块 和 间接 块 两 类 */ 
468 /* 先 将 直接 块 地 址 写 入 all blocks */ 
469 block idx = block read start idx; 
470 while (block idx < 12) { 
471 all blocks[block idx] = file->fd inode->i sectors[block idx]; 
472 block idxt++; 
473 } 
474 ASSERT (file->fd inode->i sectors[12] != 0);，} 
// 确保 已 经 分 配 了 一 级 间接 块 于 
475 
476 /* 再 将 间接 块 地 址 写 入 all blocks */ 
477 indirect block table = file->fd inode->i sectors[12]; 
478 ide read(cur part->my disk, \ 
indirect block table, all blocks + 12, 1);} 
// 将 一 级 间接 块 表 读 进来 写 入 到 第 13 个 块 的 位 置 之 后 
479 } else { 
480 /* 第 三 种 情况 : 数据 在 间接 块 中 */ 
481 ASSERT (file->fd inode->i sectors[12] != 0);，} 
// 确保 已 经 分 配 了 一 级 间接 块 表 
482 indirect block table = file->fd inode->i sectors[12]; 
// 获取 一 级 间接 表 地 址 
483 ide read(cur part->my disk, \ 
indirect block table, all blocks + 12, 1); 
// 将 一 级 间接 块 表 读 进来 写 入 到 第 13 个 块 的 位 置 之 后 
484 } 
485 } 
486 
487 /* 用 到 的 块 地 址 已 经 收集 到 al1_blocks 中 ， 下 面 开 始 读数 据 */ 
488 uint32 t sec idx, sec lba, sec off bytes, sec left bytes, chunk size; 
489 uint32 t bytes read = 0; 
490 while (bytes read < size) { // 直到 读 完 为 止 
491 sec idx = file->fd pos / BLOCK SIZE; 
492 sec lba = all blocks[sec idx]; 
493 sec off bytes = file->fd pos % BLOCK SIZE; 
494 sec left bytes = BLOCK SIZE - sec off bytes; 
495 chunk size = size left < sec left bytes ? size left : sec left bytes; 
// 待 读 入 的 数据 大 小 
496 
497 memset (io buf, 0, BLOCK SIZE); // 不 清空 也 可 以 
498 ide read(cur part->my disk, sec lba, io buf, 1); 
499 memcpy (buf dst, io buf + sec off bytes, chunk size); 
500 
二 全 员 buf dst += chunk size; 
502 file->fd pos += chunk size; 
S03 bytes read += chunk size; 


652 


file_ rea 
file rea 














Size left -= chunk size; 
} 
sys_free(all blocks); 
sys_free (io buf); 
return bytes_ read; 




















d 同 file_write 一 样 ， 都 是 比较 长 ， 实 现 原理 也 类 似 ， 下 面 大 体 说 下 。 
d 接受 3 个 参数 ， 读 取 的 文件 fle、 数 据 写 入 的 缓冲 区 buf、 读 取 的 字 节 数 count， 功 能 是 从 文 


















































件 file 中 读 取 count 个 字 节 写 入 buf， 返 回 读 出 的 字 节 数 ， 知 到 文件 尾 ， 则 返回 -1。 





函数 开头 将 buf_dst 用 buf 赋值 ， 后 


判断 文件 是 





























外 我 们 将 读 到 的 数据 存 入 此 地 址 ， 不 改变 buf。 代 码 第 422 一 428 行 
否 已 读 到 文件 尾 ， 如 果 是 ， 就 返回 -1。 



































套路 ， 第 430 行 的 io_buf 还 是 咱们 硬盘 操作 的 缓冲 区 ， 后 面 会 把 从 硬盘 
































读 出 的 数据 存 入 到 





























io_buf。 第 434 行 的 all_blocks 依然 用 来 记录 文件 所 有 的 块 地 址 , 我 们 后 面 的 读 硬盘 操作 将 在 此 结构 中 








获取 地 址 。 


























变量 block_read start idx 表示 当前 指针 fd_pod 所 指向 的 块 索 引 ， 也 就 是 数据 读 取 的 起 始 块 索引 ， 
block read_end idx 表示 相对 于 当前 位 置 但 pos 偏 移 count 个 字 节 所 在 的 块 索引 ， 即 数据 读 取 的 结束 块 索 
引 。read_blocks 表示 要 读 取 的 块 数 。indirect_ block table 是 一 级 间接 块 索引 表 的 地 址 ， 后 面 将 为 它 赋值 ， 
block idx 用 于 块 索引 。 

下 面 开 始 把 读 操作 中 用 到 的 块 地 址 收录 到 all_ blocks 中 。 


当 read_blocks 为 0 时 ， 这 说 明 要 读 取 的 count 个 字 节 在 一 个 块 中 ， 因 此 只 需要 读 取 1 个 块 ， 下 面 分 两 










































































种 情况 处 理 。 














第 451 行 判断 若 结束 块 属于 直接 块 , 就 在 i_sectors 中 获取 块 地 址 。 否 则 就 要 获得 间接 块 地 址 ， 























因此 第 455 行 获取 一 级 间接 块 索引 表 地 址 ， 第 456 行 读 取 该 表 ， 获 取 所 有 的 间接 块 地 址 。 
若 read_blocks 不 为 0， 这 说 明 count 个 字 节 跨 块 ， 需 要 读 取 多 个 块 ， 下 面 分 三 种 情况 处 理 。 
(1) 车 起 始 块 和 终止 块 都 在 12 块 之 内 ， 直 接 读 入 i_sectors 数组 中 即 可 。 


































































































(2) 若 起 始 块 在 12 块 之 内 ， 结 束 块 超过 了 12 块 ， 除 了 要 读 入 i_sector 数组 ， 还 要 从 一 级 间接 块 索引 
表 中 读 取 间接 块 地址 。 
(3) 若 起 始 块 超过 了 12 块 ， 这 种 情况 下 要 在 一 级 间接 块 索 引 表 中 读 取 间 接 块 。 

































































第 460 一 465 行 处 理 第 (1) 种 情况 ， 循 环 将 所 需要 的 间接 块 地 址 录入 all_blocks。 

第 466 一 478 行 处 理 第 〈2) 种 情况 ， 先 在 第 469 一 473 行 通过 while 循环 收集 直接 块 地 址 ， 然 后 在 第 
477 一 478 行 从 硬盘 上 获取 所 有 的 间接 块 地 址 ， 录 入 到 all_blocks 中 。 
第 479 一 483 行 是 直接 从 硬盘 上 获取 间接 块 地址 到 all_blocks。 









































































































































至 此 ， 读 硬盘 操作 中 所 涉及 的 块 地 址 已 经 录入 到 all_blocks 中 。 









































第 490~505 行 是 读 取 硬 盘 的 过 程 ， 原 理 同 写 入 数据 类 似 ， 都 是 要 选 出 合适 的 操作 数 大 小 ， 即 chunk size， 

















每 次 都 由 第 498 行 的 ide_ read 函数 读 取 1 个 扇 区 ， 然 后 在 第 499 行 往 dst buf 中 拷贝 chunk size 个 字 节 。 顺 便 








提 一 下 ， 第 
终 返回 给 | 
把 控 的 ， 因 ] 






































497 行 的 memset 清 0 操作 不 是 必须 的 ， 理 论 上 读 入 的 数据 会 把 io_buf 中 旧 数 据 宪 盖 ， 而 且 最 


] 户 的 数据 是 在 dst buf 中 ， 这 由 第 499 行 的 memcpy 控制 ， 数 据 读 取 的 准确 性 是 由 chunk size 
































比 即 使 io_buf 中 有 垃圾 数据 ， 只 要 chunk_size 正确 就 不 会 多 读 入 错误 的 数据 。 不 过 恬 愧 的 是 自 
































我 安慰 了 这 么 多 还 是 把 memset 放 在 这 ， 毕 竟 小 心 驶 得 万 年 船 ， 没 有 人 是 故意 犯错 的 ， 错 误 总 是 由 想不到 











的 原因 引起 的 嘛 。 























最 后 分 别 释放 all_blocks 和 io_buf， 通 过 return 返回 已 读 的 字 节 数 bytes_read。 








节 我 


14.8.2 实 





门 也 结束 了 ， 下 节 再 继续 。 


现 Sys_read 与 功能 验证 




















sys_read 是 file read 的 封装 , 主要 功能 已 经 由 包 e_ read 完成 了 ,因此 给 大 伙 儿 带 来 了 好 消息 ，sys read 
代码 非常 少 ， 不 信 您 看 ， 见 代码 14-31。 
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代码 14-31 (project/c14/f/fs/fs.c ) 

… 略 
406 /* 从 文件 描 苗 述 符 fd 指向 的 文件 中 读 取 count 个 字 节 到 buf， 

若 成 功 则 返回 读 出 的 字 节 数 ， 到 文件 尾 则 返回 -1 */ 
407 int32 t sys read(int32 t fd, void* buf, uint32 七 count) { 
408 二 并 半 下 人 二 疝 和 :证 
409 printk("sys read: fd error\n"); 
410 return -1; 
411 } 
412 ASSERT (buf != NULL); 
413 uint32 t fd = fd local2global (fd); 
414 return file read(&file tablel[l fd], buf, count);} 
415 } 
… 略 


sys_read 是 read 系统 


加 标准 输入 。 没 啥 好 说 的 啦 ， 代 码 简 单 明 了， 下 


























区 


前 就 改 成 这 样 ， 
图 











周 用 的 内 核实 现 ， 原 型 也 是 按照 read 来 实现 的 ， 目 


而 在 main.c 中 增加 sys_read i 





以 后 还 会 
]， 见 代码 14-32。 








































































































































































































代码 14-32 (project/c14/f/kernel/main.c ) 
… 略 
19 int main(void) { 
… 略 
之 了 uint32 七 fdq = sys open("/filel", O RDWR); 
28 printf("open /filel,fd:%d\n", fd); 
29 char buf[64] = {0}; 
30 int read bytes = sys readl(fd, buf, 18); 
3 二 Printf("1 read %d bytes:N\ngssNn" read bytes, buf); 
32 
33 memset (buf，0，64) ; 
34 read bytes = sys readl(fd, buf, 6); 
Ko printf("2 read %d bytes:\n%s", read bytes, buf); 
36 
37 memset (buf, 0, 64); 
38 read bytes = sys readl(fd, buf, 6); 
39 printf("3 read %d bytes:\n%s", read bytes, buf); 
40 
41 printf(" close filel and reopen Nm 
42 sys_close (fdq) ; 
43 fd = sys open("/filel", O RDNWR) 
44 memset (buf, 0, 64); 
45 read bytes = sys readl(fd, buf, 24); 
46 printf("4 read %d bytes:\n%s", read bytes, buf); 
47 
48 sys_close (fdq) ; 
49 while(1); 
50 return 0; 
Sl >} 
… 略 
我 们 之 前 已 经 在 文件 flel 中 写 入 了 24 个 字 节 ， 即 两 组 字符 串 “hello,worldn”， 一 共 24 个 字符 ， 下 
面 将 其 “曲折 地 ” 读 出 来 ， 考 验 我 们 的 时 候 到 了 。 
测试 代码 分 为 4 块 ， 第 27 一 31 行 是 打开 包 el1， 读 取 18 个 字 节 到 buf 中 ， 然 后 输出 读 到 的 数据 。 按 理 
来 说 ， 这 18 个 字符 应 该 是 “hello,worldwnhello,”， 其 中 的 \n' 会 被 处 理 为 换行 。 
第 34 一 35 行 是 继续 读 取 剩 下 的 6 字 节 并 输出 ， 按 理 来 说 会 输出 “worldm”， 至 此 24 个 字符 全 部 读 完 ， 
已 读 到 文件 末尾 。 
第 38 一 39 行 是 再 读 取 6 字 节 。 按 理 说 ， 由 于 目前 文件 已 读 到 文件 末尾 ， 再 无 数据 可 读 取 ，sys_read 
会 返回 -1。 
第 41 一 46 行 关 闭 文件 包 e1， 再 重新 打开 ， 目 的 是 测试 是 否 能 从 头 读 取 数据 。 不 过 提醒 一 多，fiel 不 一 定 








要 先 关闭 ， 完 全 可 以 直接 





这 次 我 们 读 取 24 个 字 
果 如 图 14-27 所 示 ， 还 是 符合 
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一 口 
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打开 ， 但 要 用 另 一 变量 记录 新 的 文件 描述 符 ， 
节 。 运 行 结果 如 图 14-27 所 示 。 


预期 的 ， 本 节 任 务 完成 。 


否则 之 前 的 得 就 丢掉 了 ， 无 法 关闭 。 




















14.9 ”实现 文件 读 写 指针 定位 功能 
































esys 
done! 

prog_a malloc addr :9x894800C ,9x804816C ,QOx80482QC 

QC , 0: 8 9x8 、 


prog_b malloc addr :9 BOOC ,9x894816C 894826C 
thread_a malloc add C 


,只 
C 


2_ read 6 bytes: 
orld 
read -1 bytes: 
close filel and reopenm 








4 图 14-27 文件 读 取 测试 


实现 文件 读 写 指针 定位 功能 


本 节 的 名 字 看 上 去 还 挺 炫 的 ， 又 是 文件 指针 ， 又 是 定位 的 ， 哈 哈 ， 其 实 就 是 系统 调用 lseek 的 内 核实 
现 ， 您 懂 的 ， 本 质 上 就 是 设置 文件 读 写 时 的 起 始 偏 移 量 。 

为 什么 要 实现 这 个 功能 呢 ? 您 看 ， 上 次 咱们 读 取 flel 时 ， 由 于 已 经 读 到 了 文件 末尾 ，sys_read 返回 了 
一 1， 为 了 从 头 读 取 文 件 ， 咀 们 还 特意 把 文件 关闭 重新 打开 一 次 ， 这 太 床 烦 了 ， 我 们 必须 提供 不 关闭 文件 就 
能 自由 设置 读 写 位 置 的 方法 。 

为 了 统一 ， 咱 们 系统 中 的 系统 调用 对 应 的 内 核实 现 ， 都 是 在 系统 调用 名 前 加 上 sys_ 前 级 ， 因 此 我 们 本 
节 要 实现 的 就 是 sys_lseek。 我 们 先 看 下 lseek 函数 的 用 法 吧 ， 听 们 要 传承 标准 接口 。 

lseek 原型 是 “off t lseek(int fd, off t offset, int whence)”， fd 是 文件 描述 符 ，offset 是 偏 移 量 ，whence 
是 offset 的 “参照 物 ” 函数 功 能 是 设置 文件 读 写 指针 fd_pos 为 参照 物 + 偏 移 量 的 值 ， 也 就 是 说 ， 文 件 指针 
让 体 的 位 置 不 仅 取 决 于 offset， 还 取决 于 whence。 其 中 off t 是 typedef 自 定义 的 类 型 ， 相 当 于 signed int， 
有 符号 整 型 ， 因 此 offset 是 可 正 可 负 的 值 。 

whence 取 值 有 三 种 取 值 。 

SEEK_SET，offset 的 参照 物 是 文件 开始 处 ， 也 就 是 将 读 写 位 置 指针 设置 为 距 文件 开头 偏 移 offset 个 字 节 处 。 

SEEK_CUR，offset 的 参照 物 是 当前 读 写 位 置 ， 也 就 是 将 读 写 位 置 指针 设置 为 当前 位 置 +offset。 

SEEK_END，offset 的 参照 物 是 文件 尺寸 大 小 ， 即 文件 最 后 一 个 字 节 的 下 一 个 字 节 ， 也 就 是 将 读 写 位 
置 指针 设置 为 文件 尺寸 +offset。 

这 里 说 一 下 SEEK_ END， 也 许 您 觉得 offset 的 参照 物 应 该 是 文件 的 最 后 一 个 字 节 ， 很 遗憾 这 是 “错觉 ” 
因为 这 不 是 文件 末尾 ， 文 件 末尾 是 指 文 件 最 后 一 个 字 节 的 下 一 个 字 节 处 ， 即 超出 文件 大 小 的 第 1 个 字 节 ， 
这 就 是 读 完 文件 时 很 多 函数 都 会 返回 EOF (-1) 的 原因 ， 不 属于 文件 范围 了 嘛 。 文 件 的 读 写 位 置 指针 是 
fd_pos，fd_pos 始终 指向 下 一 个 可 读 写 的 位 置 ， 它 是 以 0 为 起 始 的 偏 移 量 ， 因 此 文件 末尾 是 指 文件 大 小 。 

好 啦 ， 咱 们 要 动手 实现 这 个 功能 了 。 咱 们 先 在 fs.h 中 增加 whence 的 结构 ， 见 代码 14-33。 


























































































































































































































































































































































































































































































































代码 14-33 (project/c14/g/fs/fs.h ) 


… 略 
27 /* 文件 读 写 位置 偏 移 量 */ 


28 enum whence { 


29 SEEK SET = 1， 
30 SEEK_CUR, 

31 SEEK END 

32 }; 

… 略 


655 


代码 很 简单 ， 同 以 往 不 同 的 是 枚 举 类 型 whence 中 的 第 1 个 成 员 是 从 1 六 
外 两 个 递增 ， 分 别 是 2 和 3。 


下 面 看 sys_lseek 的 实现 ， 











它 定义 在 fs.c 中 ， 见 代码 14-34。 






























































代码 14-34 (project/c14/g/fs/fs.c ) 
… 略 
417 /* 重 置 用 于 文件 读 写 操作 的 偏 移 指针 。 
成 功 时 返回 新 的 偏 移 量 ， 出 错时 返回 -1 */ 





18 
19 
20 
21 
22 
23 


int32 t sys lseek (int32 t fd, int32 t offset, uint8 t whence) 
if (fd < 0) { 
printk("sys lseek: 
return -1; 


{ 


fd error\n"); 


} 
ASSERT (whence > 0 && whence < 4);，; 






























































24 uint32 t fq = fd local2global (fd); 

25 struct file* pf = &file tablel[ fd]; 

26 int32 t new pos = 0; // 新 的 偏 移 量 必须 位 于 文件 大 小 之 内 
27 int32 t file size = (int32 t)pf->fqd inode->i size; 

28 switch (whence) { 

29 /* SEEK_SET 新 的 读 写 位 置 是 相对 于 文件 开头 再 增加 offset 个 位 移 量 */ 
30 Case SEEK SET: 

31 new pos = offset,; 

32 break; 

33 

34 /* SEEK_CUR 新 的 读 写 位 置 是 相对 于 当前 的 位 置 增加 offset 个 位 移 量 */ 
35 case SEEK CUR: // offse 可 正 可 负 





new_pos 
break; 


(int32 t)pf->fd pos + offset; 























SEEK_END 新 的 读 写 位 置 是 相对 于 文件 尺寸 再 增加 of fset 个 位 移 量 
case SEEK END: // 此 情况 下 ，offset 应 该 为 负 值 
new_pos file size + offset; 


/* 











} 
if (new pos < 0 [| new pos > (file size - 1)) 
return -1; 


{ 


} 
pf->fd pos = new pos; 
return pf->fd pos; 





~ ss 





OOOOPRODP 


遇 








扁 移 量 offset、 参 数位 置 whence， 功 能 是 习 





E 置 用 


F 始 的 ， 即 SEEK SET=1， 另 








于 文件 读 写 





























sys_lseek 接受 3 个 参数 ， 文 件 描 述 符 fd、1 
操作 的 偏 移 指 针 ， 成 功 时 返回 新 的 偏 移 量 ， 出 错时 返回 -1。 文 从 
定 的 ， 因 此 sys_lseek 的 原理 是 将 whencetoffset 转换 为 fd_pos。 

函数 开头 先 将 文件 描述 通 














的 读 写 位 置 是 由 文件 























符 亿 
























































[结构 中 








的 fd_pos 决 


过 fd_local2global 转换 为 文件 表 中 的 下 标 ， 然 后 在 第 425 行 用 pf 指向 





会 根据 


























通 

对 应 的 文件 结构 ， 后 面 都 
不 同 的 情况 计算 该 
位 置 指针 以 0 为 起 始 





























和 直 。file_ size 是 文 





指针 new_pos 肯定 要 在 文 





寸 。 第 428 一 442 行 分 别 计算 了 三 种 情况 下 的 new_pos， 代 码 意义 如 之 前 的 说 明 ， 很 简 
汤 新 的 位 置 new_pos 是 否 在 文件 大 小 范围 之 外 ， 如 果 是 就 返 
的 纪 pos， 然 后 返回 





第 443 行 判 
new_pos 修改 文 从 








指针 pf 来 操作 啦 。 接 着 声明 变量 new_pos 作为 新 的 fd_pos 值 ， 后 面 
F 的 大 小 ， 下 面 通过 switch 结构 判断 参照 物 whence 的 情况 。 

般 移 量 ， 无 论 whence 

F 大 小 范围 内 ， 不 能 小 于 0， 也 不 能 超过 文件 尺寸 -1， 即 不 能 大 于 等 于 文 从 
单 就 不 说 了 。 











位 
































位 












































是 SEEK SET、SEEK CUR， 还 是 SEEK END， 新 位 置 


尺 








口 





-1， 和 否则 就 在 名 











新 的 位 置 。 

















sys_lseek 介绍 完了 , 下 面 0 


… 略 

19 int main(void) { 

省 

27 uint32 七 fd = 
28 printf ("open 
29 char buf[64] 
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新 打开 ” 见 代 码 14- 








们 修改 下 main.c, 用 sys_lseek 蔡 换 之 前 那个 有 麻烦 的 “ 寻 


代码 14-35 








( project/c14/g/kernel/main.c ) 


sys_open("/filel", O RDWR); 
/fi1el; faiSaNn™; fd) 
{0}; 


名 446 行 用 


33。 


30 int read _ bytes = sys readl(fd, buf, 18); 
31 printf("1 read %d bytes:\nss\n", read bytes, buf); 
32 
33 memset (buf, 0, 64); 
34 read bytes = sys readl(fd, buf, 6); 
了 printf("2 read $d bytes:N\ngss" read bytes, buf); 
36 
3 memset (buf, 0, 64); 
38 read bytes = sys _ readl(fd, buf, 6); 
39 printf("3 read %d bytes:N\ngss" read bytes, buf); 
4 
PEEntEf(T SEEK SET 0 \n"); 
sys_ lseek (fd, 0, SEEK SET); 
memset (buf, 0, 64); 
read bytes = sys_read(fd, buf, 24); 
printf("4 read %d bytes:\n%ss", read bytes, buf); 





i 
有 CP NPo 


Ls 

















ed open， 功 能 
结果 ， 如 














运行 


图 中 最 后 输出 了 两 行 “hello,worldn”， 这 说 明 sys_lseek 功能 符合 预 















第 40 行 之 前 的 代码 没 变 过 ， 这 里 


sys_close (fd) ; 
while(1); 
return 0; 











HE 






































第 42 行 的 “sys_lseek(fd，0，SEEK SET” 代 
是 把 读 写 位 置 指 针 置 为 文件 开头 偏 移 为 0 的 地 址 ， 





也 就 是 置 为 文件 开 























图 14-28 所 示 。 


Bochs x86 emulator, http://bochs.sourceforge.net/ 












































s filesystem 
ount sdb1 done! 
prog_a malloc addr :QOx804800C ,9x 
prog_b malloc addr:9x894809 
thread a malloc addr :9 
thread_b malloc addr: 6xCg13936C， C913946C ， Ce13959C 
pen /filel, fd:3 
1_ read 18 bytes: 
hello,world 


read 6 bytes: 


or ld 
_ read -1 bytes: 


hello,wor 14 





IPS: 27.253H | | | | | | | | | 


SetsUsPEND Poer 








14-28 





lseek 验证 






































SEEK_END 就 不 测试 了 ， 我 私下 测试 还 行 ， 大 伙 儿 有 兴趣 自己 测试 吧 。 
好 啦 ， 今天 就 到 这 了 ， 很 晚 了 ， 累 ， 大 伙 儿 晚安 。 

< 实现 文件 删除 功能 
在 Linux 下 用 于 文件 删除 的 函数 是 unlink， ee 实现 它 。 


涉及 到 inode、inode 位 
“底层 建筑 ”。 














14.10.1 


39 








图 、 目 录 inode 中 的 isize、 


回收 inode 
inode 是 文件 系统 的 灵魂 ， 删 除 文 从 





TT 











Wah 
烛 
还 
寺 
部 
五 





荫 习 





录 项 、 数 据 块 及 数据 块 位 图 的 





删除 文件 是 创建 文件 的 逆 过 程 ， 








竺 了 之 前 的 先 close 














| 











收文 件 对 应 的 inode。 与 inode 相关 的 党 








头 。 好 啦 ， 看 下 





期 ， 另 外 的 SEEK_ CUR 和 








并 峭 


收 操作 ， 因 此 还 


资源 有 : 
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(1) inode 位 图 

(2) inode table 

(3) inode 中 isectors[0 一 11] 中 的 直接 块 和 一 级 间接 索引 块 表 i sectors[12] 中 的 间接 块 

(4) 一 级 间接 索引 块 表 本 身 的 扇 区 地 址 

您 看 ,回收 一 个 inode 还 是 有 些 工 作 量 的 ,本 节 咱 们 在 inode.c 中 添加 两 个 函数 ， 依 次 回收 以 上 罗列 的 
相关 资源 ， 见 代码 14-36。 

































































代码 14-36 (project/c14/h/fs/inode.c ) 










































































































































































































































































… 略 
146 /* 将 硬盘 分 区 part 上 的 inode 清空 */ 
147 void inode deletel(struct partition* part, uint32 t inode no, void* io puf) { 
148 ASSERT (inode no < 4096) ; 
149 struct inode position inode pos; 
150 inode locate(part, inode no &inode pos); 
// inode 位 置信 息 会 存 入 inode pos 
生 六 二 ASSERT (inode pos.sec lba <= (Part->start_ lba + part->sec cnt)); 
152 
153 char* inode buf = (char*)io puf; 
154 if (inode pos.two sec) {  // inode 跨 扇 区 ， 读 入 2 个 扇 区 
155 /* 将 原 硬盘 上 的 内 容 先 读 出 来 */ 
156 ide read(part->my disk, inode pos.sec lba, inode buf，2) 
157 /* 将 inode buf 清 0 */ 
158 memset ((inode buf + inode pos.off size), 0, sizeof (struct inode)); 
159 /* 用 清 0 的 内 存 数据 覆盖 磁盘 */ 
160 ide_write (Part->my disk, inode pos.sec lba, inode buf，2) 
161 } else // 未 跨 扇 区 ， 只 读 入 1 个 扇 区 就 好 
162 /* 将 原 硬盘 上 的 内 容 先 读 出 来 */ 
163 ide read(part->my disk, inode pos.sec lba, inode buf, 1); 
164 /* 将 inode buf 清 0 */ 
165 memset ((inode buf + inode pos.off size), 0, sizeof (struct inode)); 
166 /* 用 清 0 的 内 存 数 据 覆 盖 磁盘 */ 
167 ide write (part->my disk, inode pos.sec lba, inode buf, 1);，; 
168 } 
169 } 
170 
171 /* 回收 inode 的 数据 块 和 inode 本 身 */ 
12 void inode release (Struct partition* part, uint32 t inode no) { 
173 struct inode* inode to del = inode open(part, inode no); 
174 ASSERT (inode to del->i no == inode no); 
I 
176 /* 1 回收 inode 占用 的 所 有 块 */ 
177 uint8 t block idx = 0, block cnt = 12; 
178 uint32 七 block bitmap idx; 
179 uint32 t all blocks[140] = {0}; //12 个 直接 块 +128 个 间接 块 
180 
181 /* a 先 将 前 12 个 直接 块 存 和 信 all blocks */ 
182 while (block idx < 12) { 
83 all blocks[block idx] = inode to del->i sectors[block idx]; 
184 block idxt++; 
185 } 
186 
187 /* b 如 果 一 级 间接 块 表 存在 ， 将 其 128 个 间接 块 读 到 all blocks[12~]， 
并 释放 一 级 间接 块 表 所 占 的 扇 区 */ 

188 if (inode to del->i sectors[12] != 0) { 
189 ide read(part->my disk, inode to del->i sectors[12], 

ll bpLocks + 2) 1} 
190 block cnt = 140; 
191 
192 /* 回收 一 级 间接 块 表 占 用 的 扇 区 */ 
193 block bitmap idx = \ 

inode to del->i sectors[12] - part->sb->data start lba; 
194 ASSERT (block bitmap idx > 0); 
195 bitmap set (&part->block bitmap, block bitmap idx, 0); 
196 bitmap sync (cur part, block bitmap idx, BLOCK BITMAP); 
T9737 } 
198 
199 /* c inode 所 有 的 块 地 址 已 经 收集 到 al1 blocks 中 ， 下 面 逐个 回收 */ 
200 block idx = 0; 
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201 while (block idx < block cnt) { 

202 if (all blocks[block idx] != 0) { 

203 block bitmap idx = 0; 

204 block bitmap idx = all blocks[block idx] - \ 
part->sb->data start lba; 

205 ASSERT (block bitmap idx > 0); 

206 bitmap set (&Part->block bitmap, block bitmap idx, 0); 

207 bitmap sync (cur part, block bitmap idx, BLOCK BITMAP); 

208 } 

209 bliock igdxt+ty 

210 } 

过 六 于 

212 /*2 回收 该 inode 所 占用 的 inodqe */ 

213 bitmap set (&part->inode bitmap, inode no 0); 

214 bitmap sync (cur part, inode no INODE BITMAP); 

215 

216 /大 类 炎炎 类 以 下 inode_delete 是 调试 用 的 六 炎炎 火炎 炎 

2 了 * 此 函数 会 在 inode table 中 将 此 ijnode 清 0， 











218 * 但 实际 上 是 不 需要 的 ，inode 分 配 是 由 ijnode 位 图 控制 的 ， 
219 * 硬盘 上 的 数据 不 需要 清 0， 可 以 直接 覆盖 */ 
























































220 void* io buf = sys malloc(1024); 

221 inode delete(part, inode no io buf); 

222 SYS_free (io buf); 

223 /大 太太 炎炎 炎炎 交大 类 炎炎 炎炎 类 类 炎炎 类 类 类 大 大 类 大 大 类 类 大 类 类 大 大 类 大 大 大 大 大 大 大 大 大 大 大 大 大 了 
224 

225 inode close(inode to del); 

22.6 

… 略 












































代码 看 上 去 有 点 长 , 但 实际 上 最 上 面 的 函数 inode_delete 是 可 有 可 无 的 , 它 是 为 了 帮助 调试 而 添加 的 ， 
并 不 是 必须 的 功能 。 
inode 的 使 用 情况 是 由 inode 位 图 来 控制 的 ， 从 inode 位 图 中 把 inode 分 配 出 去 后 ， 无 论 该 inode 中 原来 
否 有 数据 , 创建 后 一 律 会 被 新 数据 覆盖 ,因此 在 回收 inode 时 只 要 在 inode 位 图 中 的 相应 位 置 0 就 可 以 了 ， 
必要 在 inode table 中 真正 探 除 该 mode， 就 像 删除 文件 时 不 需要 真正 把 文件 数据 块 中 的 数据 探 除 一 样 。 
inode delete 接受 3 个 参数 , 分 区 part\、 inode 编号 inode no 及 缓冲 区 io buf, 功能 是 把 inode 从 inode table 
中 擦 除 ， 也 就 是 在 inode table 中 把 该 inode 对 应 的 空间 清 0。 
函数 开头 定义 的 变量 inode_pos 用 于 存储 inode 的 位 置信 息 ， 下 面 将 它 作 为 参数 调用 函数 inode_locate 
以 定位 编号 为 inode no 的 inode， 之 后 inode pos 中 便 有 了 该 inode 的 “坐标 ” 
之 后 开始 判断 该 inode 是 否 跨 扇 区 ， 并 针对 这 两 种 情况 分 别处 理 。 这 两 种 情况 的 区 别 是 从 硬盘 上 读 入 1 个 
扇 区 ， 还 是 读 入 2 个 扇 区 到 io_buf， 共 性 把 该 inode 从 硬盘 所 在 局 区 读 入 到 io_buf 后 ， 调 用 memset 函数 将 
io_buf 中 该 inode 所 在 的 内 存 空间 清 0， 然 后 将 该 io_buf 重新 写 回 到 硬盘 ， 从 而 实现 了 将 inode 擦 除 的 日 的 。 
下 面 是 函数 inode_release， 它 接受 2 个 参数 ， 分 区 part 和 inode 编号 inode no， 功能 是 回收 inode， 这 
包括 inode 中 的 数据 块 和 inode 本 身 在 inode 位 图 中 的 bit。 
由 于 文件 操作 的 套路 大 伙 儿 已 经 熟悉 了 ， 我 就 不 细 说 了 ， 代 码 第 177 一 185 行 是 将 直接 块 收集 到 
all_ blocks。 第 188 一 190 行 判 断 ， 如 果 一 级 间接 块 表 存在 ， 将 表 中 128 个 间接 块 读 到 all_blocks 中 第 12 块 以 
后 的 其 余 空间 中 。 一 级 间接 块 表 本 身 占 据 1 扇 区 ， 因 此 在 第 193 一 196 行将 该 户 区 回收 。 
执行 到 第 200 行 时 , 该 inode 中 所 有 的 块 地 址 已 经 被 收集 到 all_blocks 中 , 下面 通过 while 循环 把 块 逐 
个 回收 ,核心 操作 是 调用 bitmap_set 将 内 存 中 位 图 的 block_bitmap idx 位 置 为 0, 再 调用 bitmap_sync 将 内 
存 中 的 位 图 同步 到 硬盘 。 关 于 块 回收 工作 ， 这 里 有 一 点 说 明 。 如 果 该 inode 是 普通 文件 ， 不 需要 遍历 140 
个 块 , 因为 文件 的 数据 是 一 个 整体 ,存储 数据 时 是 把 数据 挨个 连续 存放 在 块 中 的 ,相当 于 以 all_blocks[0] 一 
all blocks[139] 的 顺序 依次 写 入 ， 不 会 出 现 中 间 某 个 块 地 址 为 空 (0) 的 情况 ， 因 此 在 while 循环 中 可 以 把 
块 地 址 为 0 作为 结束 条 件 。 但 如 果 该 inode 是 目录 的 话 ， 目 录 中 的 数据 是 目录 项 ， 它 们 都 是 单独 的 个 体 ， 
每 一 个 目录 项 都 可 以 单独 操作 。 不久 我 们 就 会 了 解 ， 在 删除 文件 中 有 一 项 工作 就 是 擦 除 目录 项 ， 倘 若 该 目 
录 项 单独 占用 1 个 块 ， 为 节约 块 资源 ， 在 删除 此 类 目录 项 时 我 们 会 回收 目录 项 所 占 的 块 (除了 根 目 录 中 只 
剩 下 一 个 块 的 情况 )， 也 就 是 该 块 地 址 会 被 置 为 0。 该 块 很 少 是 最 后 一 个 可 用 块 ， 大 部 分 情况 下 是 位 于 140 
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个 块 的 中 间 某 个 块 ， 因 此 对 于 目录 要 完整 遍历 140 个 块 。 举 个 例子 ， 假 设 目录 a 中 我 们 顺序 创建 了 90 个 
文件 , 恰好 是 每 30 个 文件 占 1 个 块 , 前 30 个 文件 占用 块 a0, 即 i_sector[0]=a0， 中 间 30 个 文件 占用 块 al， 
即 i_sector[1]=al， 后 30 个 文件 占用 块 a22， 即 i_sector[2]=a2， 这 时 我 们 先 把 中 间 30 个 文件 都 删除 了 ， 原 
本 这 30 个 文件 所 占 的 块 就 要 被 回收 , 因此 出 现 i_sector[1]=0 的 情况 。 为 实现 简单 , 这 里 就 不 单独 判断 inode 
是 目录 ， 还 是 普通 文件 了 ， 一 律 按 最 大 块 数 140 遍历 。 

接 下 来 第 213 一 214 行 是 回收 该 inode 在 inode 位 图 中 所 占用 的 位 ， 依 然 通过 bitmap _set 和 bitmap_sync 
两 步 完成 。 








到 此 我 们 回收 了 inode 位 图 中 的 位 、inode 涉及 到 的 块 ， 前 本 




















j 说 过 了 ，inode 本 身 所 在 的 空间 没 必 要 真正 擦 




















除 ， 因 此 inode 回收 工作 就 结束 了 。 但 为 了 在 功 色 验证 时 让 入 伙 儿 看 得 更 清楚 


























， 下 面 调用 了 inode_ delete 函数 
字 节 的 io_buf 作 为 inode delete 的 参数 ,理由 是 



































把 该 inode 在 inode table 擦 除 。 在 第 220 行 , 我 们 申请 了 1024 字 
函数 inode_delete 中 根据 inode 是 否 跨 扇 区 的 情况 有 可 能 要 读 入 2 个 扇 区 。 





























最 后 再 调用 inode_close(inode to_del) 将 inode 关闭 。 
















































































14.10.2 删除 目录 项 

文件 名 是 以 目录 项 的 形式 存在 的 ， 删除 文件 必须 在 目录 中 将 其 目录 项 擦 除 。 下 面 看 一 下 删除 目录 项 相 
关 的 工作 。 

(1) 在 文件 所 在 的 目录 中 擦 除 该 文件 的 目录 项 ， 使 其 为 0。 

(2) 根 目 录 是 必须 存在 的 ， 它 是 文件 读 写 的 根基 ， 不 应 该 被 清空 ， 它 至 少 要 保留 1 个 块 。 如 果 目 录 项 



































































































































录 项 的 单位 大 小 。 


独占 1 个 块 ， 并 且 该 块 不 是 根 目录 最 后 一 个 块 的 话 ， 将 其 回收 。 
(3) 目录 inode 的 i size 是 目录 项 大 小 的 总 和 和， 因此 还 要 将 i size 减 去 一 个 目 
(4) 目录 inode 改变 后 ， 要 同步 到 硬盘 。 
下 面 我 们 在 dirc 中 增加 函数 delete _dir_entry 完成 这 项 工作 ， 见 代码 14-37。 
代码 14-37 (project/c14/h/fs/dir.c ) 
… 略 
214 /* 把 分 区 part 目录 pdir 中 编号 为 inoqe_no 的 目录 项 删除 */ 























bool delete qir_entry(struct partition* part, \ 
struct 



























































































































































dir* pdir, uint32 七 inode no, void* io pbuf) { 


216 struct inode* dir inode = pdir->inode; 

217 uint32 七 block idx = 0, all blocks[140] = {0}; 

218 /* 收集 目录 全 部 块 地 址 */ 

219 while (block idqx < 12) { 

220 all blocks[block idx] = dir inode->i sectors [block idx]; 

221 block idxt++; 

222 } 

223 if (dir inode->i sectors[12]) { 

224 ide read(part->my disk, dir inode->i sectors[12], all blocks + 12, 1); 

225 } 

226 

227 /* 目录 项 在 存储 时 保证 不 会 跨 扇 区 */ 

228 uint32 七 dir entry size = part->sb->dir _ entry size; 

229 uint32 t dir entrys per sec = (SECTOR SIZE / dir entry size); 
// 每 扇 区 最 大 的 目录 项 数 

230 struct dir entry* dir e = (struct dir entry*)io buf; 

234 struct dir entry* dir entry found = NULL; 

232 uint8 t dir entry idx, dir entry cnt; 

233 bool is dir first block = false; // 目录 的 第 1 个 块 

234 

235 /* 遍历 所 有 块 ， 寻 找 目录 项 */ 

236 block idx = 0; 

237 while (block idx < 140) { 

238 is dir first block = false; 

239 if (all blocks[block idx] == 0) { 

240 block idxt+t+; 

241 continue; 

242 } 
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243 dir entry idx = dir entry cnt = 0; 
244 memset (io buf, 0, SECTOR SIZE); 
245 /* 读 取 扇 区 ， 获 得 目录 项 */ 
246 ide read (Part->my disk, all blocks[block idx], io buf, 1); 
247 
248 /* 遍历 所 有 的 目录 项 ， 
统计 该 扁 区 的 目录 项 数量 及 是 否 有 待 删除 的 目录 项 */ 

249 while (dir entry idqx < dir entrys per _ sec) { 
250 if ((dir e + dir entry idx)->f type != FT UNKNOWN) { 
251 if (!strcmp((dir e + dir entry idx)->filename, ".")) { 
252 is dir first block = true; 
2 } else if (strcmp((dir e + dir entry idx)->filename, ".") && 
254 strcmp((dir e + dir entry idx)->filename, "..")) { 
255 dir entry cnt++; 

// 统计 此 扇 区 内 的 目录 项 个 数 ， 用 来 判断 删除 目录 项 后 是 否 回收 该 扇 区 
256 if ((dir e + dir entry idx)->i no == inode _ no) { 

// 如 果 找 到 此 i 结 点 ， 就 将 其 记录 在 dir entry found 
253. ASSERT (dir entry found == NULL); 

// 确保 目录 中 只 有 一 个 编号 为 inode_no 的 inode 












































































































































































































































































































































































































































// 找到 一 次 后 dir_entry_found 就 不 再 是 NULL 
之 58 dir entry found = dir e + dir entry idx; 
259 /* 找到 后 也 继续 遍历 ， 统 计 总 共 的 目录 项 数 */ 
260 } 
261 } 
262 } 
263 dir entry idxt++; 
264 } 
265 
266 /* 若 此 扇 区 未 找到 该 目录 项 ， 继 续 在 下 个 扇 区 中 找 */ 
267 if (dir entry found == NULL) { 
268 Block :idx++y 
269 continue; 
270 } 
271 
272 /* 在 此 扇 区 中 找到 目录 项 后 ， 
清除 该 目录 项 并 判断 是 否 回收 扇 区 ， 随 后 退出 循环 直接 返回 */ 
之 /3 ASSERT (dir entry cnt >= 1) 7 
274 /* 除 目录 第 1 个 扇 区 外 ， 若 该 扇 区 上 只 有 该 目录 项 自己 ， 
则 将 整个 扇 区 回收 */ 
275 if (dir entry cnt == 1 && !is dir first block) { 
276 /* a 在 块 位 图 中 回收 该 块 */ 
2737 uint32 t block bitmap idx = \ 
all blocks[block idx] - part->sb->data start lba; 
278 bitmap set (&Part->block bitmap, block bitmap idx, 0); 
279 bitmap sync (cur part, block bitmap idx, BLOCK BITMAP); 
280 
281 /* b 将 块 地 址 从 数组 i_sectors 或 索引 表 中 去 掉 */ 
282 if (block idx < 12) 
283 dir inode->i sectors [block idx] = 0; 
284 } else { // 在 一 级 间接 索引 表 中 擦 除 该 间接 块 地 址 
285 /* 先 判断 一 级 间接 索引 表 中 间接 块 的 数量 ， 
如 果 仅 有 这 1 个 间接 块 ， 连 同 间 接 索 引 表 所 在 的 块 一 同 回收 */ 
286 uint32 七 indirect blocks = 0; 
287 uint32 t indirect block idx = 12; 
288 while (indirect block idx < 140) { 
289 if (all blocks[indirect block idx] != 0) { 
290 indirect blocks++，; 
291 } 
292 } 
293 ASSERT (indirect blocks >= 1); // 包括 当前 间接 块 
294 
295 if (indirect blocks > 1) { 
// 间接 索引 表 中 还 包括 其 他 间接 块 ， 仅 在 索引 表 中 擦 除 当 前 这 个 间接 块 地 址 
296 all blocks [block idx] = 0; 
297 idqe_write (Part->my_ disk, \ 
dir. inode~>1i seotors[12|; all BLOockS 于 12, 1}3 
298 } else { // 间接 索引 表 中 就 当前 这 1 个 间接 块 
// 直接 把 间接 索引 表 所 在 的 块 回收 ， 然 后 擦 除 间 接 索 引 表 块 地 址 
299 /* 回收 间接 索引 表 所 在 的 块 */ 
300 block bitmap idx = \ 
dir inode->i sectors[12] - part->sb->data start lba; 
301 bitmap set (&part->block bitmap, block bitmap idx, 0); 
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302 bitmap sync (cur part, block bitmap idx, BLOCK BITMAP ) ; 
303 

304 /* 将 间接 索引 表 地 址 清 0 */ 

305 dir inode->i sectors[12] = 0; 

306 J} 

307 } 

308 } else { // 仅 将 该 目录 项 清空 

309 memset (dir entry found, 0, dir entry size); 

310 ide write (part->my disk, all blocks[block idx], io buf, 1); 
3T1 } 

312 

313 /* 更 新 i 结 点 信息 并 同步 到 硬盘 */ 

314 ASSERT (dir inode->i size >= dir entry size); 

Sls dir inode->i size -= dir entry size; 

S16 memset (io buf, 0, SECTOR SIZE * 2) 7 

2 inode sync(part, dir inode, io buf); 

318 

3 上 9 return true; 

320 } 

321/* 所 有 块 中 未 找到 则 返回 false， 出 现 这 种 情况 应 该 是 serarch file 出 错 了 */ 
322 return false; 

323. 十 














delete dir_entry 接受 4 个 参数 ， 分 区 part、 目 录 pdir、inode 编号 inode no、 缓冲 区 io_buf， 功 能 是 把 
分 区 part 目录 pdir 中 编号 为 inode_no 的 目录 项 删除 。 

代码 第 218 一 225 行 收集 目录 的 inode 占用 的 所 有 块 ， 接 下 来 在 第 235 一 结束 ， 开 始 遍历 所 有 块 ， 在 其 
中 查找 目录 项 。 

变量 is_dir first_block 表示 当前 的 块 〈 待 删除 的 目录 项 所 在 的 块 ) 是否 是 目录 中 最 初 的 那个 块 ， 若 在 

目录 中 创建 很 多 文件 或 子 目录 后 ， 目 录 会 扩展 到 多 个 块 中 。 根 目录 最 初 的 块 是 在 格式 化 分 区 时 创建 的 ， 目 
录 “.” 和 “..” 都 在 这 个 块 中 ， 因 此 目录 项 的 名 称 若 为 “.” 该 块 便 是 目录 的 最 初 的 块 。 不 禁 您 要 问 了 ， 
判断 它 有 什么 用 呢 ? 原因 是 : 当 删 除 一 个 目录 项 时 ， 若 该 目录 项 所 在 的 块 上 没有 其 他 目录 项 了 , 或 者 是 除 
了 “.” 和 “..” 之 外 没有 其 他 目录 项 ， 我 们 就 将 该 块 回 收 了 ， 否 则 空闲 着 一 个 块 不 是 浪费 吗 。 
第 243 一 246 行 读 取 目录 的 块 ， 获 取 该 块 中 的 目录 项 。 接 着 在 第 248 一 264 行 开始 遍历 该 块 ， 寻 找 待 删 
除 的 目录 项 。 目 录 项 成 员 f type 的 值 只 要 不 是 FT_UNKNOWN 就 表示 该 目录 项 有 意义 ， 第 251 行 ， 若 判 
断 出 目录 项 的 filename 为 ”.”, 就 表示 当前 的 块 是 目录 最 初 的 块 , 因此 将 变量 is_dir first_block 置 为 true。 
否则 统计 目录 中 除 “.” 和 “..” 之 外 的 所 有 目录 项 ， 目 录 项 总 数 存储 在 变量 dir_entry_cnt 中 。 统 计 目 录 项 
个 数 的 目的 是 判断 删除 目录 项 后 是 否 回收 该 块 ， 理 由 是 若 dir_entry_cnt 为 1， 就 表示 该 目录 项 独占 一 
个 块 ， 后 面 会 根据 是 否 为 目录 的 最 初 块 判断 是 否 将 该 块 回收 。 

第 256 行 判断 ， 如 果 目 录 项 与 待 删除 的 inode 编号 相同 ， 这 说 明 找 到 了 ， 用 指针 变量 dir_entry_found 
记录 其 在 io_buf 中 的 地 址 ， 即 dir e+ dir entry idx， 后 面 会 用 它 来 擦 除 日 录 项 。 
第 267 行 判 断 ， 若 此 块 中 没 找到 该 目录 项 ， 继 续 下 一 轮 循环 查找 。 如 果 找 到 了 ， 就 准备 擦 除 该 目录 项 
并 判断 是 否 回收 目录 项 所 在 的 块 。 
第 275 行 ， 如 果 当 前 块 中 目录 项 个 数 dir_entry_cnt 为 1， 并 且 当 前 块 并 不 是 根 目录 最 初 的 那个 块 ， 那 么 
就 不 需要 探 除 目录 项 ， 把 当前 块 直接 回收 一 了 百 了 。 工 作 分 为 两 部 分 ， 先 在 第 277 一 279 行 在 块 位 图 中 回收 
当前 块 ， 然 后 将 块 地 址 从 数组 i_sectors 或 索引 表 中 去 掉 。 这 部 分 工作 涉及 到 索引 表 中 的 间接 块 ， 因 此 有 可 能 
涉及 到 索引 表 所 在 块 的 回收 。 第 282 行 判断 ， 当 前 块 若 是 直接 块 ， 就 在 i_sectors 数组 中 将 相应 位 置 为 0， 这 
是 最 简单 的 情况 。 否 则 当前 块 是 间接 块 ， 先 判断 一 级 间接 索引 表 统 计 间 接 块 的 数量 ， 对 应 的 代码 是 第 286 一 
293 行 。 第 295 行 判 断 如 果 表 中 有 多 个 间接 块 ， 间 接 索 引 表 不 能 回收 ， 就 在 第 296 一 297 行将 该 间接 块 地 址 
清 0， 同 步 到 硬盘 上 的 一 级 间接 块 索引 表 中 。 
第 298 行 ， 如 果 表 中 仅 有 这 1 个 间接 块 ， 就 在 第 300 一 302 行 ， 把 间接 索引 表 所 在 的 块 一 同 回收 ， 随 
后 把 i_sector[12] 置 为 0， 擦 除 间 接 块 索引 表 地 址 。 

若 275 行 判断 不 成 立 ,也 就 是 如 果 当 前 块 中 的 目录 项 个 数 为 多 个 或 者 当前 块 是 目录 的 最 初 块 ， 此 种 情 
况 不 能 将 块 回收 ， 直 接 执行 第 309~310 行 ， 擦 除 目录 项 ， 然 后 同步 到 硬盘 。 
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最 后 在 第 314~317 行 ， 将 目 





如 果 


好 啦 ， 本 节 到 这 就 结束 了 ， 咀 们 离 文 件 删除 的 目标 不 远 了 ， 大 伙 儿 加 油 。 


14.10.3 ”实现 sys_unlink 与 功能 验证 






























































录 所 有 的 块 中 都 未 找到 待 删除 的 目录 项 ， 就 返回 false。 















































录 的 inode->i size 减少 一 个 目录 项 大 小 ， 然 后 同步 inode 到 硬盘 ， 返 




















前 面 基 础 搭 的 差不多 了 ， 终 于 到 了 删除 文件 的 环节 ，Linux 下 删除 文件 是 用 的 unlink 系统 
原型 是 “int unlink(const char *pathname)” 成 功 删 除 文 件 返 回 0， 否 则 返回 -1。 咱 们 还 是 先 实 现 其 内 核 
部 分 一 一 sys_unlink， 见 代码 14-38。 











… 略 
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99 } 
… 略 


Re 





函数 sys_unlink 接受 1 个 参数 ， 文 件 绝对 路 径 名 pathname， 删 除 文件 〈 非 目录 )， 成 功 返 回 























代码 14-38 (project/c14/h/fs/fs.c ) 


























50 /* 删除 文件 ( 非 目录 )， 成 功 返回 0， 失 败 返 回 -1 */ 
51 int32 t sys unlink (const char* pathname) { 














ASSERT (strlen (pathname) < MAX PATH LEN); 


/* 先 检 查 待 删除 的 文件 是 否 存在 */ 
struct path search record searched record; 
memset (&searched record, 0, sizeof (struct path search record)); 

















int inode no = search file(pathname, &searched record); 
ASSERT (inode no != 0);，} 
if (inode no == -1) { 


printk ("file %s not found!\n", pathname); 
dir close(searched record.parent dir); 
return -1; 
} 
if (searched record.file type == FT DIRECTORY) { 
printk("can‘t delete a direcotry with unlink(), \ 
use rmdir() to instead\n"); 
dir close(searched record.parent dir); 
return -1; 


} 




















/* 检查 是 否 在 已 打开 文件 列表 ( 文件 表 ) 中 */ 
uint32 t file idx = 0); 
while (file idx < MAX FILE OPEN) { 








if (file table[file idx] .fd inode != NULL &&\ 
(uint32 t)inode no == file table[file idx] .fd inode->i no) { 
break; 


} 
file idxt+t+; 
} 
if (file idx < MAX FILE OPEN) { 
dir close(searched record.parent dir); 
printk ("file %s is in use, not allow to delete!\n", pathname); 
return -1; 
} 
ASSERT (file idx == MAX FILE OPEN); 























/* 为 delete dir entry 申请 缓冲 区 */ 

void* io buf = sys malloc(SECTOR SIZE + SECTOR SIZE); 

if (io buf == NULL) { 
dir close(searched record.parent dir); 
printk("sys unlink: malloc for io buf failed\n"); 
return -1; 





} 


struct dir* parent dir = searched record.parent dir; 
delete dir entry(cur part, parent dir, inode no, io buf); 
inode release (cur part, inode no); 

sys_free (io buf); 

dir close(searched record.parent dir); 


return 0; // 成 功 删 除 文件 








周 用 ， 其 





0， 失 败 
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第 14 章 文件 系统 
返回 -1。 
因为 代码 中 大 部 分 方法 及 套路 都 是 类 似 的 ， 所 以 下 面 的 介绍 就 不 细致 到 各 行 了 。 第 455 一 463 行 声明 
path_search record 结构 并 调用 search file 检查 文件 pathname 是 否 存在 ， 如 果 不 存在 ， 则 输出 提示 并 返回 -1。 若 
只 存在 同名 的 目录 ， 在 第 464 一 467 行 提示 不 能 用 unlink 删除 目录 ， 只 能 用 rmdir 函数 〈 将 来 实现 ) 并 返回 -1。 
第 470 一 477 行 在 文件 表 中 检索 待 删除 的 文件 ， 如 果 文 件 在 文件 表 中 存在 ， 这 说 明 该 文件 正 被 打开 ， 
不 能 删除 。 第 478 一 481 行 判断 如 果 文 件 已 位 于 文件 表 中 被 打开 了 ， 输 出 提示 该 文件 正 处 于 使 用 中 ， 不 多 
许 删除 ， 返 回 -1。 
第 485 一 491 行为 即将 调用 的 delete_dir_entry 函数 申请 缓冲 区 ， 这 里 为 其 申请 的 缓冲 区 大 小 是 两 个 扇 区 。 
下 面 调 用 函数 delete_ dir_entry 删除 目录 项 ,调用 inode release 释放 inode, 调用 dir close 关闭 pathname 
所 在 的 目录 后 ， 返 回 0， 函 数 结束 。 
































sys_unlink 完成 了 ， 


代码 14-39 


19 int main(void) { 




















下 面 进行 功能 测试 ， 


在 main.c 中 添加 测试 代码 ， 如 代码 14-39 所 示 。 





( project/c14/h/kernel/main.c ) 










































































20 put_str("I am kernel\n"); 

21 init all(); 

22 process execute(u prog a, "u prog a"); 

23 process execute(u prog b, "u prog b"); 

24 thread start ("k thread a", 31, k thread a, "I am thread a"); 

之 5 thread start ("k thread b", 31, k thread b, "I am thread b") ; 

26 printf("/filel delete %s!l\n", sys unlink("/filel") == 0 ? "done" WEaTLL")}S 

27 while(1); 

28 return 0; 

29 } 

… 略 

第 26 行 代码 是 添加 的 sys_unlink 调用 ， 如 果 删 除 文件 Milel 成 功 就 输出 “/filel delete done! \m”， 否 则 

输出 “/filel delete fail! m”。 在 程序 执行 之 前 ， 为 方便 对 比 文件 删除 的 效果 ， 咱 们 先 查 看 下 文件 相关 的 元 
信息 。 图 14-18 中 显示 了 块 位 图 扇 区 地 址 是 0x41，inode 位 图 扇 区 地 址 是 0x49，inode table 地 址 是 0x4a， 
根 目录 扇 区 地 址 是 0x2aa。 咱 们 依次 查看 下 它们 的 状态 ， 如 图 14-29 所 示 。 
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文件 元 信息 删除 文件 前 ) 





























块 位 图 中 的 值 是 3， 这 说 明 分 配 了 2 个 块 ， 一 个 分 配给 了 根 目 
的 i_ sectors[0]。 
inode 位 图 























FP 的 值 也 是 3， 同样 是 分 别 分 配给 了 根 目录 和 /filel 














录 的 i_sectors[0]， 男 


的 inode。 


























匡 的 部 分 是 第 2 个 inode 以 后 的 内 容 ， 具 体 鲜 


的 目录 项 。 





inode table 中 面相 
根 目录 中 的 框框 是 /filel 


下 面 执 行程 序 ， 运 行 结果 如 图 14-30 所 示 。 
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14-30 ”bochs 运行 结果 

















中 最 下 行 输出 “/filel delete doneln”， 下 面 验 订 





[work@localhost h]$ sh ~/tool/xxd.sh ~/my_workspace/bochs/hd80M.img 
0008200: 91 90 00 90 90 00 90 900 90 90 90 00 90 00 00 96 .……. 
0008210: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 
* 
00083f0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 
[work@localhost h]$ sh ~/tool/xxd.sh ~/my_workspace/bochs/hd80M 
0009200: 01 00 00 00 00 00 00 00 00 00 00 00 00 
0009210: 00 00 00 00 00 00 00 00 00 00 00 00 00 ... 

00 
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S ss 
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图 14-31 所 示 
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和 图 14-29 对 比 ， 14-31 中 ， 块 位 
inode 也 被 回收 了 。inode table 和 根 目录 中 也 没有 相应 的 信 ， 
的 inode 是 被 函数 inode_delete 擦 除 的 ， 其 实 没 必要 擦 除 该 mode， 
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们 让 文件 系统 支持 目录 ， 其 实 目录 的 实现 并 不 
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文件 元 信息 删除 文件 后 ) 


图 和 inode 位 图 都 由 3 变 成 了 1， 这 说 明 filel 所 
了 ， 符 合 预 期 。 顺 便 提 一 句 ， 
是 为 了 此 处 的 调试 。 
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前 有 介绍 过 ， 不 下 


14.11 创建 目录 
一 个 分 配给 了 /filel 
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占 的 块 被 回收 ， 
inode table 中 /filel 

















任 ， 难 的 是 如 何 使 文人 























也 恰恰 是 Linux 的 魅力 所 在 一 一 高 效率 ! 咱们 还 是 本 着 学 习 的 精 4 
录 实 现 从 无 到 有 。 











， 效 率 、 优 化 是 以 后 的 事 ， 咀 们 先 提 


F 系 统 更 加 高 效 ， 这 
巴 目 
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14.11.1 实现 sys_mkdir 创建 目录 

Linux 用 mkdir 函数 创建 目录 ， 还 有 一 个 同名 的 mkdir 命令 也 用 来 创建 目录 ， 原 理 上 都 是 一 回 事 ， 只 
是 一 个 是 系统 调用 ， 男 一 个 是 利用 此 系统 调用 实现 的 可 执行 程序 。 

先 看 下 mkdir 的 原型 :“int mkdir(const char *pathname, mode tmode)” 其 中 ，pathname 是 竺 创建 的 目 
录 名 ，mode 是 所 创建 目录 的 权限 ， 成 功 返 回 0， 失 败 返 回 -1。 如 果 是 头 一 次 接触 Linux 的 同学 ， 有 可 能 
不 太 了 解 文件 的 “权限 ” 这 个 权限 是 指 用 户 、 组 内 成 员 、 其 他 成 员 对 目录 的 读 、 写 、 执 行 能 力 的 设置 ， 
不 清楚 也 没关系 ， 因 为 权限 管理 涉及 到 用 户 管理 等 周边 功能 ， 工 作 量 有 点 庞大 ， 而 且 这 些 是 有 关 安 全 方面 
的 内 容 ， 已 不 属于 操作 系统 基本 原理 的 范畴 ， 违 背 了 本 书 的 初 心 ， 最 要 命 的 是 ， 小 弟 我 能 力 实在 有 限 ， 哈 
哈 ， 刁 愧 。 所 以 咱们 的 mkdir 就 不 支持 权限 参数 mode 了 。 

咳 咳 ， 下 面 说 正事 ， 创 建 目录 所 涉及 的 工作 包括 。 

(1) 确认 待 创建 的 新 目录 在 文件 系统 上 不 存在 。 

(2) 为 新 目录 创建 inode。 

(3) 为 新 目录 分 配 1 个 块 存储 该 目录 中 的 目录 项 。 

(4) 在 新 目录 中 创建 两 个 目录 项 “.” 和 “..” 这 是 每 个 目录 都 必须 存在 的 两 个 目录 项 。 

(5) 在 新 目录 的 父 目录 中 添加 新 目录 的 目录 项 。 

(6) 将 以 上 资源 的 变更 同步 到 硬盘 。 

下 面 我 们 在 mkdir 的 内 核 部 分 一 一 sys_mkdir 中 实现 以 上 功能 ， 见 代码 14-40。 



































































































































































































































































































































代码 14-40 (project/c14/i/fs/fs.c ) 

… 略 
501 /* 创建 目录 pathname， 成 功 返 回 0， 失 败 返 回 -1 */ 
502 int32 t sys mkdirl(const char* pathname) { 
503 uint8 t rollback step = 0; // 操作 失败 时 回 滚 各 资源 状态 
504 void* io buf = sys malloc(SECTOR SIZE * 2); 
905 if (io buf == NULL) { 
506 printk("sys mkdir: sys malloc for io buf failed\n"); 
7 return -1; 
508 } 
509 
5310 struct path search record searched record; 
入 二 二 memset (&searched record, 0, sizeof(struct path search record)); 
5t2 int inode no = -1; 
43 inode no = search file(pathname, &searched record); 
514 if (inode no != -1) { // 如 果 找 到 了 同名 目录 或 文件 ， 失 败 返 下 
3 printk("sys mkdir: file or directory %s exist!\n", pathname); 
516 rollback step = 1; 
wl goto rollback; 
518 } else { 

// 若 未 找到 ， 也 要 判断 是 在 最 终 目 录 没 找到 ， 还 是 某 个 中 间 目 录 不 存在 
和 uint32 t pathname depth = path depth cnt ((char*)pathname); 
520 uint32 t path searched depth =\ 

path depth cnt (searched record.searched path);} 
521 /* 先 判断 是 否 把 pathname 的 各 层 目录 都 访问 到 了 ， 

即 是 否 在 某 个 中 间 目 录 就 失败 了 */ 
522 if (pathname depth != path searched depth) { 
// 说 明 并 没有 访问 到 全 部 的 路 径 ， 某 个 中 间 目 录 是 不 存在 的 
S23 printk("sys mkdir: cannot access %s: Not a directory, 
subpath %s is‘t exist\n", pathname, 
searched record.searched path); 
524 rollback step = 1; 
525 goto rollback; 
526 } 
527 } 
528 
529 struct dir* parent dir = searched record.parent dir; 
530 /* 目录 名 称 后 可 能 会 有 字符 '/'， 
所 以 最 好 直 searched record.searched path, 无 '/' */ 

531 char* dirname = strrchr(searched record.searched path, '/') + 1; 
532 


666 








// 


inode no = inode bitmap alloc(cur part); 

if (inode no == -1) { 
printk("sys mkdir: allocate inode failed\n"); 
rollback step = 1; 
goto rollback; 

} 


struct inode new dir inode; 
inode init (inode no，&new dir inode); // 初始 化 i 结 点 


uint32 t block bitmap idx = 0; 
// 用 来 记录 block 对 应 于 block_bitmap 中 的 索引 
int32 七 block lba = -1; 
/* 为 目录 分 配 一 个 块 ， 用 来 写 入 目录 .和 .. */ 
block lba = block bitmap alloc(cur part); 
if (block lba == -1) { 
printk ("sys mkdir: block bitmap alloc 
for create directory failed\n"); 
rollback step = 2; 
goto rollback; 







































































} 

new dir inode.i sectors[0] = block lba; 

/* 每 分 配 一 个 块 就 将 位 图 同步 到 硬盘 */ 

block bitmap idx = block lba - cur part->sb->data start lba; 
ASSERT (block bitmap idx != 0); 

bitmap_ sync (cur part, block bitmap idx, BLOCK BITMAP); 










































































/* 将 当前 目录 的 目录 项 ' .' 和 '..' 写 入 目录 */ 
memset (io buf, 0, SECTOR SIZE * 2); // 清空 io_buf 
struct dir entry* p de = (struct dir entry*)io buf; 














/* 初始 化 当前 目录 "." */ 

memcpy (p_de->filename, "~.", 1); 
p de->i no = inode no;) 

p_de->f type = FT DIRECTORY; 


























p_det++; 
/* 初始 化 当前 目录 ".." */ 
memcpy (p_de->filename, "~..", 2); 


p_de->i no = parent dir->inode->i no; 
p_de->f type = FT DIRECTORY; 
ide writel(cur part->my disk, new dir inode.i sectors[0], io buf, 


new dir inode.i size = 2 * cur part->sb->dir entry size; 


























/* 在 父 目 录 中 添加 自己 的 目录 项 */ 
struct dir entry new dir entry; 
memset (&new dir entry, 0, sizeof (struct dir entry)); 
create dir entry (dirname, inode no, \ 
FT DIRECTORY, &new dir entry); 
memset (io buf, 0, SECTOR SIZE * 2); // 清空 io_buf 
if (!sync dir entry(parent dir, &new dir entry io buf)) { 
sync_ dir entry 中 将 block bitmap 通过 bitmap_sync 同步 到 硬盘 
printk("sys mkdir: sync dir entry to disk failed!\n"); 
rollback step = 2; 
goto rollback; 


























} 








/* 父 目录 的 inode 同步 到 硬盘 */ 
memset (io buf, 0, SECTOR SIZE * 2); 
inode sync(cur part, parent dir->inode, io buf); 


























/* 将 新 创建 目录 的 inode 同步 到 硬盘 */ 
memset (io buf, 0, SECTOR SIZE * 2); 
inode sync(cur part, &new dir inode, io buf); 























/* 将 inode 位 图 同步 到 硬盘 */ 
bitmap_ sync (cur part, inode no INODE BITMAP); 


sys_free (io buf); 


/* 关闭 所 创 寻 
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601 dir close(searched record.parent dir); 
602 return 0; 
603 
604 /* 创 建文 件 或 创建 相关 的 多 个 资源 ， 
条 某 步 失 收 刚 会 执行 到 下 面 的 回 滚 步骤 */ 
605 rollback: // 因为 某 步 又 操作 失败 而 回 深 
606 Switch (rollback step) { 
607 case 2: 
608 bitmap set (&cur part->inode bitmap, inode no, 0) 
// ee inode 创建 失败 ， 之 前 位 图 中 分 配 的 inode_no 6 也 要 恢复 
609 case 1: 
610 /* 关闭 所 创建 目录 的 父 目录 */ 
611 dir close(searched record.parent dir); 
612 break; 
613 } 
614 sys_free(io buf); 
615 return -1; 
616 } 
… 略 


函数 sys_mkdir 支持 1 个 参数 ， 路 径 名 pathname， 功 能 是 创建 目录 pathname， 成 功 返 回 
by 是 由 多 个 步 又 完成 的 ， 
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在 创建 目录 之 前 要 判断 文件 
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返回 -1。 











录 的 工作 是 个 
中 某 个 步骤 失败 ， 必 须 将 之 前 完成 的 操作 回 滚 到 2 
请 了 2 扇 区 大 小 的 缓冲 区 给 
上 是 否 已 经 有 了 同名 的 文件 ,无 论 是 目录 文件 ， 
FE 同名 的 文件 ， 第 $10 一 $13 行 调用 search_file 检索 pathname， 如 果 找 到 同名 文件 pathname， 
第 514 行 判断 search_ file 
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前 的 状态 。 在 函数 开头 定义 的 
io_buf, 后 面 很 多 操作 都 要 用 到 它 。 
还 是 普通 文件 ， 同 












































的 返回 值 ， 若 不 等 于 -1 表示 同 


rollback_step 置 为 1， 跳 转 到 rollback 处 执行 回 深 。 大 伙 儿 不 妨 移 步 到 604 
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况 ， 这 里 是 用 pathname 的 路 径 深度 pathname _ depth 和 已 搜索 过 的 路 径 深度 path_searched depth 比较 ， 
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等 (确切 地 说 ， 若 pathname depth 大 于 path searched depth) 则 表示 某 个 中 间 目 录 不 存在 ， 该 “中 间 目 录 ?” 


是 searched record.searched path 。 


第 529 行 用 指针 parent dir 指向 被 创建 目 
也 就 是 最 终 创 建 的 
的 地 址 〈 注 意 ， 是 } 
] inode bitmap alloc 在 inode 位 图 ! 
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第 $59 一 572 行 有 有 
目录 项 。 第 574 行 初始 化 目录 
接 下 来 要 在 父 目录 中 添加 自 





行 的 代码 完成 的 。 其 中 create_dir entry 只 是 初始 化 日 





的 i_sectors[0] 中 ， 此 块 用 来 存储 
FE io_buf 中 新 建 目 录 项 “.” 和 “..”3 











己 的 
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录 名 ， 其 中 strrchr 函数 是 在 searched record.searched path 中 从 后 往 前 获 
也 址 ， 不 是 字符 下 标 )， 如 旬 若 按照 第 531 行 的 处 理 


分 配 inode， 如 果 返 回 值 为 -1， 将 rollback step 置 为 1， 


录 新 建 1 个 new_dir inode 并 初始 化 。 
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fF 同步 到 硬盘 ， 
的 尺寸 ， 即 new_dir inode.i_size 等 于 2 个 目录 项 大 小 。 

录 项 , 即 在 parent dir 中 添加 dimame 的 目录 项 ,这 是 由 第 S77 一 5$84 
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“sync_dir entry(parent dir, &new_dir entry, io_buf” 才 是 真正 把 dirname 
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以 后 开 
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图 到 硬盘 。 
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取 pathname 的 最 后 一 级 目录 名 ， 
前 获取 字符 /第 一 次 出 现 
录 名 dirmame 指向 b。 



























































第 $43 一 $$2 行为 目录 分 配 1 个 块 并 将 块 地 
第 $$4 一 556 行将 块 位 图 同步 到 硬盘 。 
这 样 目 录 pathname 中 便 有 了 两 个 


























， 下 面 调用 的 函数 
的 目录 项 new_dir_entry 写 入 父 目 


























录 searched record.parent dir， 随 后 返 


录 inode 和 新 目录 inode 到 硬盘 ， 第 596 行 同 








I 








0， 创 建 目 























14.11.2 ”创建 目录 功能 验证 


上 市 中 
与 目录 的 差 












































我 们 己 经 把 /filel 市 除 了 » 为 了 展 人 外 普通 文件 [orkSiocoalthost i]$ sh ~/tool/xxd.sh ph img 349184 512 

















AH 








别 ， 我 悄悄 把 /filel 又 恢复 了 ， 因 此 下 面 的 测 

















试 相当 于 穿 























码 14-41 所 示 


… 略 
19. nt 
… 略 


第 26 一 








请 大 伙 儿 知晓 
下 面 在 main.c 中 加 入 创建 目录 的 测试 代码 ， 如 代 


























越 回 了 上 节 之 前 , 根 目 录 下 仅 有 /flel 的 情况 ， 
目前 根 目 录 下 的 情况 如 图 14-32 所 示 。 


Rn 




















































































































录 前 根 目录 中 的 目录 项 

















示 。 
代码 14-41 (project/c14/i/kernel/main.c ) 


main(void) { 


printf("/dirl/subdirl create %s!\n", \ 
sys mkdir("/dirl/subdir1l") == 0 ? "done"™" : "fail"); 
printf("/dirl create %s!l\n", sys mkdir("/dirl") == 0 ? "done" 
printf("now, /dirl/subdirl create $s!l\n", \ 
sys mkdir("/dirl/subdir1l") == 0 ? "done"™" : "fail"); 
int fd = sys_ open("/dirl/subdirl/file2", O_CREAT |O_RDWR); 
主 下 《下 三 二 于 
printf("/dirl/subdirl/file2 create done!\n") 
sys write(fd, "Catch me if you can!l\n", 21); 
sys_lseek (fd, 0, SEEK SET);} 
char buf[32] = {0}; 
sys_read (fd, buf, 21); 
printf("/dirl/subdirl/file2 says:\ng%s", buf); 
sys_close (fd) ; 
} 
while(1); 
return 0; 





38 行 是 我 们 新 加 的 测试 代码 ， 第 26 行 想 创建 目录 “/dirl/subdirl ”。 











"failn) ; 





目前 





没有 目录 “/dir1”， 


























此 直接 创建 “/dirl/subdir1” 会 失败 。 第 27 行 先 创建 目录 “/dir1”， 第 28 行 重新 创建 目录 “/dirl/subdirl ”。 



































第 29 行 在 





























中 





me if you can!n”。 第 3$ 一 36 行将 其 读 出 并 打印 。 
如 图 14-33 所 示 是 运行 结果 。 














图 中 横 











Bochs x86 emulator, http://bochs.sourceforge.net/ 









































cnt :OQx3AD1 
+ QOx?5E1 
t:Oxh521 


prog_a malloc addr : 
prog_b malloc addr 
thread_a malloc addr : 
thread b malloc addr : 
sys_mkdir: can t acces iri/subdir1, subpath air1 is t exist 
l/subdir1 create 
reate done?! 
， /diril/subdir1 create done! 
g file 
ubdir1/file2 create done! 


ubdir1/file2 says: 
atch me if you cant 


IPS: 27.842M jun aps scRL lhn:o-nhn:o-s| | 1 1 | 


4 图 14-33 ”目录 创建 


















































线 以 下 的 部 分 是 本 次 测试 代码 相关 的 输出 ， 功 能 符合 预期 ， 其 








录 “/mdirl/subdir1” 下 创建 文件 “file2”。 第 32 行 往 文件 “/dirl/subdirl/file2” 中 写 数 据 “Catch 


0 TL ey 
.ONFIC 


“sys_ mkdir:can’t access 
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/dirl/subdirl, subpath /dirl is*t exist” 是 sys_ mkdir 函数 的 输出 ， 提 示 父 目录 “/dir1” 不 存在 。“creating file” 
是 sys_open 的 输出 ， 以 后 我 们 会 把 此 类 提示 去 掉 ， 请 您 提前 知晓 。 
下 面 看 下 相关 文件 在 硬盘 上 的 结果 ， 先 看 下 根 目录 的 目录 项 ， 如 图 14-34 所 示 。 


e/bochs/hd80M. img 349184 512 
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4 图 14-34 ”创建 目录 后 根 目录 中 的 目录 项 


对 比 图 14-32 创建 dirl 前 的 根 目录 , 图 14-34 中 多 了 目录 dirl， 其 中 标 下 画 线 的 部 分 是 dirl 的 目录 项 。 
第 一 个 下 画 线 是 目录 项 的 flename， 第 二 个 下 画 线 标 出 的 02 是 inode 编号 ， 第 三 个 下 画 线 标 出 的 02 是 文 
件 类 型 ， 即 FT_DIRECTORY， 这 说 明 dirl 是 目录 。 下 面 我 们 到 inode table 中 查看 第 02 个 inode 的 信息 ， 
如 图 14-35 所 示 。 
















































































































































































[worketocathost i]$ sh ~/tool/xxd. 
: 00 00 00 00 60 00 00 00 
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A 图 14-35 ”inode_table 中 的 inode 




















图 中 第 一 个 框框 中 ， 上 面 的 “02 00 00 00” 是 dirl 的 i no， 即 inode 编号 ， 下 面 的 “AC 02 0000” 是 
i_sectors[0] 的 值 ， 这 说 明 dirl 中 的 目录 项 在 扇 区 0x2ac 处 。 在 这 两 个 数 之 间 的 三 组 4 字 节 数据 ， 分 别 是 i size、 
i open_cnts 和 write_ deny。 下 面 看 地 址 0x2ac 处 的 数据 ， 如 图 14-36 所 示 。 
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[work@locali 

















4 图 14-36 “/dir1” 中 的 目录 项 


14-36 中 方 框 的 内 容 分 别 是 “.” 和 “..” 的 目录 项 。 下 面 标 下 男 线 的 部 分 是 subdirl 的 目录 项 。 第 一 
个 长 下 画 线 是 目录 项 的 flename， 值 为 subdirl 。 第 二 个 下 画 线 的 值 是 03， 这 是 inode 编号 ， 其 值 为 3， 第 
三 个 下 画 线 是 文件 类 型 , 其 值 为 02, 即 FT_DIRECTORY 。 在 图 14-35 的 第 二 个 方 框 中 的 是 subdirl 的 inode 
的 部 分 信息 ， 该 方 框 中 上 面 的 是 inode 编号 ， 下 面 的 是 i_sectors[0]， 其 值 为 0x2ad， 这 说 明 subdirl 的 目录 
项 在 扇 区 0x2ad 处 ， 继 续 追 踪 。 

14-37 中 的 方 框 分 别 是 “.” 和 “..” 的 目录 项 ， 下 面 下 夯 线 标 出 的 是 file2 的 目录 项 ， 其 中 的 04 是 
inode 编号 , 01 是 文件 类 型 ， DF FT_REGULAR, 这 说 明 file2 是 普通 文件 。 在 图 14-35 中 第 三 个 方 框 是 file2 
的 inode 的 部 分 信息 ， 其 i_sector[0] 的 值 为 0x2ae， 继 续 追 踪 。 
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[work@localhost i]$ sh ~/tool/calculator,sh 0x2ad*512 d 

350720 

[work@localhost i]$ sh ~/tool/xxd.sh ~/my_workspace/bochs/hd86M.img 350720 512 
0055a00: “8 6% 


0055a30: 
0055a40: 04 
0055a50: 00 


* 


00 
00 
0055bf0: 00 00 00 
$ 
冬 | 





[work@localhost 




















妈 14-37 “/dir1/subdir1” 的 目录 项 


[| 

351232 

[work@localhost i]$ sh ~/tool/xxd.sh ~/my_workspace/bochs/hd86M.img 351232 512 
0055c00: 43 61 74 63 68 20 60 65 20 69 66 20 79 6F 75 20 Catch me if you 














来 


0055df0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 
[work@localhost i]$ 


图 14-38 “/dir1/subdir1/file2” 的 内 容 
14-38 是 新 创建 的 文件 “/dirl/subdir1/file2” 的 内 容 ， 真 不 容易 ， 历 经 干 辛 万 苦 终 于 抓 到 了 它 。 
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本 节 咀 们 要 实现 目录 的 读 取 ， 先 从 打开 目录 开始 。 























14.12.1 打开 目录 和 关闭 目录 

遍历 目录 就 是 读 取 目 录 中 所 有 的 目录 项 ， 在 遍历 之 前 必须 要 先 把 目录 打开 ， 之 后 还 需要 把 目录 关闭 。 
Linux 中 分 别 用 函数 opendir 和 closedir 完成 目录 打开 和 关闭 ， 原 型 分 别 是 : 
| DIR *opendir (const char *name) 和 int closedir (DIR *dirp); 

咱们 模仿 这 两 个 接口 实现 自己 的 版 本 。 还 是 先 实现 opendir 和 closedir 的 内 核 部 分 
sys_closedir， 它 们 定义 在 fs.c 中 ， 见 代码 14-42。 


























































































































sys_opendir 和 























代码 14-42 (project/c14/j/fs/fs.c ) 






























































































































































. . . 略 
618 /* 目录 打开 成 功 后 返回 目录 指针 ， 失 败 返 回 NULL */ 
619 struct dir* Sys_opendqir (Const char* name) { 
620 ASSERT (strlen (name) < MAX PATH LEN); 
621 /* 如 果 是 根 目 录 '/'， 直 接 返 回 &groot dir */ 
622 if (name[0] == '/' && (name[1] == 0 || name[0] == '.')) { 
623 return &root dir; 
624 } 
625 
626 /* 先 检查 待 打 开 的 目录 是 否 存 在 */ 
627 struct path search record searched record; 
628 memset (&searched record, 0, sizeof(struct path search record)); 
629 int inode no = search file(name, &searched record); 
630 struct dir* ret = NULL; 
631 if (inode no == -1) { // 如 果 找 不 到 目录 ， 提 示 不 存在 的 路 径 
632 printk("In %s, sub path %s not exist\n", \ 
name, searched record.searched path); 
633 } else { 
634 if (searched record.file type == FT REGULAR) { 
635 printk("%s is regular file!l\n", name); 
636 } else if (searched record.file type == FT DIRECTORY) { 
637 ret = dir open(cur part, inode no); 
638 } 
639 } 
640 dir close(searched record.parent dir); 
641 return ret; 
642 } 
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643 
644 /* 成 功 关 闭 目录 p_dir 返回 0， 失败 返 回 -1 */ 
645 int32 tt Sve.cloasedir (Struet ;dir* dir) 半 
646 int32 t ret = -1; 
647 if (dir != NULL) { 
648 dir close(dir); 
649 ret = 0; 
650 } 
654 return ret; 
652 } 

. . 略 

sys_opendir 接受 一 个 参数 name， 功 能 是 打开 目录 name， 成 功 后 返 匠 






























































目录 指针 ， 
根 目 录 的 形式 有 :“/”“/.”“/..” 当然 按理 说 “//. 六 “/./.” 等 都 能 够 表示 根 目 录 ， 但 毕竟 实 属 “ 罕 














失败 返回 NULL。 






































见 ” 因此 和 暂 不 考虑 I 第 622 行 判 断 打开 的 目录 是 否 是 根 目录 ， 如 果 是 就 直接 把 根 目 录 地 址 &root_dir 



























































返回 ， 这 里 是 简单 处 理 “/.” 和 “/..” 的 情况 。 
































打开 




















录 之 前 要 确认 | 录 存 在 ， 否 则 失败 返回 ， 因 此 第 627~629 行 通过 search_file 在 文件 系统 上 查找 目录 
name。 第 630 行 用 变量 ret 存储 目录 指针 ， 默 认为 NULL。 若 找 不 到 name， 在 第 631 一 632 行 提 示 路 径 不 存在 。 










































































SS 





若 找 到 了 , 第 634 一 635 行 判 断 如 果 找 到 的 是 普通 文件 ， 就 输出 提示 ， 和 否则 若 找 对 





















































将 name 打 ] 





接 下 来 是 sys_closedir 函数 ， 接 受 一 


于， 目录 指针 存 入 ret 中 ， 随 后 在 第 640 行 调用 dir_close 关闭 name 的 父 
个 参数 目录 指针 dir， 功 能 是 关闭 目录 。 成 功 返 0， 失 败 返 回 
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-1。 它 的 实现 太 简 单 了 ， 关 闭 目 录 的 具体 工作 是 调用 dir_close(dir) 完 成 的 。 
我 们 在 main.c 中 加 入 这 两 个 函数 的 测试 ， 见 代码 14-43 。 


.9 Tnt 
.… 此 
26 
27 
28 
29 
30 
3 
32 
本 
34 
35 
36 
37 
38 
39 了 
.… 略 








代码 14-43 (project/c14/j/kernel/main.c ) 
main(void) { 


struct dir* p dir = sys opendir("/dirl/subdirl"); 
if (p dir) { 
printf("/dirl/subdirl open done!\n"); 
if (sys closedir(p dir) == 0) { 
printf("/dirl/subdirl close done!\n"); 
} else { 
printf("/dirl/subdirl close fail!\n"); 
} 
} else { 
printf("/dirl/subdirl open fail!\n"); 
} 
while(1); 
return 0; 





测试 代码 很 简单 ， 运 行 结果 如 图 14-39 所 示 。 
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CTRL + 3rd button enables mouse NIH lears CRL hn:olhn:osl | 1 1 1 | 


A 图 14 一 39 录 的 打开 与 关闭 
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ee ret 指针 。 











图 中 最 后 两 行 是 打开 及 关闭 目录 的 输出 信息 ， 符 合 预期 。 
本 节 内 容 不 多 ， 到 这 就 结束 了 ， 下 节 再 续 。 


14.12.2 读 取 1 个 目录 项 


前 面 说 过 啦 ， 读 取 目 录 实 际 上 就 是 读 取 目录 中 的 目录 项 。 在 进行 开发 之 前 ， 咀 们 先 了 解 下 Linux 读 取 目 
录 的 方法 ， 有 具体 如 图 14-40 所 示 。 
14-40 是 遍历 根 目录 的 例子 。 第 6 行 先 声 明了 目录 指针 变量 p_dir， 
第 7 行 声明 了 目录 项 指针 变量 dir_e， 在 第 8 行 用 opendir 函数 打开 根 





























































































































































































































目录 “/”， 返回 目录 地 址 给 p_dir。 然后 再 把 p_dir 作为 readdir 函数 的 ee ptr Ws 

参数 ， 循 环 调用 ， 每 次 返回 一 个 目录 项 地 址 赋 给 dir e， 直 到 返回 值 p_dir = opendirC'/ 

为 空 , 即 NULL。 然 后 在 第 11 行 输出 目录 项 的 名 字 ， 即 dir_e->d_name。 er 
总 结 一 下 重点 : readdir 每 次 返回 目录 的 一 个 目录 项 地 址 ， 因 此 遍 Miles 









































历 目录 需要 循环 调用 readdir。 
咱们 也 本 着 同样 的 原则 实现 自己 的 readdir。 遍历 目录 不 可 能 仅 
是 readdir 一 个 人 的 功劳 ， 其 核心 是 定义 在 dirc 中 的 函数 dir_read， 
见 代码 14-44。 
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A 图 14-40 ”Linux 中 读 取 目录 


























代码 14-44 (project/c14/k/fs/dir.c ) 
… 略 
325 /* 读 取 目 录 ， 成 功 返 回 1 个 目录 项 ， 失 败 返 回 NULL */ 
326 struct dir entry* dir readl(struct dir* dir) { 



































































































































































































































327 struct dir entry* dir e = (struct dir entry*)dir->dir buf; 
328 struct inode* dir inode = dir->inode; 
329 uint32 七 all blocks[140] = {0}, block cnt = 12; 
330 uint32 七 block idx = 0, dir entry idx = 0; 
3 while (block idx < 12) { 
332 all blocks[block idx] = dir inode->i sectors[block idx]; 
333 block idx++; 
334 } 
335 if (dir inode->i sectors[12] != 0) { // 若 含 有 一 级 间接 块 表 
336 ide read(cur part->my disk, dir inode->i sectors[12], \ 
all blocks + 12, 1)} 
37 block cnt = 140; 
338 } 
339 block idx = 0; 
340 
341 uint32 t cur dir entry pos = 0; 
// 当前 目录 项 的 偏 移 ， 此 项 用 来 判断 是 否 是 之 前 已 经 返回 过 的 目录 项 
342 uint32 七 dir entry size = cur rpart= >sb->dir entry size; 
343 UiNnt32.€ :dir DVS _per sec = SECTOR SIZE / dir entry size; 
// 1 扇 区 内 可 容纳 的 目录 项 个 数 
344 /* 在 目录 大 小 内 遍历 本 
345 while (dir->dir pos < dir inode->i size) { 
346 if (dir->dir pos >= dir inode->i size) { 
347 return NULL; 
348 } 
349 if (all blocks[block idx] == 0) { 
// 如 果 此 块 地 址 为 0， 即 空 块 ， 继续 读 出 下 一 块 
350 block idxt+t+; 
351 continue; 
352 } 
353 memset (dir e, 0, SECTOR SIZE); 
354 ide read(cur part->my disk, all blocks[block idx], dir e, 1); 
355 dir entry idx = 0; 
356 /* 遍历 扇 区 内 所 有 目录 项 */ 
357 while (dir entry idx < dir entrys per sec) { 
358 if ((dir e + dir entry idx)->f type) { 
// 如 果 f_type 不 等 于 0， 即 不 等 于 FT_UNKNOWN 
359 ”/* 判断 是 不 是 最 新 的 目录 项 ， 避 免 返 回 曾经 已 经 返回 过 的 目录 项 */ 






































360 ££ (cur Gir entry pos. < dir=>dir pos) 1 
361 cur dir entry pos += dir entry size; 
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362 dir entry idx++; 
363 continue; 
364 } 
365 ASSERT (cur dir entry pos == dir->dir pos); 
366 dir->dir pos += dir entry size; 
// 更 新 为 新 位 置 ， 即 下 一 个 返回 的 目录 项 地 址 
367 return dir e + dir entry idx; 
368 } 
369 dir entry idx++; 
370 } 
37,1 block idxt++; 
3:72 } 
373 return NULL; 
374 } 

















函数 dir_read 接受 1 个 参数 ， 目 录 指 针 dir， 功 能 是 读 取 目录 dir， 成 功 返回 1 个 目录 项 ， 失 败 返 回 NULL。 
在 目录 结构 中 有 个 512 字 节 的 缓冲 区 dir buf， 也 许 您 之 前 不 了 解 它 是 做 什么 的 ， 现 在 告诉 您 ， 它 的 
作用 是 存储 目录 项 。 首 先 在 程序 开头 声明 了 目录 项 指针 dir e， 使 其 指向 目录 绥 冲 区 dir_buf。 为 读 取 目 录 ， 
必然 要 知道 目录 inode 所 有 的 块 地 址 ， 大 伙 儿 早已 经 熟悉 了 我 的 套路 ， 没 错 ， 在 第 329 一 338 行将 目录 所 
有 块 地 址 收集 到 all_blocks 中 ， 并 使 块 索 引 block idx 恢复 为 0。 
接 下 来 遍历 该 目录 所 有 的 块 ， 然 后 在 每 个 块 中 遍历 目录 项 。 问 题 来 了 ， 既 然 dir_read 也 是 只 返回 1 个 
目录 项 ,， 那 如 何 知 道 该 返回 哪个 目录 项 呢 ? 到 了 目录 成 员 dir_pos“ 发 威 ” 的 时 候 了 ，dir_pos 是 目录 的 “ 游 
标 ” 作用 同文 件 结构 中 的 fa pos 一 样 ， 用 于 记录 下 一 个 读 写 对 象 的 地 址 ，dir_pos 用 于 指向 目录 中 某 个 朋 
录 项 的 地 址 。 我 们 每 返回 一 个 目录 项 后 就 使 dir_ pos 的 值 增 加 一 个 目录 项 大 小 ， 这 样 就 有 可 能 知道 该 返回 
哪个 目录 项 了 。 由 于 目录 中 的 目录 项 是 单独 的 个 体 ， 它 们 可 以 被 单独 删除 ， 这 样 就 会 使 块 中 存在 “空洞 ” 
也 就 是 目录 中 的 目录 项 不 连续 存储 ， 将 它们 读 入 到 内 存 缓冲 区 中 ， 这 些 “ 空 洞 ” 也 存在 ， 我 们 并 没有 在 内 
存 中 整理 目录 项 使 其 连续 ， 因 为 这 样 会 导致 效率 更 加 低下 ， 也 没 必要 。 所 以 仅 赁 dir_ pos 还 不 能 满足 要 求 ， 
我 们 得 知道 哪些 目录 项 已 经 被 读 取 过 了 ,在 第 341 行 定 义 变量 cur dir_entry pos 来 表示 当前 目录 项 的 地 址 ， 
每 找到 一 个 目录 项 就 将 cur_dir_entry_pos 加 上 一 个 目录 项 大 小 ， 直 到 cur_dir_entry_pos 的 值 等 于 dir_pos， 
这 才 算 找到 该 返回 的 目录 项 。 
按 着 这 种 思路 ， 在 第 345 行 开始 寻找 目录 项 ， 遍 历 所 有 块 。 所 有 目录 项 必然 是 在 文件 大 小 之 内 ， 因 此 
在 第 346 行 对 其 判断 ， 若 如 果 dir_pos 大 于 等 于 文件 尺寸 ， 这 说 明 已 经 遍历 了 所 有 的 目录 项 ， 直 接 返 回 
NULL。 提 示 一 下 ，dir pos 在 执行 sys_opendir 时 就 被 置 为 0 了 。 

接着 是 将 扇 区 读 入 到 dir e 中 ， 遍 历 所 有 目录 项 ， 第 358 行 ， 只 要 目录 项 有 效 ， 即 目录 项 的 f type 不 
等 于 FT_UNKNOWN (FT_UNKNOWN 值 为 0), 就 用 当前 目录 项 地 址 cur_dir_entry_pos 和 dir->dir_pos 比 
较 ， 若 cur_dir_entry_pos 小 于 dir->dir pos， 这 说 明 都 是 之 前 返回 过 的 目录 项 ， 因 此 将 cur_dir_entry_pos 加 
上 目录 项 大 小 ， 并 使 目录 项 索引 dir entry idx 加 1 后 ， 跳 过 当前 目录 项 ， 直 到 cur dir entry_pos 等 于 
dir->dir pos， 这 才 找 到 了 该 返回 的 目录 项 。 

随后 在 第 366 行 把 dir->dir_ pos 加 上 一 个 目录 项 大 小 ， 使 其 指向 下 一 个 待 返回 的 目录 项 。 最 后 第 367 
行 返回 目录 项 地 址 dir e+ dir_entry idx。 

好 啦 ，dir read 到 这 就 介绍 完了 ， 大 伙 儿 先 休 息 ， 一 会 再 续 。 
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14.12.3 ”实现 sys_readdir 及 sys_rewinddir 











在 Linux 中 读 取 目录 的 函数 是 readdir, 其 原型 是 :“struct dirent *readdir(DIR *dirp)” 我们 将 来 的 readdir 
也 是 按照 此 接口 来 实现 的 。 

遍历 目录 的 操作 中 ， 经 常会 用 到 目录 回 绕 的 功能 ， 也 就 是 使 目录 的 “游标 ”dir pos 回 到 0， 它 与 lseek 功 
能 类 似 , 只 不 过 是 针对 目录 的 ,避免 了 将 目录 先 关 闭 再 重新 打开 的 繁琐 。 在 Linux 中 目录 回 绕 是 用 函数 rewinddir 
实现 的 ， 其 原型 是 :“void rewinddir(DIR *dirp)” 我 们 也 按照 此 形式 实现 。 
前 还 是 先 实现 这 两 个 系统 调用 的 内 核 部 分 一 一 sys_readdir 和 sys_rewinddir， 代 码 走 起 ， 见 代码 14-45。 
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… 略 
654 


代码 14-45  ( project/c14/k/fs/fs.c ) 












































/* 读 取 目 录 dir 的 1 个 目录 项 ， 成 功 后 返回 其 目录 项 地 址 ， 


















































到 目录 尾 时 或 出 错时 返回 NULL */ 

















655 struct dir entry* sys readdir(struct dir* dir) { 


656 
657 


658 } 


659 








ASSERT (dir != NULL) ; 
return dir read(dir); 














660 /* 把 目录 dir 的 指针 dir pos 置 0 */ 
661 void sys rewinddir(struct dir* dir) { 


662 


663 } 


… 略 








dir->dir pos = 0; 











这 两 个 函数 都 极其 简单 ， 甚 至 有 时 候 我 都 为 代码 太 少 而 刁 愧 。 
sys_readdir 是 dir_read 的 封装 ， 就 这 一 句 实质 代 码 ， 其 功能 和 dir_read 是 一 样 的 ， 之 所 以 还 





建 sys_readdir， 完 全 是 为 了 系统 调用 的 内 核实 现 部 分 命名 统一 。 




















sys_rewinddir 更 简单 ， 它 直接 将 参数 dir 的 “游标 ”dir_pos 置 为 0。 
下 面 是 功能 验证 部 分 ， 我 们 在 main.c 中 添加 调用 代码 ， 如 代码 14-46 所 示 。 


47 } 
… 略 























代码 14-46 (project/c14/k/kernel/main.c ) 


int main (voidq) { 
put_str("I am kernel\n"); 
init all(); 
/炎炎 炎炎 火炎 火炎 测试 代码 大 类 大 炎炎 火炎 类/ 
struct dir* p dir = sys opendir("/dirl/subdirl"); 
(DT) Ct 
printf("/dirl/subdirl open done!\ncontent:\n"); 
char* type = NULL; 
struct dir entry* dir e = NULL; 
while((dir e = sys readdir(p dir))) { 


if (dir e->f type == FT REGULAR) { 
type = "regular"; 
} else { 
type = "directory"; 
} 
Drintf(™ $s Ss\n", type, dir e->filename); 
} 
if (sys closedir(p dir) == 0) { 
printf("/dirl/subdirl close done!\n"); 
} else { 
printf("/dirl/subdirl close fail!l\n"); 
} 
} else { 
printf("/dirl/subdirl open fail!\n"); 
} 
/太太 大 炎炎 炎炎 大 测试 代码 大 类 大 类 类 类 类 类/ 
while(1); 


return 0; 


还 要 单独 创 

















这 次 我 们 把 两 个 进程 和 两 个 线程 的 创建 代码 去 掉 了 ,因为 在 调度 的 时 候 会 交替 输出 信息 ， 
察 调试 代码 输出 的 内 容 。 

































































影响 1 : 们 观 

















代码 第 23 一 44 行 是 打开 目录 "dirl/subdirl"， 然 后 输出 目录 内 容 :“ 文 件 类 型 文件 名 ” 即 如 果 文 件 是 目录 ， 


就 输出 “directory 文件 名 ” 如 果 文 件 是 普通 文件 ， 就 输出 “regular 文件 名 ” 这 里 并 没有 验证 sys_rewinddir 


函数 ， 本 节 用 它 的 话 太 牵强 ， 下 节 更 合适 。 好 啦 ， 代 码 没 法 再 清晰 了 ， 咱 们 直接 看 输出 吧 ， 如 图 






















































































图 中 输出 “/dirl/subdirl ”中 的 3 个 文件 ， 包 括 两 个 目录 :“.” 和 “..”， 男 一 个 是 普通 文件 
件 是 咀 们 不 久 前 刚 创建 的 。 





输 



































出 的 信息 还 是 符合 预期 的 ， 您 也 猜 到 了 ， 本 节 结 束 啦 。 


14-41 所 示 。 
fle2， 此 文 
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Bochs x86 emulator, http://bochs.sourceforge.net/ 


ResetsuspENDPoer 






































1 done! 
dirl open done! 
content: 





CTRL + 3rd button enables nouse Wut lears 上 cRL lin:omlhn:o-s| | 1 1 1 1 
































删除 目录 


我 们 刚刚 创建 的 目录 立即 就 要 在 本 节 中 删除 了 ， 好 可 惜 。 删 除 目 录 是 目录 操作 最 基本 的 功能 ， 除 此 之 
外 ， 我 们 还 会 顺便 实现 目录 


14.13.1 删除 目录 与 判断 空 目录 


我 们 有 这 样 的 经 验 ， 当 删除 目录 时 ， 如 果 目 录 中 有 文件 或 子 目 录 ， 无 论 是 Windows 下 ， 还 是 Linux， 
都 会 打印 类 似 这 样 的 提示 :“ 删 除 失败 ， 目 录 非 空 ” 尽管 在 Linux 中 可 以 用 rm -r 来 删除 非 空 目录 ， 但 这 
是 采用 递归 (recursive) 的 方式 ， 先 删除 目录 中 的 文件 后 再 删除 目录 ，Linux ! 目录 的 命令 是 rmdir， 
它 专用 于 删除 空 目录 。 我 们 也 继续 这 种 做 法 ， 在 删除 目录 时 先 判断 目录 是 否 为 空 ， 不 允许 删除 非 空 目录 。 

本 节 我 们 在 dirc 中 增加 两 个 函数 ， 见 代码 14-47。 


代码 14-47 (project/c14/Vfs/dir.c ) 












































五 
sy 





















































































































































































































































376 /* 判断 目录 是 否 为 空 */ 






















































































377 bool dir is emptyl(struct dir* dir) 

378 struct inode* dir inode = dir->inode; 

379 /* 若 目 录 下 只 有 .和 . .这 两 个 目录 项 ， 则 目录 为 空 * 

380 return (dir inode->i size == cur part->sb->dir entry size * 2); 
381 } 

382 

383 /* 在 父 目录 parent _dir 中 删除 chilg dir */ 


384 int32 t dir remove(struct dir* parent dir, struct dir* chilgd dir) { 
























































































































































S85 struct inode* child dir inode = child dir->inode; 
386 /* 空 目 录 只 在 inodqe->i_sectors[0] 中 有 扇 区 ， 其 他 扇 区 都 应 该 为 空 */ 
387 int32.t block idqx = 1; 
388 while (block idx < 13) { 
389 ASSERT (child dir inode->i sectors [block idx] == 0); 
390 block idx++; 
391 } 
392 void* io buf = sys malloc(SECTOR SIZE * 2); 
393 if (io buf == NULL) { 
394 printk ("dir remove: malloc for io buf failed\n"); 
395 return -1; 
396 + 
397 
398 /* 在 父 目录 parent_qdir 中 删除 子 目录 child qdir 对 应 的 目录 项 */ 
399 delete dir entry(cur part, parent dir, child dir inode->i no io buf); 
400 
401 /* 回收 inode 中 i secotrs 中 所 占用 的 扇 区 ， 
并 同步 inode bitmap 和 block bitmap */ 
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402 inode release (cur part, child dir inode->i no); 
403 sys_free(io puf); 

404 return 0; 

405 } 

… 略 

















函数 dir_ is_empty 接受 1 个 参数 ， 目 录 指 针 dir， 功 能 是 判断 目录 dir 是 否 为 空 。 其 原理 很 简单 ， 任 何 
目录 中 都 有 “.” 和 “..” 这 两 个 目录 项 ， 空 目录 中 只 剩 下 这 两 个 目录 项 ， 因 此 若 目 录 的 大 小 等 于 2 个 目录 
项 的 大 小 ， 就 表示 该 目录 为 空 。 目 录 为 空 返回 true， 和 否则 返回 false。 

函数 dir remove 接受 2 个 参数 ， 父 目录 指针 parent dir 和 子 目 录 指 针 child dir， 功 能 是 在 父 
parent_dir 中 删除 child_ dr。 成 功 删 除 则 返回 0， 否则 返回 -1。 

代码 开头 通过 ASSERT 判断 子 目录 只 有 一 个 块 ， 如 注释 所 说 ， 我 们 要 删除 的 child_dir 肯定 得 是 个 空 
目录 ， 空 目录 只 有 在 其 inode 的 i sectors[0] 中 有 扇 区 地 址 ， 因 此 while 循环 中 是 排查 
接 下 来 为 delete_ dir_entry 申请 缓冲 区 io_buf， 然 后 调用 delete_ dir _ entry 在 父 目录 parent dir 中 删除 子 
目录 child dir 对 应 的 目录 项 ， 最 后 调用 inode release 释放 子 目 录 的 inode。 

释放 io_buf 后 ， 通 过 return 返回 0， 函数 结束 了 ， 本 节 也 悄悄 地 结束 了 。 


































































































六 








I 






















































































































































































14.13.2 ”实现 sys_rmdir 及 功能 验证 


目录 能 创建 就 得 能 删除 ， i 下 删除 目录 的 函数 是 rmdir， 其 原型 是 : 
int rmdir(const char *pathname)， 还 是 老 样 子 ， 我 们 先 在 fs.c 中 实现 其 内 核 部 分 


代码 14-48 (projectc14/Wfs/fs.c ) 
































sys_ rmdir， 见 代码 14-48。 

















665 /* 删除 空 目录 ， 成 功 时 返回 0， 失 败 时 返回 -1I*/ 
666 int32 t sys rmdir(const char* Pathname) { 


667 /* 先 检查 待 删除 的 文件 是 否 存在 */ 




































































668 struct path search _ recordq searched record; 
669 memset (&searched record, 0, sizeof(struct path search record)); 
670 int inode no = search file(pathname, &searched record); 
671 ASSERT (inode no != 0); 
672 int retval = -1; // 默认 返回 值 
3 if (inode no == -1) { 
674 printk("In %s, sub path %s not exist\n", 
pathname, searched record.searched path); 
675 } else { 
676 if (searched record.file type == FT REGULAR) { 
677 printk("%s is regular file!\n", pathname); 
678 } else { 
679 struct dir* dir = dir open(cur part, inode no); 
680 if (!qir is empty(dir)) { // 非 空 目录 不 可 删除 
681 printk ("dir gs is not empty, it is not allowed 
to delete a nonempty directory!\n", pathname); 
682 } else { 
683 if (!dir remove (searched record.parent dir, dir)) { 
684 retval = 0; 
685 } 
686 } 
687 dir close(dqir) ; 
688 } 
689 J} 
690 dir close(searched record.parent dir); 
691 return retval; 
692 } 
… 略 











大 伙 儿 早已 经 发 现 ， 经 过 前 期 大 量 的 基础 构建 ， 后 面 新 加 的 功能 代码 都 不 是 很 长 ， 不 禁 有 些 幸福 感 ， 
咳 咳 ， 说 代码 。 
sys_rmdir 接受 1 个 参数 ， 待 删除 的 目录 pathname， 功 能 是 删除 空 目录 pathname， 成 功 时 返回 0， 失 
败 时 返回 -1。 
删除 目录 之 前 要 确认 目录 在 文件 系统 上 存在 ， 代 码 第 668 一 670 行 判断 目录 是 否 存在 。 第 672 行 定义 
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了 返回 值 retval， 初 始 化 为 -1， 以 下 各 步骤 若 失败 将 其 作为 返回 值 。 


























在 执行 search file 后 ， 如 果 返 回 值 node no 为 -1， 这 说 明 未 找到 该 目录 ， 输 








提示 信息 ， 执 行 流 跳 到 690 


行 ,关闭 目录 searched record.parent _ dir。 如果 inode_no 不 等 于 -1， 这 说 明 找到 了 pathname， 接 下 来 在 第 676 一 
687 行 判断 pathname 是 目录 ， 还 是 普通 文件 。 如 果 searched record.file type 的 值 是 FT_ REGULAR， 这 说 明 


























pathname 是 同名 的 普通 文件 ， 输 出 提示 后 跳 到 第 690 行 。 否 则 pathname 是 


Ed 






































录 文 件 ， 这 时 候 我 们 ; 





年 pathname 




















打开 , 然后 调用 dir_is_empty 判断 其 是 否 为 空 , 如 果 非 空 就 输出 提示 , 不 允许 删除 非 空 目录 。 如 果 pathname 
为 空 ， 就 执行 dir remove 将 其 在 硬盘 上 删除 ， 如 果 删 除 成 功 ， 就 将 retval 置 为 0， 流 程 跳 到 第 687 行 ， 执 




































































行 dir_close 关闭 目录 在 内 存 中 的 资源 ， 最 后 关闭 父 目 录 。 
下 面 到 了 测试 时 间 ，main.c 如 代码 14-49 所 示 。 

















代码 14-49 (project/c14//kernel/main.c ) 
































… 略 

19 int main(void) { 

20 put str("I am kernel\n"); 

21 init all(); 

22 /大 大 大 大 大 大 大 大 测试 代码 大 大 炎炎 类 炎炎 大/ 

23 printf("/dirl content before delete /dirl/subdirl:\n"); 
24 struct dir* dir = sys opendir("/dirl/"); 

25 char* type = NULL; 

26 struct dir entry* dir e = NULL; 

23 while((dir e = sys readdir(dir))) { 

28 if (dir e->f type == FT REGULAR) { 

29 type = "regular"; 

30 } else { 

31 type = "directory"; 

32 } 

33 printf(" $s Ss\n", type, dir e->filename); 
34 } 

35 printf("try to delete nonempty directory /dirl/subdirl\n"); 
36 if (sys rmdir("/dirl/subdir1l") == -1) { 

37 printf("sys rmdir: /dirl/subdirl delete faill!l\n"); 
38 } 

3.9: 

40 printf("try to delete /dirl/subdirl/file2\n"); 

41 if (sys rmdir("/dirl/subdirl/file2") == -1) { 

42 printf("sys rmdir: /dirl/subdirl/file2 delete fail!l\n"); 
43 } 

44 if (sys unlink("/dirl/subdirl/file2") == ) { 

45 printf("sys unlink: /dirl/subdirl/file2 delete done\n"); 
46 } 

47 

48 printf("try to delete directory /dirl/subdirl again\n"); 
49 if (sys rmdir("/dirl/subdir1l") == 0) { 

50 printf("/dirl/subdirl delete done!\n"); 

本 二 } 

52 

53 printf("/dirl content after delete /dirl/subdirl:\n"); 
54 sys_ rewinddir (dir); 

Ss while((dir e = sys readdir(dir))) { 

56 if (dir e->f type == FT REGULAR) { 

57 type = "regular"; 

58 }F-else { 

59 type = "directory"; 

60 } 

61 PDE $s Ss\n", type, dir e->filename); 

62 } 

63 

64 /大 大 大 大 大 大 大 测试 代码 大 大 炎炎 大火 炎炎/ 

65 while(1); 

66 return 0; 

67 } 

… 略 














测试 代码 虽然 有 点 多 ， 但 都 比较 直 白 。 
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目前 硬盘 上 的 数据 是 根 目录 ， 
中 又 存在 文件 包 e2 。 现 在 的 测试 思路 是 。 删 除 /dirl/subdirl 


会 出 错 。 





万 蔡 ” 


大 伙 儿 自行 查看 输 
了 ， 大 伙 儿 多 保 如 


任务 的 工作 目录 


在 Linux 中 咱们 经 常会 使 用 命令 pwd 来 显示 当前 工作 目录 ， 还 要 用 cd 命令 来 改变 工作 日 录 ， 本 节 咱 
们 要 实现 类 


LS 
sq 





14.14.1 有 


我 们 在 Linux 操作 中 
以 在 系统 变量 $PS1 上 








终了 


一 、 





F 把 目录 /dirl/subdirl 删 






































除 ， 然 





WY 


sdbl donet 


content before delete 


directory 


subdir1 


存在 普通 文件 filel 和 月 


后 再 次 输出 目录 /dirl 


“diri/subdir1: 





14.14 
































录 dirl， 在 


录 dirl 中 存在 subdirl ， 在 subdirl 























录 。 由 于 是 非 空 目录 ， 
下 面 通过 sys_rmdir 和 sys_unlink 分 别 删 除 /dirl/subdir1/file2， 检 测 程序 健壮 1 





直接 调用 sys_rmdir 
生 。 最 后 “历尽 千 辛 


人 




































































o delete nonempty directory /dir1l/subdir1 


diri/subdir1 


is not empty, 


ys_rmdir: /diril/subdir1 delete failt 


ry to delete 
dir1 subdai 


ubdir1i/filez 


lar filef 
lez delete fail1 
r ilez delete done 
ry /diri/subdir1 again 


done?! 


dir1 content after delete /diri/subdir1 


directory 
directory 


CTRL + 3rd button enables 





























全 已 


以 的 功 


ee 

















.小 习 





























mouse Mun lars | 





入 





A 








14-42 ”删除 





上 结果 吧 ， 我 初步 观察 是 符合 预期 
身体 ， 晚 安 。 

















录 演 示 




















月 E 。 














， 经 常会 cd 到 任何 











当前 工作 目录 的 原理 及 基础 代码 








党 





录 下 


作 ， 如 果 您 





配置 )， 您 可 能 经 常用 














局 






































的 shell 未 配置 显示 全 
命令 pwd 来 显示 当前 工作 路 径 。 




















的 内 容 。 运 行 结果 如 图 14-42 所 示 。 


it is not allowed to delete a nonempty directory 


的 。 好 啦 ， 本 节 到 这 啦 ， 手 都 软 了 ,键盘 敲 不 动 


























工作 路 径 的 话 〈 可 























录 。 也 就 是 说 ， 有 了 “..”， 
k 体 的 做 法 是 先 通过 

















39 




















因此 咱们 





























































































































录 项 中 获取 当 








前 目录 名 称 ， 然 后 再 向 上 
































录 树 层 层 而 上 ， 就 能 构建 出 当前 目录 的 绝对 
它们 定义 在 fs.c 中 ， 见 代码 14-50。 




















话说 这 是 如 何 实现 的 呢 ? 您 看 , 在 任何 目录 中 都 有 目录 项 “..” 它 表 示 父 
无 论 我 们 身 处 任何 一 级 的 子 目 录 ， 都 可 以 “顺藤摸瓜 ”找到 根 目录 。 
获取 当前 目录 的 父 目 录 , 在 父 目 录 中 搜索 当前 目录 的 目录 项 ， 从 
找 父 目 录 的 父 目录 ， 再 从 中 获得 父 目录 的 名 称 …… 沿 着 目 
为 了 辅助 这 项 工作 ， 有 一 些 基 础 功能 要 先 完成 ， 它 
代码 14-50 (project/c14/m/fs/fs.c ) 


… 略 
694 
695 


696 
697 
698 
699 
700 
701 
702 
703 
704 
705 











/* 获得 父 








录 的 ijnode 编号 */ 


static uint32 七 get parent dir inode nr (uint32 t child inode nr, 


VO ‘LO 


buf) 
struct inode* child dir inode 


{ 
































/* 录 中 的 目录 项 " . ." 中 包括 父 
uint32 t block lba = 
ASSERT (b] 




















inode close(chilqd dir inode); 





















































录 ijnode 编号 ，". 
child dir inode->i sectors[0]; 
lock lba >= cur part->sb->data start lba); 


inode open(cur part, 








child inode nr); 








. "位 


























录 的 第 0 块 */ 





ide readq(cur part->my disk, block lba, io buf, 1); 

struct dir entry* dir e = (struct dir entry*)io buf; 

/* 第 0 个 目录 项 是 "."， 第 1 个 目录 项 是 ".." */ 

ASSERT (dir e[1].i no < 4096 && dir e[1].f type == FT DIRECTORY); 
return dir e[1] .i no; // 返回 . . 即 父 目录 的 inode 编号 
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第 14 章 文件 系统 
706 } 
707 
708 /* 在 inode 编号 为 p_inode_nr 的 目录 中 查找 
* inode 编号 为 c_inode_nr 的 子 目 录 的 名 字 ， 
709 * 将 名 字 存 入 缓冲 区 path， 成 功 返 回 0， 失 败 返 -1 */ 
710 static int get child dir name (uint32 t p inode nr, uint32 t c inode nr,\ 
char* path, void* io buf) { 

yA struct inode* parent dir inode = inode open(cur part, p_ inode nr); 
7 /* 填充 all_ blocks， 将 该 目录 的 所 占 扇 区 地 址 全 部 写 入 al1_ blocks */ 
了 上 3 uint8 t block idx = 0); 
714 uint32 t all blocks[140] = {0}, block cnt = 12; 
713 while (block idx < 12) { 
716 all blocks[block idx] = parent dir inode->i sectors [block idx]; 
了 二 block idxt++; 
718 } 
719 if (parent dir inode->i sectors[12]) { 

// 若 包 含 了 一 级 间接 块 表 ， 将 其 读 入 all blocks 
720 ide read(cur part->my disk, 

parent dir inode->i sectors[12], all blocks + 12, 1); 

721 block cnt = 140; 
2 } 
723 inode close(parent dir inode); 
724 
康之 和 struct dir entry* dir e = (struct dir entry*)io buf; 
了 2 看 uint32 t dir entry size = cur part->sb->dir entry size; 
727 uint32 t dir entrys per sec = (512 / dir entry size); 
728 block idx = 0; 
729 /* 遍历 所 有 块 */ 
全 39 while(block idx < block cnt) { 
731 if(all blocks[block idx]) { // 如 果 相 应 块 不 为 空 ， 则 读 入 相应 块 
732 ide read(cur part->my disk, all blocks[block idx], io buf, 1); 
733 uint8 t dir e idqx = 0; 
734 /* 遍历 每 个 目录 项 */ 
335 while(dir e idx < dir entrys per sec) { 
736 if ((dir e + dir e idx)->i no == ¢c inode nr) { 
737 strcat (path, "™/"); 
738 strcat (path, (dir e + dir e idx)->filename); 
739 return 0; 
740 } 
741 dir e idxt++; 
742 中 
743 } 
744 block idxt++; 
745 } 
746 return -1; 
(和 
… 略 


函数 get_ parent dir inode_nr 接受 2 个 参数 ， 子 目录 inode 编号 child_inode_ nr、 组; 
得 父 目 录 的 inode 编号 。 





对 








此 函数 是 利 
用 指针 child dir inode 保存 3 








它们 位 于 目 


中 。 块 中 第 0 个 





经 


5 束 。 


函数 get_child dir name 接受 4 个 参数 ， 父 目录 inode 编号 p_inode nr、 子 




















子 目录 中 





























目录 项 “.. 





其 地 址 。 目 录 项 “.” 和 “..” 是 在 执行 sys_mkdir 创建 空 目 
录 第 0 个 直接 块 中 ， 即 i_sectors[0] 中 ， 因 此 第 698 一 701 行 ， 将 该 块 中 的 数 
录 项 是 “.” 第 1 个 目录 项 是 “..”， 

















区 io_ buf， 功 能 是 








子 目录 的 inode， 
的 时 候 生成 的 ， 
居 读 入 到 io_buf 
705 行 返 回 第 1 个 目录 项 的 inode 编号 ， 函 数 


”来 实现 的 ， 在 函数 开头 先 通过 inode_open 获 和 


ja 


录 














AAA 
了 上 
2 





























录 inode 编号 c_ inode_nr、 


















































存储 路 径 的 


编号 为 c_ inode_nr 的 子 目录 ， 将 子 目 录 的 名 字 存 入 组 ; 
录 项 中 存储 ， 故 获取 名 称 必 然 免 不 了 读 取 
录 的 所 有 块 地 址 收集 至 
遍历 所 有 块 ， 然 后 在 每 一 个 块 中 遍历 所 有 目录 项 。 
目录 项 的 ino 等 于 c_inode nr， 就 在 第 737 行 ， 用 函数 strc 
行将 目录 项 的 名 称 追 加 到 /2 


名 称 是 


目录 的 inode， 接 着 很 老 套 地 把 
第 730 一 745 行 也 很 老 
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绥 ; 


区 path、 人 硬盘 读 写 组 








在 目 








在 
伍 ， 


I 区 io_buf， 功 能 是 在 inode 编号 为 p_inode nr 的 目录 中 查找 inode 









































区 path， 成 功 返 回 0， 失 败 返 -1。 
录 项 所 在 的 块 ， 因 此 第 711 一 722 行 先 打开 父 
| all blocks。 
































在 多 
at 将 路 径 分 隔 符 / 追 加 到 path ! 


736 行 ， 如 果 发 现 
， 然 后 在 下 一 
























































后 ， 最 后 i 











前 过 return 返回 0， 消 数 结束 。 


短 说 下 第 737 一 738 行 的 path 操作 ,函数 get child_ dir name 每 次 只 获得 
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4.14 
























































层 目 录 的 名 称 ,为 构 
































































































































































































































上司 
建 出 目录 树 ， 它 是 由 主 调 函 数 多 次 调用 的 ， 传 入 的 参数 path 用 于 拼接 完整 的 绝对 路 径 ， 因 此 每 次 调用 
get_child dir_ name 时 ，path 都 是 非 空 的 ， 里 面 的 值 已 经 是 部 分 路 径 了 ， 因 此 这 里 用 strcat 去 拼接 路 径 。 这 样 
i 象 ， 到 了 后 面 的 应 用 场合 就 会 清楚 了 。 
代码 介绍 完了 ， 本 节 也 到 此 结束 了 ， 下 节 再 见 。 
14.14.2 ”实现 sys_getcwd 
Linux 中 用 getcwd 函数 来 获取 当前 工作 路 径 ， 其 原型 是 ; 
| "char *getcwd(char *buf, size t size)" 
buf 是 容纳 当前 目录 绝对 路 径 的 缓冲 区 ，getcwd 会 将 当前 工作 目录 的 绝对 路 径 写 入 buf 中 ，size 是 buf 的 
大 小 。 buf 可 以 由 用 户 提供 ， 也 可 以 由 操作 系统 提供 ， 如 果 用 户 不 提供 buf， 即 传 给 buf 的 参数 为 NULL， 
系统 会 通过 malloc 单独 分 配 内 存 给 buf, 之 后 getcwd 再 将 buf 返回 ,用户 进程 记得 要 用 free 释放 。 本 节 听 
们 要 实现 其 内 核 部 4 
在 进行 开发 之 前 还 要 修改 下 pcb， 我 们 要 在 pcb 中 加 个 记录 当前 工作 目录 的 成 员 一 一 cwd_inode_nr， 用 它 来 
记录 工作 目录 的 inode 编号 ， 见 代码 14-51。 
代码 14-51 (project/c14/m/thread/thread.h ) 
77 /* 进程 或 线程 的 pcb， 程 序 控制 块 */ 
AR task struct { 
96 uint32 t cwd inode nr; // 进程 所 在 的 工作 目录 的 inode 编号 
97 uint32 七 stack magic; 
98. 1}3 
接着 还 要 修改 初始 化 线程 函数 init thread， 为 ewd_inode nr 初始 化 ， 见 代码 14-52。 
代码 14-52 (project/c14/m/thread/thread.c ) 
68 /* 初始 化 线程 基本 信息 
0 init thread(struct task struct* pthread, char* name int Prio) { 
958 pthread->cwd inode nr = 0; // 以 根 目录 作为 默认 了 [ 作 路 径 
99 pthread->stack magic = 0x19870916; // 自 定义 的 魔 数 
2 } 
第 98 行 是 将 cwd_inode_nr 初始 化 为 0， 也 就 是 任务 默认 的 工作 目录 是 根 目录 。 











切 就 绪 之 后 ， 下 四 





























/* 把 当前 工作 








录 绝 对 路 径 写 入 buf，size 是 buf 的 大 小 








面 在 fs.c 中 着 手 编写 sys_getcwd 函数 ， 











代码 14-53 


Co 

















当 puf 为 NULL 时 ， 
失败 则 返回 NULL */ 




















char* gye. getcwd (char* Duff; Mint 


操作 系统 分 配 存储 











返 








作 路 径 的 空间 





32 七 :SIZE) 








/* 确保 
系统 调 
ASSERT 


buf 不 大 
getcwd 中 


























全 ， 右 




















进程 提供 的 buf 为 NUL 


忆 





























:进程 通过 malloc 分 配 内 存 */ 








(buf != NULL); 


void* io buf = sys malloc (SECTOR SIZE); 


if 


(io buf == NULL) 





return NULL; 


} 





























见 代码 14-53。 


( projectc14/m/fs/fs.c ) 


地 址 ， 


struct task struct* cur thread = running thread() 
int32 t parent inode nr = 0; 
int32 t child inode nr = cur thread->cwd inode nr; 

ASSERT (child inode nr >= 0 && child inode nr < 4096) ; 
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第 14 章 文件 系统 
// 最 大 支持 4096 个 inode 
765 /* 若 当 前 目录 是 根 目录 ， 直 接 返 回 '/' */ 
766 if (child inode nr == 0) { 
767 buf[0] = '/'; 
768 buf[1] = 0; 
769 return buf; 
TT0 } 
了 二 
772 memset (buf, 0, size); 
773 char full path reverse[MAX PATH LEN] = {0}; // 用 来 做 全 路 径 缓冲 区 
774 
775 /* 从 下 往 上 逐 层 找 父 目录 ， 直 到 找到 根 目录 为 止 。 
776 * 当 child inode_nr 为 根 目录 的 inode 编号 (0) 时 停止 ， 
777 * 即 已 经 查看 完 根 目录 中 的 目录 项 */ 
778 while ((child inoqe nr)) { 
779 parent inode nr = get parent dir inode nr(child inode nr, io buf); 
| if (get child dir name (parent inode nr, child inode nr,\ 
full path reverse，io buf) == -1) { // 或 未 找到 名 字 ， 失 败退 出 
781 sys_free (io buf); 
782 return NULL; 
783 } 
784 child inode nr = parent inode nr; 
785 } 
786 ASSERT (strlen (full path reverse) <= size); 
787 /* 至 此 full path reverse 中 的 路 径 是 反 着 的 ， 
788 ”* 即 子 目 录 在 前 ( 左 )， 父 目录 在 后 ( 右 )， 
789 * 现 将 full path reverse 中 的 路 径 反 置 */ 
790 char* last slash; // 记录 字符 串 中 最 后 一 个 斜 杠 地 址 
791 while ((last slash = strrchr (full path reverse, '/'))) { 
792 uint16 t len = strlen (buf); 
5 93 strcpy (buf + len, last slash); 
794 /* 在 full path reverse 中 添加 结束 字符 ， 
作为 下 一 次 执行 strcpy 中 last_slash 的 边界 */ 
795 *]last slash = 0; 
R96 } 
797 sys_free (io buf); 
798 return buf; 
799 } 
… 略 


函数 sys_getcwd 接受 




















以 
中 为 buf 通 






























































内 存 。 接 着 是 为 缓冲 

















child inode nr。 


AAA 


条 


A 后 返 








口 











接着 定义 了 数组 full path reverse[MAX PATH LEN]， 它 用 于 存储 工作 目录 所 在 的 全 路 径 ， 即 绝对 路 
径 ， 不 过 从 名 字 上 看 ， 它 是 反 转 的 绝对 路 径 ， 因 此 它 只 是 临 





o 


天 个 参数 ， 存 储 绝对 路 径 的 组 
录 的 绝对 路 径 写 入 buf， 成 功 返 回 buf 地 址 ， 失 败 返 
函数 开头 用 “ASSERT(buf != NULL)” 限 由 
操作 系统 提供 ， 若 用 
过 malloc 分 配 
第 761 一 763 行 获得 当前 和 


区 io_buf 




















口 





NULL 。 





I 区 buf、 绥 冲 














申请 1 








2 








766 一 770 行 判 断 ， 如 果 child inode nr 是 0， 这 说 明 是 根 














录 的 inode 编号 ， 


区 大 小 size， 功 能 是 把 当前 工作 目 























央 了 buf 不 为 空 ， 我 们 说 过 ，buf 可 以 由 用 户 进 程 提供 ， 也 可 
户 进程 传 给 buf 的 实 参 是 NULL， 也 就 是 未 提供 缓冲 区 ， 我 们 会 在 系统 调 
区 大 小 的 内 存 。 

F 务 工作 目录 的 inode 编号 ， 即 存储 在 pcb : 





























4 getcwd 














的 cwd_inode_ nr， 将 其 赋值 给 





因此 把 buf 直接 置 为 























只 是 反 转 














不 是 “/c/ba”。 





dir_inode_nr 获得 父 


第 75$$ 一 785 行 从 当前 目录 向 上 回 














溯 , 逐 


从 入 








目录 的 inode 编 














时 数据 ， 一 会 还 要 将 
录 有 顺序， 目录 名 本 身 不 反 转 。 如 若 原 路 径 为 “/ab/c” 在 full path reverse 的 将 是 “/c/ab”， 并 





层 找 父 目录 , 一 直 找到 根 目 












































反 转 回来 。 注 意 ， 这 上 


~ 


上 








录 为 止 。 第 779 行 调用 get_parent_ 








号 存 入 parent inode nr， 接着 调 























] get_child dir name 把 当前 工作 目录 


的 名 字 写 入 foll path reverse 中 。 然 后 将 child inode nr 更 新 为 parent inode_nr 开始 下 一 轮 循环 。 


循环 过 后 ， 在 full_path_reverse 中 
790 一 798 行 通过 while 循环 逐 层 解析 


好 啦 ， 
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得 到 了 绝对 路 径 的 反 转 玫 
录 名 ， 将 最 终 的 路 径 写 























sys_getcewd 结束 啦 ， 下 节 


自 们 实现 更 改 工 作 目录 的 








式 ， 下 国 
入 buf 中 。 


j 将 其 转换 为 正常 的 顺序 。 代 码 第 




















14.14.3 ”实现 sys_chdir 改变 工作 目录 
Linux 中 用 函数 chdir 来 改变 当前 工作 目录 ， 其 原型 是 : 


| "int chdir(const char *path)" 


您 懂 的 





略 
































， 下 面 我 们 先 依照 此 接口 实现 sys_chdir， 见 代码 14-54。 


代码 14-54 (project/c14/m/fs/fs.c ) 



































801 /* 更 改 当 前 工作 目录 为 绝对 路 径 path， 成 功 则 返回 0， 失 败 返 回 -1 */ 
802 int32 t sys_chdqir (const char* path) { 


803 
804 
805 
806 
807 
808 
809 
810 
811 
812 
813 
814 
815 
816 
817 } 
… 略 


函数 sys_chdir 接受 1 个 参数 ，3 


成 功 则 返回 
任务 的 























int32 七 ret = -1; 
struct path search record searched record; 
memset (&searched record, 0, sizeof(struct path search record)); 





int inode no = search file(path, &searched record); 
if (inode no != -1) { 
if (searched record.file type == FT DIRECTORY) { 
running thread()->cwd inode nr = inode no; 
ret = 0; 
} else { 


printk("sys chdir: %s is regular file or other!\n", path); 
} 
} 
dir close(searched record.parent dir); 
return ret; 

















0， 失 败 返 回 -1。 









































































































































所 工作 目录 的 绝对 路 径 path， 功 能 是 更 改 当 前 工作 目录 为 绝对 路 径 path， 


作 目 录 记 录 在 pcb 中 的 cwd_inode_nr， 因 此 更 改 工 作 目 录 的 核心 原理 就 是 修改 cwd_inode_nr。 
作 目 录 必 须 是 在 硬盘 上 存在 的 , 因此 在 更 改 工作 目录 之 前 , 先 要 保证 新 路 径 path 是 存在 的 。 第 804 一 806 
行 搜索 path， 如 果 未 找到 ， 也 就 是 返回 值 inode_no 为 -1， 直 接 返 回 默认 的 返回 值 ret， 即 -1。 


如 果 找 到 了 path， 在 第 808 一 813 行 要 确认 path 是 否 为 目录 ， 万 一 要 是 普通 文件 也 会 失败 。 第 808 行 
关 断 如 果 是 目录 ， 就 用 目录 path 的 inode 号 inode_no 给 任务 的 cwd_inode nr 赋值 ， 从 而 完成 了 工作 目录 
的 更 改 ， 然 后 将 返回 值 ret 置 为 0。 

























































































最 后 在 











第 815 行 关 闭 目 录 ， 返 回 ret。 











函数 介绍 完了 ， 下 面 是 测试 时 间 ， 今 天 的 main.c 长 这 样 ， 见 代码 14-55。 


略 














代码 14-55 (project/c14/m/kernel/main.c ) 


省 
19 int main(void) { 


Put_str("I am kernel\n"); 
主刀 广 七 全 二 光宗 公 


22 /x*xxxxxyxx* 测试 代码 **x 大 太太 太太/ 


char cwd buf[32] = {0}; 
sys_getcwd (cwd buf, 32); 
printf("cwd:%s\n", cwd buf); 
sys_chdir("/dirl"); 
printf("change cwd now\n"); 
sys_getcwd (cwd buf, 32); 
printf("cwd:%s\n", cwd buf); 











30 /xx*xxxxxx 测试 代码 关 太 大 六 太太 太太/ 


LO 


while(1); 
return 0; 

















测试 代码 中 做 了 三 件 事 ， 先 在 第 24 一 25 行 获得 当前 工作 目录 并 输出 ， 然 后 第 26 行 把 工作 目录 改 为 
/dir1， 最 后 在 第 28 一 29 行 再 次 获得 当前 工作 目录 并 和 输出。 运行 结果 如 图 14-43 所 示 。 



























































图 中 最 下 面 的 3 行 是 测试 结果 ， 目 测 符合 预期 ， 好 啦 收工 啦 。 
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Bochs x86 emulator, http://bochs.sourceforge.net/ 






































DOOO12 
MODUL Generic 1234 
SECTORS: 163296 
ChPACITY: ?79MB 


all partition info 


了 start_lba NT 
start_lba:Ox1629F ， _cnt:Qx?5E1 
start_lba:OQx1D8BF, sec_cnt :OQxAS521 






































4 图 14-43 ”获取 工作 目录 与 改变 工作 目录 





14.15.1 Is 命令 的 幕后 功臣 


我 们 在 shell 中 执行 ls 命令 时 ， 屏 幕 会 输出 文件 的 属性 信息 ， 如 图 14-44 所 示 。 
图 中 的 命令 1 是 js -1 的 别名 ， 执 行 后 输出 了 文件 的 类 型 、 权 限 、 属 主 、 时 间 等 。 这 是 如 何 做 到 的 呢 ? 
不 妨 用 strace 跟 一 下 ls 命令 的 执行 过 程 ， 部 分 输出 如 图 14-45 所 示 。 


writeC1l, "drwxrwxr-x. 3 work work 4096 5\346\234"..., 49drwxrwxr-x. 3 work work 4096 5 月 26 20:39 boot 
) = 49 
stat64("/etc/localtime", {st_mode=S_IFREG|0644, st_size=405, ...})=0 
ee "drwxrwxr-x. 2 work work 4096 6\346\234"..., S50drwxrwxr-x. 2 work work 4096 6 月 16 19:12 build 
) = 
sized Vetc/Localtime" ，{fst_mode=S_IFREG10644，st_size=405，...}) = 0 

"drwxrwxr-x. 2 work work 4096 5\346\234". ,Sldrwxrwr- -Xx. 2 work work 4096 5 月 12 14:21 device 




















现 














| 





























| 








。3 work work 4096 5 月 26 20:39 boot 

,2 work work 4096 6 月 16 19:12 build ue 2 0 

。 2 work work 4096 5 月 12 14:21 device 16 19:05 fs 

。 2 work work 4096 6 月 16 19:05 fs 

。2 work work 4096 6 月 16 19:12 kernel stat64("/etc/localtime", {st_mode=S_IFREG|0644, st_size=405, ...})=0 

,4 work work 4096 6 月 8 08:07 lib writeC(1, "drwxrwxr-x. 2 work work 4096 6\346\234"..., Sldrwxrwxr-x. 2 work work 4096 6 月 16 19:12 kernel 

. 1 work work 7359 5 月 22 21:09 makefile ) = 51 

。2 work work 4096 6 月 16 09:30 thread stat64("/etc/localtime", {st_mode=S_IFREG|0644, st_size=405, ...})=0 

.2 work work 4096 6 月 8 08:01 i | 8 08:07 lib 
[work@localhost n]$ 


4 图 14-44 ”文件 属性 4 图 14-45 ”ls 命令 中 的 stat 系统 调 


原来 在 ls 命令 中 调用 了 大 量 的 系统 调用 stat64 和 
write， 其 中 stat64 用 于 获得 文件 的 属性 信息 ，write 用 于 把 。 
信息 输出 到 屏幕 ， 即 标准 输出 。 这 里 的 stat64 表示 64 位 版 ge 
本 的 stat。stat 是 干吗 的 呢 ? 那 咱们 查看 下 系统 调用 stat 的 EN 
帮助 ， 还 是 老 样子 执行 man 2 stat， 如 图 14-46 所 示 。 ER 
图 中 高 亮 的 是 stat 的 原型 ， 参 数 path 表示 待 获取 属 ”国治 区 
性 的 文件 , buf 是 存储 属性 的 缓冲 区 , 功能 是 把 文件 path 人 


st_ino; /* inode number */ 


的 属性 写 入 buf, 成 功 后 返回 0, 失败 返回 -1。 fstat 和 lstat . st_mode;  /* protection */ 


stnlink; /* number of hard links */ 






















































































stat, fstat, lstat - get file status 























































































































































































































是 stat 的 变 体 ， 只 是 调用 形式 不 同 而 已 ，fstat 以 文件 描 ce 

述 符 的 形式 获取 文件 属性 ， 因 此 其 参数 是 伺 ，lstat 专用 i 

于 文件 是 符号 链接 的 情况 。 ER st blockss fo mbe of Sa bles eluo ted 4) 
参数 buf 的 类 型 是 struct stat， 下 面 也 贴 出 了 其 结构 ， ra et ee 








time_t st_ctime; /* time of last status change */ 








其 中 st_dev 是 文件 的 设备 id，st_ino 是 文件 的 inode 编号 ， 
st_mode 是 文件 的 类 型 及 访问 权限 的 编码 ， 其 他 不 再 列举 。 4 图 14-46 stat 帮助 信息 
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说 了 这 些 , 大 伙 儿 已 经 了 解 到 , 要 想 在 用 户 环 境 下 获得 文件 属性 , 需要 提供 类 stat 的 系统 调用 , 好 吧 ， 




















et 


3 们 就 直接 实现 stat， 下 节 咱 们 正式 编码 。 





























14.15.2 ”实现 sys_stat 


























要 实现 sys_stat， 就 要 先 实 现 struct stat 结构 ， 不 过 咱们 的 struct stat 可 比 Linux 的 简单 多 了 ， 














不 支持 访问 权限 、 属 主 、 时 间 等 ， 好 ， 它 定义 在 fs.h 中 ， 见 代码 14-56。 
代码 14-56 (project/c14/n/fs/fs.h ) 





… 略 
41 /* 文件 属性 结构 体 */ 
42 struct stat { 





43 uint32 七 st ino; // inode 编号 
44 uint32 七 st size; // 尺寸 

45 enum file types st filetype; // 文件 类 型 
46 }; 

… 略 

































































咱们 的 struct stat 很 简单 ， 只 有 3 个 成 员 ， 因 此 只 能 获得 3 个 属性 ， 有 总 比 没有 



















































































































































































3 们 








好 ^ 余 。 成 员 st_ ino 是 文件 














































































































的 inode 编号 ，st_ size 是 文件 的 字 节 大 小 ，st filetype 是 文件 类 型 ， 如 普通 文件 ， 还 是 目录 。 咱 们 下 面 看 
fs.c 中 sys_stat 的 实现 ， 见 代码 14-57。 
代码 14-57 (project/c14/n/fs/fs.c ) 
… 略 
819 /* 在 buf 中 填充 文件 结构 相关 信息 ， 成 功 时 返回 0， 失败 返回 -1 */ 
820 int32 七 Sys_stat (const char* path, struct stat* puf) { 
821 /* 若 直 接 查看 根 目 录 '/' */ 
822 if (!strcmp(path, "™/") || !strcmp (path, "™/.") | 1stzcmp (Path，"/..")) { 
823 buf->st_filetype = FT DIRECTORY: 
824 buf->st_ino = 0; 
825 buf->st_size = root dir.inode->i size; 
826 return 0; 
827 } 
828 
829 int32 t ret = -1; // 默认 返回 值 
830 struct path search record searched record; 
831 memset (&searched record, 0, sizeof (struct path search record)); 
// 记得 初始 化 或 清 0， 否 则 栈 中 信息 不 知道 是 什么 
832 int inode no = search file(path, &searched record); 
833 if (inode no != -1) { 
834 struct inode* obj inode = inode open(cur part, inode no); 
// 只 为 获得 文件 大 小 
835 buf->st size = ob]j_ inode->i size; 
836 inode close (ob] inode); 
837 buf->st filetype = searched record.file type; 
838 buf->st ino = inode no; 
839 ret = 0; 
840 } else { 
841 printk("sys stat: ss not found\n", path); 
842 } 
843 dir close(searched record.parent dir); 
844 return ret; 
845 } 
… 略 
函数 sys_stat 接受 2 个 参数 ， 待 获取 属性 的 文件 路 径 path、 存 储 属性 的 缓冲 区 buf， 功 能 是 在 buf 中 填 
充 文 件 结构 相关 信息 ， 成 功 时 返回 0， 失败 返回 -1。 
函数 开头 判断 path 是 否 为 根 目录 /， 如 果 是 就 直接 在 buf 中 写 入 根 目录 的 信息 并 成 功 返 回 。 
第 829 行 定 义 了 返回 值 ret， 默 认为 -1。 第 830 一 832 行 在 文件 系统 上 查找 文件 path， 如 果 文 件 存 在 ， 





















































第 834 行 打开 文件 的 inode， 这 是 为 了 获取 文件 大 小 。 下 面 分 别 填充 buf 中 的 st_ size、st filetype 和 st ino， 





























并 将 ret 置 为 0。 如 果 文 件 不 存在 ， 输 出 文件 不 存在 的 提示 。 
最 后 关闭 目录 ， 返 回 ret， 函 数 结束 。 
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您 懂 的 ， 每 到 这 个 时 候 就 要 测试 了 ，main.c 中 的 测试 代码 如 下 。 








19 int main(void) { 

20 put_str("I am kernel\n"); 

21 init all(); 

22 /类 太 类 类 大大 大大 测试 代码 大 大 类 类 大 类 大 大 / 

23 struct stat obj stat; 

24 sys_stat ("/", &ob]j] stat); 

25 printf("/‘s info\n i no:%sd\n size:%d\n filetype:%s\n", \ 
26 obj stat.st ino obj stat.st size \ 

忆 Obj stat.st filetype == 2 ? "directory" : "regular"); 
28 sys_stat ("/diril", &obj stat); 

29 printf("/dirl‘s info\n i no:%d\n size:%$d\n filetype:%$s\n", \ 
30 obj stat.st ino, obj stat.st size, \ 

| Obj stat.st filetype == 2 ? "directory" : "regular"); 
32 /** 类 米 炎 火炎 火炎 测试 代码 类 类 火炎 火炎 炎炎/ 

33 while(1); 

34 return 0; 

35: 1 

… 略 
































TT 


























第 23 行 定义 的 obj_stat 将 作为 buf 的 实 参 ， 用 于 存储 文件 的 属性 ， 接 下 来 调用 sys_stat 分 别 获取 根 目 
录 “/” 和 目录 “/dirl1” 的 信息 。 不 说 了 ， 看 运行 结果 ， 如 图 14-47 所 示 。 
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start_lba 
sdb9 start_lba 
ide_init done 
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14-47 ”sys_stat 运行 结果 
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图 中 最 下 面 的 8 行 是 测试 代码 的 输出 ， 根 目录 的 ino 为 0，size 为 96， 每 个 目录 项 大 小 是 24 字 节 ， 
因此 根 目录 中 共 4 个 目录 项 ， 分 别 是 “.”、“..”、“filel”、“dir] ”。 

/dirl 的 ino 为 2?， 我 们 之 前 在 排查 根 目 录 时 就 知道 啦 (不 信和 的 话 可 以 再 看 下 图 14-34)，size 是 48， 
这 说 明 该 目录 是 空 目 录 ， 其 下 只 有 “.” 和 “..”。 
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第 15 草 ”系统 交 孔 


fork 是 什么 ? 叉子 ? 对 ，fork 就 是 又 子 ， 没 有 比 这 个 更 完美 的 答案 了 。 














15.1.1 什么 是 fork 


开门 见 山 ， 本 节 献 给 那些 对 fork 函数 不 熟悉 的 同学 ， 高 手 请 略 过 。 

fork 函数 原型 是 pid_t fork(void)， 返 回 值 是 数字 ， 该 数字 有 可 能 是 子 进程 的 pid， 有 可 能 是 0， 也 有 可 
能 是 -1。1 个 函数 有 3 种 返回 值 ， 这 是 为 什么 呢 ? 可 能 的 原因 是 Linux 中 没有 获取 子 进程 pid 的 方法 ， 
此 ， 为 了 让 父 进程 获知 自己 的 孩子 是 谁 ，fork 会 给 父 进程 返回 子 进程 的 pid。 子 进程 可 以 通过 系统 调用 
getppid 获知 自己 的 父亲 是 谁 ， 并 且 没 有 pid 为 0 的 进程 ， 因 此 fork 给 子 进程 返回 0， 以 从 返回 值 上 和 父 进 
程 区 分 开 来 。 如 果 fork 失败 了 ， 返 回 的 数字 便 是 -1， 自 然 也 没有 子 进程 产生 ，duang… 返 回 值 的 意义 搞定 。 
虽然 解释 了 返回 值 的 意义 ， 但 我 还 是 不 理解 这 其 中 的 奥妙 ， 回 想 当 初 我 第 一 次 接触 fork 函数 的 时 候 ， 
真 地 觉得 它 是 个 高 端 大 气 上 档次 的 玩意 儿 ， 最 让 我 不 可 思议 的 是 fork 执行 一 次 竟然 会 返回 两 次 pid， 这 是 
什么 原理 ? 下 面 咱们 复习 下 那个 经 典 且 让 人 “迷惑 ”的 例子 。 


测试 代码 fork_a.c 





















































六 








































































































































































































































































































1 #include <unistd.h> 
2 #include <stdio.h> 
3 int main() { 





4 printf("I will fork in 5 seconds\n"); 

5 sleep (5); 

6 int pid = fork(); 

7 if (pid == -1) { 

8 return 1; 

9 } 

0 if (pid) { 

1 printf ("I am father, my pid is Sd\n",getpid()); 
2 sleep (5); 

3 return 0; 

4 } else { 

5 printf("I am child, my pid is %d\n",getpid()); 
6 sleep(5); 

7 return 0; 

8 } 

9 




















声明 下 ， 我 是 为 了 说 明 问 题 故 意 把 代码 写成 这 样 的 ， 我 们 先 不 着 急 看 运行 结果 ， 简 单 分 析 下 代码 。 

主 函 数 开头 先 输出 ，5 秒 后 将 执行 fork。 然 后 休眠 5 秒 ， 这 样 做 的 目的 是 预 留 出 缓冲 时 间 来 抓 取 进 程 
的 个 数 ， 一 会 您 就 知道 了 。 

在 第 6 行 fork 函数 调用 过 后 ， 后 面 会 根据 pid 的 结果 跳 到 不 同 的 执行 分 文 。 如 果 pid 为 -1， 这 说 明 fork 
失败 ， 直 接 退 出 。 到 了 第 10 行 之 后 ， 此 时 的 pid 应 该 大 于 等 于 0。 第 10 行 判断 如 果 pid 为 大 于 0 〈 非 0)， 这 
说 明 fork 认为 自己 是 父 进程 ， 于 是 咱们 在 代码 中 输出 “I am father…”。 否则 pid 为 0 的 话 ， 这 说 明 fork 认为 自 
己 是 子 进程 ， 于 是 输出 “I am child…”。 下 面 看 运行 结果 ， 如 图 15-1 所 示 。 

ps 是 获取 进程 状态 的 命令 ， 我 们 可 以 把 ps 的 结果 通过 管道 传 给 grep 命令 ， 让 grep 过 滤 出 关键 信息 。 













































































































































































































































































眠 。 
线 下 


的 作 


中 多 了 


您 看 fork ac 编译 为 fork test a 之 后 ， 运 行 结 果 中 ， 先 打印 出 了 “TI will fork in 5 seconds”， 然 后 体 
同时 ， 我 在 另 一 个 窗口 中 通过 “ps -eflgrep fork testlgrep -Vv grep” 获 取 了 fork test 的 情况 ， 此 时 
未 执行 fork 函数 ， 系 统 中 就 上 
过 了 5 秒 后 ， 父 子 进程 
时 我 又 在 另 一 窗 


山 




















[work@localhost book]$ gcc -o fork_test_a fork_a.c 
[work@localhost book]$ ./fork_test_a 

I will fork in 5 seconds 

I am father, my pid is 2810 

I am child, my pid is 2815 

[work@localhost book]$ 


在 另 一 窗口 中 执行 


[work@localhost ~]$ ps -eflgrep fork_test1grep -v grep 


work 2810 1949 0 16:59 pts/0 00:00:00 ./fork_test_a 
[work@localhost ~]$ ps -eflgrep fork_testlgrep -v grep 

work 1949 0 16:59 pts/0 00:00:00 ./fork_test_a 
work 2815 | 2810 0 16:59 pts/0 00:00:00 ./fork_test_a 
[work@localhost ~]$ 








4 图 15-1 fork 测试 a 
















































































图 中 画 下 画 线 的 是 同一 时 间 内 的 配合 输出 。 
自己 的 pid， 父 进程 pid 是 2810， 子 进程 








只 有 一 个 fork test a。 
思 


站 别 打印 了 


















































































































































程序 从 第 6 行 开始 便 玩 起 了 分 身 术 ， 从 一 个 进程 变 成 了 两 个 进程 ， 


























个 进程 ， 





程 拥 有 独立 的 地 址 空间 ， 因 此 两 个 进程 执行 的 是 独立 且 


相同 














而 





且 它 们 各 














执行 的 是 fork 之 后 日 


的 指令 





pid 是 2815， 然 后 
中 重复 执行 以 上 的 命令 ,屏幕 显示 了 两 个 同名 为 fork_test_a 的 进程 ， 也 就 是 下 画 
四 的 输出 信息 ， 其 中 男 框 框 的 部 分 是 两 个 进程 各 自 的 pid。 
说 到 这 里 ， 答 案 似 乎 清楚 一 些 了 ， 原 来 fork 之 后 ， 由 之 前 的 一 个 进程 变 成 了 两 个 进程 ， 
用 就 是 克隆 进程 。 
进 


民 ， 与 此 








1 于 尚 











同时 休 





这 说 明 fork 
也 就 是 说 ， 内 存 
的 代码 ， 也 就 是 两 套 代码 ， 

















烦 )， 所 以 在 fork 之 后 ， 父 子 进 程 像 是 “分 道 扬 镀 ”了 。 
程序 是 指 在 磁盘 上 存储 的 文件 ， 是 静态 的 ， 进 程 是 指 程序 被 加 载 到 内 存 后 ， 在 内 存 中 运行 中 的 程 





的 代码 〈 其 实 可 以 让 子 进程 的 执行 流下 
































都 包括 第 6 行 的 fork 调用 ， 只 是 子 进程 是 在 fork 函数 返 世 






























































之 后 才 开始 执行 的 ， 因 此 
到 fork 之 前 重新 调用 fork， 但 意义 不 大 且 非 常 麻 




















简 而 言 
序 的 两 个 实 
载运 行 后 前 





>， 进 程 就 是 运行 的 程序 
网 进程 。 举 个 例子 ， 
成 了 进程 a， 在 进程 
a， 也 就 是 说 内 存 中 存在 两 个 同名 的 进程 a， 它 












































字 映 像 ， 


父子 进程 的 进程 体 〈 代 码 段 数 据 段 等 ) 是 一 模 一 样 的 ， 相 当 于 执行 了 同一 程 




















比如 程序 a 会 根据 用 户 输入 的 不 同 从 



































而 执行 不 同 的 分 支 《 代 码 块 )， 程 


序 a 加 


























a 运行 的 同时 又 将 程序 a 再 一 次 加 载 到 内 存 运行 ， 这 时 系统 中 就 又 多 了 


门 拥有 一 模 一 样 的 程序 体 ， 但 由 于 































































































相同 的 进程 会 执行 各 EE 


























程序 体 ! 






































都 一 样 ， 尽 管 只 会 选 
回 
程 来 说 者 
块 ， 这 只 是 设计 逻辑 的 需要 ， 与 fork 无 关 ，fork 的 任务 就 是 克隆 






































到 | 咱 



































之 后 父子 进程 都 要 处 理 各 自 进程 中 从 第 6 行 以 后 的 代码 ， 这些 






























































] 户 输入 的 内 容 不 同 ， 这 两 个 
不 同 的 分 支 , 但 是 这 些 分 支 对 每 个 进程 而 言 都 是 可 见 的 , 每 个 进程 中 的 分 支 情 况 
泽 其 中 的 一 个 分 支 来 执行 。 
们 的 例子 ，fork 
了 是 相同 的 ， 我 们 只 是 把 pid 的 值 作为 分 支 的 条 件 


尺码 对 于 父子 进 
i 已 ， 原 则 上 不 需要 按照 pid 的 不 同 来 划分 代码 


个 进程 












































在 





立 完整 的 程序 体 ， 是 个 独立 的 执行 流 。 
按照 pid 来 划分 程序 分 支 ， 这 只 是 程序 逻辑 上 的 需要 ， 它 很 经 典 却 又 让 人 “迷惑 ” 话说 不 知道 当年 有 多 





688 





指 一 部 分 人 都 会 觉 
个 代码 块 "”。 究 其 原因 ， 这 都 是 第 
先入 为 主 的 影响 太 深刻 了 。 为 了 还 原 其 本 质 ， 


少 人 和 我 一 样 被 这 个 例子 搞 得 蒙 圈 了 。 经 














模 一 样 的 进程 出 来 ,该 进程 拥有 独 



































是 指 这 充分 体现 了 fork 的 优势 ， 可 以 同时 做 两 件 事 。 迷惑 是 












































10 一 14 行 的 过 (pid) ...else 车 的 祸 ， 关 键 是 大 家 都 用 














下 面 把 代码 搞 得 更 清楚 一 些 。 


测试 代码 fork_b.c 











#include <unistd.h> 
#include <stdio.h> 


int main() 


{ 


int pid = fork(); 


于 下 


(PiQ == =) -1{ 


得 :“fork 之 后 父子 进程 一 定 会 按照 pid 分 别 执行 不 同 的 分 支 ， 父 子 进 程 不 能 执行 同一 
这 种 例子 来 介绍 fork， 





6 return 1 

| 

8 printf("who am I ? my pid is sdqxn" getpid() 
9 sleep (5); 

10 return 0; 





除了 第 5 行 判断 是 否 失 败 外 ， 程 序 中 没有 任何 分 支 ， 也 就 是 父子 进程 都 做 








); 





























pid， 都 sleep(5)， 这 样 是 不 是 更 好 理解 fork 了 了 呢 ? 下 面 是 运 
































您 看 两 个 进程 都 打印 出 “who am1...” 并 且 输 出 自己 的 pid。 总 之 父子 进程 都 在 做 相同 的 






































如 图 15-3 所 示 。 





[work@localhost book]$ gcc fork_b.c -o fork_test_b 
[work@localhost book]$ ./fork_test_b 

who am I ? my pid is 2733 

who am I ? my pid is 2734 

[work@localhost book]$ 


在 另 一 窗口 中 执行 


[work@localhost ~]$ ps -eflgrep fork_testlgrep -v grep 
1949 0 16:31 pts/0 00:00:00 ./fork_test_b 
2734| 2733 0 16:31 pts/0 00:00:00 ./fork_test_b 


[work@localhost ~]$ 





4 图 15-2 fork 测试 b 











行 结果 ， 如 图 15-2 所 示 。 











同样 的 事 ， 都 输出 自己 的 





























e—fork() 

















I 
hail 
3 
o 

















A 图 15-3 fork 叉子 


fork 就 是 个 叉子， 叉子 的 柄 部 是 一 根 ， 在 某 个 地 方 就 一 分 为 二 为 两 个 又 子 ， 且 每 个 又 子 都 是 一 样 的 ， 这 同 
程序 在 调用 fork 前 后 的 执行 流 状 态 是 一 致 的 。 现 在 您 对 fork 为 什么 叫 fork 是 不 是 特别 的 认同 了 ? 如果 还 是 不 









































容易 理解 的 话 ， 可 以 认为 : fork 就 是 相当 于 同一 个 程序 多 次 加 














载 执行 ， 因 此 在 内 存 中 产生 了 多 个 同名 进程 。 





好 啦 ， 有 关 fork 的 内 容 就 介绍 到 这 ， 本 节 到 此 结束 ， 下 节 再 见 。 








15.1.2 fork 的 实现 


























fork 利用 老 进程 克隆 出 一 个 新 进程 并 使 新 进程 执行 ， 新 进程 之 所 以 能 够 执行 ， 






































这 其 中 包括 代码 和 数据 等 资源 。 因 此 fork 就 是 把 某 个 进程 的 全 部 资源 复制 了 一 
寄存 器 指向 新 进程 的 指令 部 分 。 故 : 实现 fork 也 要 分 两 步 ， 先 复制 进程 资源 ， 然 后 有 
考虑 一 下 ， 进 程 有 哪些 资源 呢 ? 确定 了 之 后 咱们 就 知道 该 复制 什么 了 ， 梳 理 







































































本 质 上 是 它 具 备 程序 体 ， 













































































(1) 进程 的 pcb， 即 task_ struct， 这 是 让 任务 有 “存在 感 ” 的 身份 证 。 


(2) 程序 体 ， 即 代码 段 数 据 段 等 ， 这 是 进程 的 实体 。 
(3) 用 户 栈 ， 不 用 说 了 ， 编 译 器 会 把 局 部 变量 在 栈 中 创 





























下 。 




















建 ， 并 且 函 数 调用 也 离 不 了 栈 。 



































(4) 内 核 栈 ， 进 入 内 核 态 时 ， 一 方面 要 用 它 来 保存 上 下 文 环境 ， 另 一 方面 的 作用 同 




















(5) 虚拟 地 址 池 ， 每 个 进程 拥有 独立 的 内 存 空间 ， 其 虚 
《6) 页 表 ， 让 进程 拥有 独立 的 内 存 空间 。 



















































































































































































克隆 出 来 的 进程 该 如 何 执行 呢 ? 这 个 简单 ， 只 要 将 新 进程 加 入 到 就 绪 队 列 : 











相关 的 栈 准 备 好 才 行 。 






























































“int16 t parent pid”， 它 位 于 cwd_inode nr 之后， 表示 父 进 








thread.c 中 的 init_ thread 函数 中 增加 一 名 “pthread->parent pid = -1;”， 使 他 














程 的 pid， 也 就 是 上 








分 ， 然 后 让 处 理 器 的 cs:eip 
下 跳 过 去 执行 。 


] 户 栈 一 样 。 
以 地 址 是 用 虚拟 地 址 池 来 管理 的 。 


就 可 以 啦 ， 当然 提 前 要 把 





在 真正 编写 fork 代码 之 前 ， 咱 们 还 要 增加 一 些 基础 设施 ， 首 先 在 thread.h 的 task_struct 中 增加 了 成 员 














己 的 父 进程 是 谁 


E。 然 后 在 









































F 务 的 父 进程 默认 为 -1，-1 表示 


没有 父 进程 。 另 外 在 thread.c 中 还 为 fork 专门 增加 了 个 分 配 pid 的 函数 ， 其 声明 为 “pid_t fork_pid(void)”， 
这 么 做 的 原因 是 allocate pid 是 个 静态 函数 ， 


其 实现 就 是 “return allocate pid0;” 仅仅 是 个 简单 的 封装 ， 

















不 能 被 外 部 调用 ， 同 时 又 不 想 破 坏 其 原 有 类 型 ， 所 以 用 fork pid 封装 它 。 以 | 








贴 代 码 。 
下 面 还 要 在 memory.c 中 增加 个 函数 ， 见 代码 15-1 。 



































上 的 修改 比较 简单 ， 故 未 单独 





689 























代码 15-1 (project/c15/a/kernel/memory.c ) 

… 略 
232 /* 安装 1 页 大 小 的 vaddr， 专 门 针 对 fork 时 虚拟 地 址 位 图 无 需 操作 的 情况 */ 
233 void* get a page without opvaddrbitmap (\ 

enum pool flags pf, uint32 t vaddr) { 
234 struct pool* mem pool = pf & PF KERNEL ? &kernel pool &user pool; 
235 lock acquire(&mem pool->lock); 
236 void* page phyaddr = palloc (mem pool); 
237 if (page phyaddr == NULL) { 
238 lock release(&mem pool->lock); 
2.39. return NULL; 
240 } 
241 page table add( (void*)vaddr, page phyaddr); 
242 lock release (&mem pool->lock); 
243 return (void*)vaddr; 
244 } 
… 略 


函数 get_a_page_without_opvaddrbitmap 名 字 好 怪异 是 吧 ? 抱歉 ， 我 实在 想 不 出 合适 的 名 字 ， 此 函数 的 功能 

















多 


过 
局 
人 已 \ 


1 


同 get_a_page 类 似 ， 只 是 少 了 虚拟 地 址 池 位 





的 操作 ， 为 了 突显 这 种 





义 ， 所 以 函数 名 显得 怪异 。 它 接受 2 个 参 






































数 ， 内 存 池 标 识 pf、 虚 拟 地 址 vaddr， 功 能 是 
函数 的 实现 是 get_a_page 的 后 半 部 分 ， 不 解释 了 。 等 在 fork 中 用 到 此 函数 时 大 伙 儿 就 明 
下 面 在 fork.c 中 实现 了 fork 的 内 核 部 分 ，sys_fork， 见 代码 15-2-1。 






























































































































































































































































































































































代码 15-2-1 (project/c15/a/userprog/fork.c ) 
… 略 
0 extern void intr exit (void); 
w 
2 /* 将 父 进程 的 pcp 找 贝 给 子 进程 */ 
3 static int32 t copy pcb vaddrbitmap_ stack0 (\ 
struct task struct* child thread, struct task struct* parent thread) 
4 /* a 复制 pcb 所 在 的 整个 页 ， 里 面包 含 进程 pcb 信息 及 特级 0 极 的 栈 ， 
里 面包 含 了 返回 地 址 */ 
3 memcpy (child thread, parent thread, PG SIZE); 
6 /* 下 面 再 单独 修改 */ 
child thread->pid = fork pid(); 
8 child thread->elapsed ticks = 0; 
9 child thread->status = TASK READY; 
20 child thread->ticks = child thread->priority; // 为 新 进程 把 时 间 片 充 
2 child thread->parent pid = parent thread->pid; 
22 child thread->general tag.prev = \ 
child thread->general tag.next = NULL; 
2.3 child thread->all list tag.prev = child thread->all list tag.next 
24 block desc init(child thread->u block desc); 
25 /* pb 复制 父 进程 的 虚拟 地 址 池 的 位 图 */ 
26 uint32 t bitmap pg_cnt = DIV_ROUND UP(\ 
(0xc0000000 - USER VADDR START) / PG SIZE / 8 , PG SIZE); 
2 void* vaddr btmp = get kernel pages (bitmap pg_ cnt); 
28 /* 此 时 child thread->userprog vaddr.vaddr bitmap.bits 
还 是 指向 父 进程 虚拟 地 址 的 位 图 地 址 
29 下 面 将 child thread->userprog vaddr.vaddr bitmap.bits 
指向 自己 的 位 图 vaddr_btmp */ 
30 memcpy (vaddr btmp, \ 
child thread->userprog vaddr.vaddr bitmap.bits, \ 
bitmap pg cnt * PG SIZE); 
child thread->userprog vaddr.vaddr bitmap.bits = vaddr btmp; 
32 /* 调试 用 */ 
烛光 ASSERT (strlen (child thread->name) < 11) 
// pcb .name 的 长 度 是 16， 为 避免 下 面 strcat 越界 
34 strcat (child thread->name," fork"); 
35 return 0; 
36: 
37 
38 /* 复制 子 进程 的 进程 体 ( 代码 和 数据 ) 及 用 户 栈 */ 
39 static void copy body stack3(struct task struct* child thread,\ 
struct task struct* parent thread, void* buf page) { 
40 uint8 t* vaddr btmp =\ 
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能 是 为 vaddr 分 配 一 物理 页 ， 但 无 需 从 虚拟 地 址 内 存 池 中 设置 位 图 。 本 





白 为 什么 这 么 做 了 。 


{ 


NULL; 


parent thread->userprog vaddr .vaddr ] 
































































































































bitmap.bits; 






























































































































































































































































































































































































































































41 uint32 七 btmp bytes len = 
parent thread->userprog vaddr.vaddr bitmap.btmp bytes len; 
42 uint32 t vaddr start = parent thread->userprog vaddr.vaddr start; 
43 uint32 t idx byte = 0; 
44 uint32 七 idx bit = 0 
45 uint32 t prog vaddr = 0; 
46 
47 /* 在 父 进程 的 用 户 空 间 中 查找 已 有 数据 的 页 */ 
48 while (idx byte < btmp bytes len) { 
49 if (vaddr btmp [idqx byte]) { 
50 idx bit = 0; 
S51. while (idx bit < 8) { 
52 If ((BITMAP MASK << idx bit) & vaddr btmp [idqx byte]) { 
D3 prog vaddr = (idx byte * 8 + idx bit) * PG SIZE + vaddr start; 
54 ”/* 下 面 的 操作 是 将 父 进程 用 户 空间 中 的 数据 通过 内 核 空间 做 中 转 ， 
最 终 复 制 到 子 进 程 的 空间 */ 
55 
56 /* a 将 父 进程 在 用 户 空间 中 的 数据 复制 到 内 核 缓冲 区 buf_page， 
57 的 是 下 面 切 换 到 子 进程 的 页 表 后 ， 还 能 访问 到 父 进程 的 数据 */ 
58 memcpy (buf page, (void*)prog vaddr, PG SIZE); 
59 
60 ”/* b 将 页 表 切 换 到 子 进 程 ， 目 的 是 避免 下 请 内 存 的 函数 
将 pte 及 pde 安装 在 父 进程 的 页 表 中 */ 
61 page dir activate (child thread); 
62 /* c 申请 虚拟 地 址 prog vaddr */ 
63 get a page without opvaddrbitmap (\ 
PF_USER, prog vaddr); 
64 
65 /* qd 从 内 核 缓 冲 区 中 将 父 进 程 数据 复制 到 子 进程 的 用 户 空 间 */ 
66 memcpy ( (voidx)Prog vaddr, buf page, PG SIZE); 
67 
68 /* e 恢复 父 进程 页 表 */ 
69 page dir activate (parent thread) 
70 } 
7 Gb, 4 oh et 2 
了 和 } 
13 } 
74 idx bytett; 
75 } 
76 } 
.. 略 
函数 copy_pcb_vaddrbitmap_stack0 接受 2 个 参数 ， 子 进程 child_ thread、 父 进程 parent _ thread， 功 能 是 
将 父 进程 的 pcb、 虚 拟 地 址 位 图 找 贝 给 子 进 程 。 
函数 开头 通过 memcpy 把 父 进 程 的 pcb 及 其 内 核 栈 一 同 复制 给 子 进程 。 下 面 开始 单独 修改 pcb 中 的 属性 值 。 
第 17 行 通过 fork_pid 函数 为 子 进程 分 配 新 的 pid， 此 函数 仅 是 allocate_pid 的 封装 ， 目 的 是 可 供 外 部 
调用 。 接 下 来 的 第 18 一 23 行 主要 是 置 子 进程 的 status 为 TASK READY， 目 的 是 让 调试 器 schedule 安排 其 
上 CPU。 还 有 将 子 进程 时 间 片 ticks 置 为 child thread->priority， 为 其 加 满 时 间 片 ， 以 及 将 parent pid 置 为 


parent thread->pid 等 。 



































































































































































































































































































































































































































咱们 用 child thread->userprog vaddrvaddr bitmap.bits 来 管理 进程 的 虚拟 地 址 空间 ， 此 时 它 还 是 指向 父 
进程 虚拟 地 址 位 图 所 在 的 内 核 页 框 ， 每 个 进程 都 是 单独 的 4GB 虚拟 地 址 空间 ， 子 进程 不 能 和 父 进程 共用 
同一 个 虚拟 地 址 位 图 。 因 此 下 面 准备 复制 父 进程 虚拟 地 址 池 的 位 图 给 子 进程 。 

第 24 行 通过 “block_desc_init(child thread->u_block_desc)” 初 始 化 进程 自己 的 内 存 块 描述 符 ， 如 果 没 
这 名 代码 的 话 ， 此 处 继承 的 是 父 进程 的 块 描 述 符 ， 子 进程 分 配 内 存 时 会 导致 缺 页 异常。 

先 在 第 26 行 计算 虚拟 地 址 位 图 需要 的 页 框 数 bitmap pg_cnt， 然 后 在 第 27 行 申请 bitmap_pg_cnt 一 个 
内 核 页 框 来 存储 位 图 。 在 第 30~31 行 完 成 了 虚拟 地 址 位 图 的 复制 。 

函数 内 的 最 后 两 行 是 将 子 进程 的 函数 名 加 上 了 后 级 “_fork”， 按理 说 子 进程 与 父 进 程 是 同名 的 ， 因 此 
这 是 咱们 调试 用 的 ， 以 后 能 在 进程 列表 中 看 到 区 别 ， 调 试 过 后 会 把 这 两 行 代码 删 掉 。 

下 面 是 函数 copy_body_stack3， 它 接受 3 个 参数 ， 子 进程 child_thread、 父 进程 parent_ thread、 页 缓冲 
区 buf page，buf page 必须 是 内 核 页， 我 们 要 用 它 作为 所 有 进程 的 数据 共享 缓冲 区 ， 后 面 会 有 详 述 。 函 数 


功能 





的 虚 











是 复 条 





j 户 栈 。 











此 函数 的 主要 3 














拟 地 址 空间 ， 











了 ， 哪 有 
家 ， 整 个 32 位 ] 


址 完 


的 内 存 、 堆 中 申请 的 内 存 和 和 用 
也 址 处 是 进程 
从 USER STACK3 VADDR， 即 


空间 





历 虚 




















的 是 


























力 








全 用 满 


B34 


地 址 空 
的 ， 因 此 我 们 

















Bb 么 大 的 物理 内 存 ， 而 
间 中 就 











且 虽 1 
个 用 户 进 











程 


贝 进程 的 代码 和 数据 资源 ， 也 就 是 复制 一 份 进程 体 。 按 理 说 i 
j 户 空间 ， 最 简单 的 办 法 就 是 将 这 3GB 
门 还 没 实现 虚拟 内 存 管理 机 制 ， 即 












































再 找 贝 
使 物理 
不 通 。 其 实 很 少 有 


份 出 来 ， 







































































确实 这 个 方法 行 
































[HH 




















用 户 使 





的 内 存 是 | 














只 要 把 


虚拟 











户 经 











中 ， 低 


























户 栈 内 存 。 














拟 地 址 位 图 








间 中 有 
内 存 池 来 管理 的 ， 也 就 是 pcb 中 


0xc0000000 - 0x1000 处 往 低地 址 发 
的 每 一 位 ， 这 样 才能 找 出 进程 正在 使 用 的 内 存 。 


























占 | 








进程 





我 们 的 目的 是 将 父 进程 用 
3GB 空间 是 独立 的 ， 各 | 
进程 共享 的 ， 因 此 要 想 把 数 和 











克基 党 





义 过 








程 用 户 空间 


























第 40 一 45 行 是 为 后 续 遍 历 做 准备 ， 将 各 种 变量 指向 
的 内 存 。 














户 空间 中 的 数据 复制 到 子 进 程 的 用 














效 的 部 分 ， 也 就 是 有 数据 的 部 分 拷贝 


的 userprog vaddr。 这 包括 


DLL 






































我 们 之 前 已 经 了 解 过 进程 的 内 存 布 





的 数据 段 、 代 码 段 ， 其 余部 分 是 堆 和 栈 共同 的 空间 ， 挫 从 低地 址 往 高 地 址 发 








和 你 也 笑 





内 存 很 大 的 话 也 不 能 这 么 败 
进程 把 3GB 用 户 虚 拟 地 
来 就 行 了 。 

j 户 进程 
局 ， 其 中 低 3GB 的 虚拟 ] 








占用 
地 址 
展 ， 栈 








体 


























大 








展 。 它 们 的 分 布 不 连续 ， 




















父 进程 虚拟 内 存 池 相 关 的 参数 或 值 。 





此 我 们 要 裔 


下 面 开 始 寻 




















户 空 间 




















的 数据 复 








居 从 


生 | 
由 





j 户 进程 不 能 互相 访问 彼此 的 空间 ， 但 高 1GB 
程 拷贝 到 另 一 个 进程 











个 进 




















为 节省 缓冲 





HH 


























子 进 


地 址 空间 页 ， 也 就 是 一 页 一 页 的 对 找 ， 
了 ， 不 同 进 程 之 所 有 志 
时 候 ， 会 在 页 表 中 产生 





至 


Re 


既然 


buf page 的 数据 拷贝 到 子 进程 之 前 ， 
48 行 在 父 进 程 虚 拟 地 址 位 图 字 节 长 度 btmp_ bytes len 的 范围 


节 不 
这 判 


prog_vaddr 处 的 1 页 复 
配 内 存 之 前 ， 先 调用 “page_dir activate(child thread)” 激 活 子 进程 的 页 表 ， 然 后 


程 分 


without_opvaddrbitmap(PF_USER, prog_vaddr)” 为 子 进程 分 配 1 页 ， 
buf page, PG_SIZE);” 完 成 内 核 空 间 到 子 进程 空间 的 复制 ， 最 后 再 








又 空间， 这 是 





我 们 采 / 








| 到 内 核 的 buf_page 中 ， 然 后 再 将 buf page 复制 到 子 进程 的 
的 方法 是 : 在 父 进 程 虚拟 





























E>» 必须 要 ff 











。 但 大 伙 儿 知道 ， 各 用 
是 内 核 空间 ， 内 核 空间 是 所 有 用 
助 内 核 空间 作为 数据 中 转 ， 











户 进程 的 

















氏 
户 
生 


即 先 ; 



































bh 址 空间 中 每 找到 一 页 占用 











程 的 虚拟 地 址 空间 中 分 配 一 页 内 存 ， 然 后 将 buf_page 中 父 进 程 的 数据 复制 
比 





大 





了 











j 户 空间 中 。 
的 内 存 ， 就 在 


















































到 为 子 ; 


进程 























折 分 配 的 虚拟 











我 们 的 buf page 只 要 1 页 大 小 就 够 了 。 但 





























我 们 是 为 子 进 








第 


2 




















遇 


























将 父 进程 的 页 表 恢 复 。 然 后 进入 下 一 循环 ， 继 续 寻 找 父 进 程 占用 的 虚 
的 最 高 处 ， 所 以 循环 到 最 后 
































由 于 用 











es 








用 











有 单独 的 虚拟 地 
的 pte， 如 果 申 i 
程 分 配 内 存 ， 那 么 我 们 要 确保 这 


址 空 间 ， 原 























对 是 它们 各 自 有 单独 的 页 

































































的 内 存 跨 4MB 的 页 表 大 小 的 话 ， 还 要 在 页 目录 表 


上 5 






































如 








定 要 将 页 表 








是 大 伙 儿 一 定 也 狂 
录 表 ,我 们 在 分 配 内 存 的 





中 创建 pde， 


pte 和 pde 是 创建 在 子 进程 的 页 目录 表 中 。 所 以 在 将 











~ 


换 为 子 进程 的 页 表 。 思 路 就 是 这 样 ， 
































而 继续 看 代码 。 








下 局 








内 逐 字 节 查 看 位 图 





让 
a 











为 0， 也 就 是 菜 位 为 1， 即 某 个 位 有 效 ， 已 分 配 ， 下 
fh， 如 果菜 位 的 值 为 1， 就 在 第 53 行将 该 位 转换 为 虚拟 























四 第 51 行 开始 逐 位 查看 该 字 节 。 
地 址 prog vaddr， 接 下 来 i 






































制 到 buf page， 注 意 此 时 








二 这 
只 是 完 


成 了 父 进 程 的 数据 拷贝 到 内 核 空间 。 


49 行 如 果 该 字 
通过 第 52 行 的 
通过 memcpy 将 


和 








在 为 子 进 











上 由 






































4 调 



































接着 再 调用 








户 栈 位 于 低 3GB 虚拟 空间 ! 


























调 























拟 空 间 。 























时 会 完成 用 户 栈 的 复制 。 





下 面 看 fork.c 的 第 二 部 分 ， 见 代码 15-2-2。 


… 略 
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程 pid 返 


代码 15-2-2 


/* 为 子 进程 构建 thread_stack 和 修改 返 





口 


值 为 0 */ 




















进程 0 级 栈 栈 


k* intr 0 stack = 





页 */ 

















程 的 返 





口 





值 为 0 */ 























78 

9 statice Lnit32. TC bul 

80 ”/* a 使 子 过 

81 ”/* 获取 子 

82 struct intr stac 
(uint32 tyehild: 

83 /* 修改 子 过 

84 

85 

86 
将 其 构建 和 

87 

88 


intr 0_stack->eax = 0; 





( project/c15/a/userprog/fork.c ) 








口 





值 */ 





ld child stack(struct task struct* child thread) { 


(struct intr stack*)\ 


thread + PG SIZE - sizeof (struct intr stack)); 


/* b 为 switch to 构建 struct thread stack, 
FE 紧 临 intr_stack 之 下 的 空间 */ 
uint32 tx ret addr in thread stack 


(Hinta2 FF* yintr 0 stacok = Ls 





j “get a page_ 
“memcpy((void*)prog vaddr, 
“page dir activate(parent thread)” 








OWAOONOPODODP 


a 
ES 


52 





Oo 
OP 


} 











/*** 








这 三 
hh ee 2 
以 工 六 七 部 之 -志和 
U4nt32 tt* 


/* ebp 在 thread_stack 





行 不 是 必 


esi ptr in thread stack = 
edi ptr in thread stack = 


ebx ptr in thread stack = 
/ 术 业 炎炎 类 类 类 炎炎 类 类 类 火炎 类 类 大 大 类 类 类 大 类 大大 类 大 类 大 大头 大 类 大 大 类 大 类 大 大 类 大 类 大 大 大 大 类 大 大 大 大 大 大 类 大 大 大 / 











即 esp 为 "(uint32 t*)intr 0_stack - 5" */ 


Lt 


/* switch 


ebp ptr _ in thread stack = 





to 的 返 所 








*ret addr i 


n thread stack = 

















/* 下 











这 两 行 赋 




















其 实 也 不 需 








， 因 为 在 过 














会 把 寄存 器 中 的 数据 覆盖 */ 


*ebp_ ptr in thread 


_stack = 











*edi ptr in thread stack = 


/* 把 构建 的 thread_stack 的 栈 顶 作为 switch_to 恢复 数据 时 的 栈 项 */ 





child thre 
return 0; 





/* 更 新 inode 打 
static void upaq 
Ent3 tt Tocal fe 生地 
(local fd < MAX FILES OPEN PER PROC) { 
thread->fd table[local fd]; 


while 


global fd = 


ad->self kstack 











数 x*/ 





Nintr exit 


(uint32 t)intr exit; 


值 只 是 为 了 使 构建 的 thread_stack 更 加 清 帅 
为 在 i 后 一 系列 的 pop 





*ebx ptr_ in thread stack =\ 
*esi ptr in thread stack = 0; 
/ 术 太 炎炎 大 火炎 火炎 大 类 大 大 类 类 类 大 大 类 大 类 大 类 大 大 类 大 类 大 大 类 大 类 大 大 大 大 类 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 类/ 











也 址 更 新 为 intr exit， 直 接 从 中 断 返 区 





























的 ， 只 是 为 了 梳理 thread_ stack 中 的 关系 ***/ 

CO 
(ULit32. tt*) 本 区 让 0 Stack, .3 
(ULnt32 t*) intr 0 .stack = -43 


Pp 的 地 址 便 是 当时 的 esp ( 0 级 栈 的 栈 项 )， 


4 


= ebp ptr in thread stack; 


ASSERT (global fd < MAX FILE OPEN); 


if (global fd != 
file table[global fd] .fd inode->i open cntst++; 


} 


上) 


总 GET foarte 














/* 找 贝 父 进 








程 本身 所 占 资 源 给 子 进程 */ 


ate inode open cnts(struct task struct* thread) 
global fd = 0; 


(uint32 t*)intr 0 stack - 5; 


{ 


static int32 t copy process(struct task struct* child thread,\ 


Steuct ta 


/* 内 核 缓冲 


Sk_struct* 
区 


paren 








t thread) { 





















































空间 的 数据 复制 到 


作为 父 进程 
void* buf page = 
if (buf page == NULL) { 


return -1; 


} 





进程 














:空间 的 中 转 有 7 





get kernel pages (1); 














/* a 


if (copy pcb vaddrbitmap_ stack0 (child thread, parent thread) 








制 父 进程 的 pcb、 虚 拟 地 址 位 区 











return -1; 


} 














、 内核 栈 到 子 进程 */ 

















/* b 为 子 进 
child thre 


程 创 建 页 表 ， 此 页 表 仅 包括 内 核 空间 */ 


ad->pgdir = 


return -1; 


} 





























create page dir(); 
if(child thread->pgdir == NULL 


) { 





/* c 复制 父 


呈 进 程 体 及 


进程 


























栈 给 子 进程 */ 
Copy_body stack3 (child thread, parent thread, buf page); 














/* d 构建 子 进 程 thread _ stack 和 修改 返回 值 pid */ 
_ stack (child thread); 


build child 














/* e 更 新 文件 inode 的 打开 数 */ 
e open cnts (child thread); 





update inod 


mfree page (PF_ KERNEL, buf page, 


return 0; 


1); 


== -1) 


' 
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第 15 章 系统 交互 




















58 /* fork 子 进程 ， 内 核 线 程 不 可 




















59 pid t sys fork(void) { 























running thread(); 








函数 build_child_stack 接受 1 个 参数 ， 子 进程 child_thread。 功 





返回 值 。 














大 伙 儿 知道 ， 父 进程 在 执行 fork 系统 调用 
其 中 包括 进程 在 用 户 态 下 的 CS:EIP 的 值 ， 





























调试 器 安排 运行 */ 

ld thread->general tag) ) ， 
,thread->general tag); 
thread->all list tag)); 
ld thread->all list tag); 















































60 struct task struct* parent t 

61 struct task struct* child thread = get kernel pages (1); 
// 为 子 进程 创建 pcb ( task_struct 结构 ) 

62 if (child thread == NULL) 

63 return -1; 

64 } 

ES ASSERT (INTR OFF == intr get_status () 
parent thread->pgdir != NULL); 

66 

67 if (copy process (child thread, parent thread) 

68 return -1; 

69 } 

70 

ga /* 添加 到 就 绪 线 程 队 列 和 所 有 线程 队列 ， 子 时 

2 ASSERT(!elem find(&thread ready list, 

A list append(&thread ready list, &c 

74 ASSERT (!elem find(&thread all list, 

J list append(&thread all list, &chi 

16 

了 学 return child thread->pid; 

"8. 
































为 子 进程 构建 thread_stack 和 修改 





入 内 核 态 ， 中 断 入 
此 父 进程 从 fork 系统 调用 返 


口 程序 会 保存 父 进程 
后 ， 可 以 继续 fork 


























F 下 文 ， 这 
之 后 的 代码 执 





























行 。 问 题 来 了 ， 我 们 通过 例子 已 经 知道 ， 子 进程 也 是 从 fork 后 的 代码 处 继续 运行 的 ， 这 是 怎样 做 到 的 呢 ? 





栈 中 ， 那 里 保存 了 返回 地 址 ， 也 就 是 fork 之 后 的 地 址 ， 为 了 让 子 进程 也 能 继续 fork 之 后 的 代码 运行 ， 趴 





























在 这 之 前 我 们 已 经 通过 函数 copy pcb _vaddrbitmap _ stack0 将 父 进 和 


判 到 了 子 进 程 的 内 核 











们 必须 让 它 同 父 进程 一 样 ， 从 中 断 退 








， 也 就 是 要 经 过 intr_exit。 

















< 








子 进 程 是 由 











大 伙 儿 还 记得 intr_stack 栈 是 什么 1 














的 地 方 。 函 数 开头 先 获得 子 进 程 的 intr_stack 栈 的 地 址 ， 目 的 是 在 下 一 行将 eax 的 值 置 为 0， 原 














周 试 器 schedule 调度 执行 的 , 它 
中 恢复 上 下 文 ， 因 此 我 们 要 想 办 法 构建 
巴 ? 就 是 在 kernel.S : 




































































到 switch to 函数 , 而 switch to 函数 要 从 栈 thread_ stack 
的 thread_ stack。 您 看 ， 本 函数 还 
， 中 断 入 口 程 序 intr%lentry 中 保存 任务 上 下 文 






































为 子 进程 返回 0 值 ， 根 据 abi 约定 ，eax 寄存 器 中 是 

下 面 我 们 要 为 switch to 函数 构建 一 个 thread_stack， 
也 就 是 intr_ 0 _stack 的 地 址 减 4 字 节 的 地 方 ， 即 各 
thread_ stack 栈 中 eip 的 位 置 。 接 下 来 的 外 

































































是 fork 会 


此 第 84 行将 intr_stack 栈 中 的 eax 置 为 0。 
3 们 把 它 的 栈 底 放 在 intr_stack 栈 顶 的 下 面 ， 
87 行 的 代码 “(uint32_t*)intr 0 _ stack - 1”， 此 地 址 是 
入 89 一 97 行 分 别 为 thread_stack 中 的 esi、edi、ebx、ebp 安排 位 置 ， 

















这 里 最 重要 的 是 第 97 行 的 指针 ebp_ptr in thread stack， 它 是 thread_stack 的 栈 顶 ， 我 们 必须 把 它 的 值 存 














放 在 pcb 中 偏 移 为 0 的 地 方 ， 即 task_struct ! 





























的 self kstack 处 ， 将 来 switch to 要 用 它 作为 栈 顶 ， 并 且 执 








行 一 系列 的 pop 来 恢复 上 下 文 。 第 90 一 92 行 的 3 个 寄存 器 指针 只 是 为 了 使 thread_stack 栈 显 得 更 加 具有 可 























读 性 ， 实 际 运行 中 不 需要 它们 的 具体 值 。 
第 100 行将 地 址 ret_addr_in_thread_stack 处 的 值 赋值 为 intr_exit 的 地 址 ， 也 就 是 thread_stack 中 的 eip 
， 也 就 是 实现 了 从 fork 之 后 的 代码 处 继续 


























是 intr_exit， 这 就 保证 了 子 进 程 被 调度 时 ， 可 以 直接 从 中 断 返 








执行 的 目的 。 



































最 后 在 第 109 行 把 ebp_ptr_in thread _ stack 的 值 ， 也 就 是 thread_stack 的 栈 顶 记录 在 pcb 的 self_kstack 处 ， 


























这 样 switch_to 便 获得 了 咱们 刚刚 构建 的 thread_stack 栈 顶 ， 
接 下 来 是 函数 update inode_open_cnts, 它 接受 1 个 参数 ,线程 thread， 























从 而 使 程序 迈 向 intr_exit。 



































的 inode 打开 数 。 函 数 原理 也 很 简单 ， 遍 
从 中 获得 全 局 文件 表 file_table 的 下 标 global fd， 通过 它 在 file_table 中 找到 对 应 的 文 从 























结构 中 fd_inode 的 i open cnts 加 1。 
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功能 是 fork 之 后 ,更 新 线程 thread 





























描述 符 之 外 的 所 有 文 伯 
F 结 构 ， 使 相应 文件 


历 f table 中 除 前 3 个 标准 文 伯 


























描述 符 ， 





是 找 贝 父 进程 本 身 所 


下 面 看 copy_ process 函数 ， 上 出 























占 资 源 给 子 进程 。 








函数 接受 2 个 参数 ， 子 进程 





child thread 和 父 进程 


parent thread， 功 能 











此 函数 是 前 


























新 三 





| 
调 














用 create_ page _dir 函数 为 子 进程 创建 页 表 ， 该 函 
数 copy body stack3 复制 父 进程 进程 体 及 











看 所 介绍 的 函数 的 封装 ， 














函数 开头 申请 了 1 页 的 











用 函数 copy_pcb_vaddrbitmap_stack0 把 父 进程 子 的 pcb、 虚 拟 ] 






































数 定义 在 process.c: 





内 核 空间 作为 内 核 缓 冲 区 ， 即 buf page。 
地 址 位 图 








及 内 核 栈 复制 给 子 进程 ， 
， 很 久 以 前 介绍 过 。 然 后 调 ) 





接 
函 




































































] 户 栈 给 子 进程 ， 接 着 调 | 























函数 build_child_stack 为 子 进程 构建 








thread_stack， 随 后 调用 update_inode_open_cnts 更 新 inode 的 打开 数 ， 最 后 释放 buf page。 


是 克隆 当前 进 


15.1.3 


是 1, 后续 的 


下 面 是 函数 




















函数 先 调用 











程 ， 
get_kernel pages(1) 获得 1 页 内 核 空间 作为 子 进程 的 pcb。 接 下 来 调 
程 的 信息 到 子 进 程 ， 
好 啦 》 fork.c 就 介绍 完了 》 














sys_fork， 即 fork 的 内 核实 现 部 分 ， 
即 父 进程 。 
































本 节 就 到 这 ， 昌 











添加 fork 系统 调用 与 实现 init 进程 


们 下 贡 


会 。 





























本 节日 


门 要 








所 有 进程 都 是 它 





fork 本 身 是 无 参数 的 ， 因 


然后 在 第 172 一 175 行将 其 加 入 到 就 绪 队 列 和 全 部 队列 ， 最 后 返回 了 





= 








此 sys_fork 也 无 参数 。 功 能 




















] copy_ process 复制 父 进 
子 进 程 的 pid。 









































实现 init 进程 。 在 Linux 中 ，init 是 











j 户 级 进程 ， 
的 孩子 ， 故 init 是 所 有 进程 









































这 一 点 在 以 后 介绍 wait 时 会 给 大 伙 详 述 。 

















TT 





























系统 调 





的 


(1) 在 syscall.h 中 的 enum SYSCALL NR 结构 ! 


既然 init 是 所 有 进程 的 父 i 
们 要 先 完成 fork 系统 调用 。 













































































3 个 步骤 ， 顺 便 说 下 有 具体 的 代码 。 








进程 ， 也 就 是 说 它 要 主动 调 























已 下 下 


的 父 进程 ， 所 以 它 还 负责 所 有 


个 启动 的 程序 ， 基 
子 进 程 的 资源 








此 它 的 pid 
收 > 


ut 























J 











二 








j fork 才能 派生 出 子 子孙 孙 ， 所 以 在 实现 它 之 前 ， 


添加 SYS_FORK。 


(2) 在 syscall.c 中 添加 fork()， 原 型 是 pid tfork(void)， 实 现 是 “return syscall0(SYS_FORK);”。 





(3) 在 syscall-init.c 中 的 函数 syscall_init 










































































， 添 加 代码 “syscall table[SYS_ FORK] = sys_fork; ”。 


























下 面 明 们 看 init 的 实现 ，init 定义 在 main.c 中 ， 如 代码 15-3 所 示 。 
代码 15-3 (project/c15/a/kernel/main.c ) 
… 略 
25 /* init 进程 */ 
26."veoLd mLEXVSLGQ 并 
2 uint32 t ret pid = fork(); 
28 if(ret pid) { 
29 printf("i am father, my pid is %d, 
child pid is %d\n", getpid(), ret pid); 
30 },eLse’ 
3 printf("i am child, my pid is %d, ret pid is %d\n", getpid(), ret pid); 
32 } 
33 while(1); 
34 } 
init 实现 比较 简单 ， 它 先 调 用 fork， 派 生出 子 进程 ， 然 后 在 父子 进程 中 分 别 打 印 自己 的 pid 以 及 fork 
的 返回 值 ret pid。 
































前 系统 ! 














有 个 问题 , init 是 
大 伙 儿 知道 ，pid 是 从 1 开始 分 配 的 ， 
有 主线 程 ， 
main thread 之 前 创建 init， 也 就 是 在 函数 thread _init ， 
































init 的 pid 是 1， 














其 pid 为 1 ， 还 有 ilde 线程 ， 其 pid 为 2， 


j 户 级 进程 , 因此 咱们 要 调用 process_execute 他 














| 建 进程 , 但 由 谁 来 创建 nit 进程 呢 ? 















































因此 咱们 得 早 








地 创建 init 进程 ， 抢 夺 1 号 pid。 朋 








大 








此 





瑟 














们 应 该 在 创建 主线 程 的 函数 make 





























代码 15-4 


… 略 
214 /* 初始 化 线程 环境 */ 
215 void thread init(void) { 


… 略 


完成 ， 见 代码 15-4。 


( project/c15/a/thread/thread.c ) 
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第 15 章 系统 交互 
222 /* 先 创建 第 一 个 用 户 进程 :init */ 
223 process execute (init, "init"); 
// 放 在 第 一 个 初始 化 ， 这 是 第 一 个 进程 ，init 进程 的 pid 为 1 
224 
225 /* 将 当前 main 函数 创建 为 线程 */ 
226 make main thread () 
221 
228 /* 创建 idle 线程 */ 
229 idle thread = thread start ("idle", 10, idle, NULL); 
230 
231 put_str("thread init done\n"™); 
232 } 
… 略 























译 


所 有 的 相关 代码 都 介绍 过 了 ， 编 








运行 吧 ， 运 行 结果 如 图 15-4 所 示 。 


Bochs x86 emulaton http://bochs.sourceforge.net/ 


USER Copy 阐 Th ResetsuspEND Poer 
2 9 全 
天 “ 国 in 由 四 


C 
EE 
i am child, 


my pid is 1, 
my pid is 4, 


child pid 
dt] 


all partition info 

sdbl start_lba :OQx3F, 
sdb5 start_lba:0 Eb3F 的 
sdb6 start_lba:OxC51F ， 
sdb? start_lba:Oxl278F ， 
sdb8 start_lba:Qx1629F, 
sdb9 start_lba:Qx1D8BF, 


sdb8 has file 
sdb9 has filesystem 
ount sdbl done! 





CTRL + 3rd button enables mouse 



























































































































































1 
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sec_cnt:Qx?DC1 
sec_cnt :OQx46A1 
sec_cnt :OQx6231 
sec_cnt:Qx3AD1 
sec_cnt:Qx?5E1 
sec_cnt :9xh521 








































































































4 图 15-4 ”fork 运行 结 
init 进程 执行 的 较 早 ， 因 此 它 输出 的 信息 混在 了 硬盘 信息 中 ， 方 框 中 标 出 的 便 是 init 的 信息 。 方 框 中 第 一 行 
是 父 进程 ， 也 就 是 init 的 输出 ， 它 的 pid 是 1， 子 进程 pid 是 4， 也 就 是 fork 给 它 的 返回 值 是 4。 第 二 行 是 子 进程 
的 输出 ， 它 的 pid 是 4，fork 给 它 的 返回 值 是 0， 好 啦 ， 目 测 运行 结果 符合 预期 。 
也 许 有 读者 会 认为 应 该 把 init 的 进程 放 在 main.c 中 的 init all0 之 后 ， 这 样 就 能 避免 输出 信息 混杂 在 
一 起 了 ， 但 这 样 的 话 ， 为 保证 init 进程 的 pid 为 1， 要 在 pid 的 分 配 上 做 些 特殊 处 理 ， 这 多 少 都 有 些 不 完 
美 , 因此 就 这 样 吧 , 再 说 了 ， 人 家 Linux 的 init 之 所 以 pid 为 1, 原因 是 init 真 的 是 第 1 个 任务 ， 需 要 在 init 



















































































中 完成 很 多 初始 化 的 工作 ,6 














Ce CC 


~ 



































让 系统 同 








先 得 知道 用 户 键入 了 1 





j 户 交互 ， 

















们 不 要 求 太 高 ， 达 至 





I 了 这 个 目的 就 行 了 。 














添加 系统 调用 ， 获 取 键 盘 输 入 
































然后 再 对 输入 进行 分 析 ， 进 而 采取 相应 的 处 理 


行 分 














T 











因此 您 肯定 想到 了 ， 首 先 要 解决 的 问题 是 怎 


























Linux 中 从 键盘 获取 输入 是 利用 read 系统 i 



































j 户 的 输入 。 
久之 前 实现 了 sys_read， 也 许 有 同学 会 





























周 


























说 ， 现 在 只 要 按照 那 三 个 步骤 添加 read 系统 调 
取 数 据 ， 还 不 能 从 标准 输入 设备 键盘 : 
见 代 码 15-5。 





























读 取 数据 ， 因 此 当 














就 行 了 。 其 实 …… 旧 版 本 的 sys_read 只 能 从 文件 中 获 
务 之 急 ， 先 要 改进 sys_read， 让 其 支持 键盘 ， 











project/c15/b/fs/fs.c ) 


代码 15-5 ( 
408 /* 从 文件 描述 符 fd 指向 的 文件 中 读 取 count 个 字 节 到 buf， 
若 成 功 则 返回 读 出 的 字 节 数 ， 到 文件 尾 则 返回 -1 */ 
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409 int32 t sys read(int32 t fd, void* buf，uint32 七 count) 
410 ASSERT (buf != NULL); 

411 int32 t ret = -1; 

412 if (fd < 0 || fd == stdout no || fd == stderr no) { 
413 printk("sys read: fd error\n"); 

414 } else if (fd == stdin no) { 

415 char* buffer = buf; 

416 uint32 t bytes read = 0; 

417 while (bytes read < count) { 

418 *buffer = ioq getchar (&kbd buf); 

419 bytes_ readt++; 

420 buffertt+; 

421 } 

422 ret = (bytes read == 0 ? -1 : (int32 t)bytes read); 
423 } else { 

424 uint32 t fd = fd local2global (fd); 

425 ret = file read(&file tablel[ fd], buf, count); 
426 } 

427 return ret; 

428 } 





.LO 


第 414 一 422 行 加 入 了 标准 输入 stdin_no 的 处 理 ， 























和 ioq_getchar(&kbd_buf)， 每 次 从 键盘 缓冲 区 kbd_buf 中 获取 1 个 字符 ， 


儿 还 记得 吗 ? kb 
中 为 其 
下 面 我 们 在 


| ssize t read 


















































这 和 
现 
下 面 在 syscall.c 


.… 上 略 
77 /* 从 文件 描述 符 fa 


sys_read 接口 是 一 样 的 其实 











d_buf 是 我 们 存储 键盘 输 














syscall.c : 


入 的 环 







































































中 添加 系统 
代码 15-6 





























在 第 414 行 ， 若 发 现 乌 是 stdin no， 下 盏 
直到 获取 了 count 个 字符 为 止 。 大 伏 
缓冲 区 ， 它 定义 在 keyboard.c 中 ， 我 们 已 在 keyboard.h 
添加 了 外 部 声明 “extern struct ioqueue kbd_buf;”。 
添加 read 的 系统 调 


(Tnt: fe. void *bufs Size:t Count): 


们 所 有 系统 调 / 


( project/c15/b/lib/user/syscall.c ) 


Pp 读 取 count 个 字 节 到 buf */ 


8 int32 tt readt(int32 t fd, void* puf;, vint32. t count) 


9 
80 } 


最 后 在 syscall init.c 的 syscall init 函数 中 添加 代码 “syscall table[SYS_READ] = sys_read”， 在 


syscall table 数组 中 把 read 与 sys_read 绑 定 到 一 起 就 行 了 。 








return _Syscal13(SYS_READ， 


fd 

















-” Dute CoOunbys 





就 通过 while 




















] ，Linux 中 read 函数 的 原型 是 : 





的 内 核实 现 部 分 都 是 模仿 Linux 系统 调用 接口 实 
的 )， 我 悄悄 在 syscall.h 的 enum SYSCALL NR 中 添加 SYS_READ 后 (代码 就 一 句 ， 不 再 单独 贴 出 )， 
周 用 read 的 实现 ， 见 代码 15-6。 





























本 节 先 到 这 ， 等 以 后 实现 了 其 他 功能 咱们 一 块 测试 read 系统 调用 ， 好 ， 下 贡 见 。 


CC 


添加 DewWwi 有 关系 统 调 用 











系统 并 未 考虑 到 失败 的 情况 ， 因 此 不 会 返回 











有 时 候 我 们 需要 输出 单个 字符 ， 这 在 Linux 
若 成 功 输 出 ， 则 返回 值 为 (unsigned inbc， 若 失败 则 返回 EOF， 


























系统 调 





三 
是 



































AR 








无 返回 值 ， 只 会 输出 























在 Linux ! 
这 在 幕后 是 通过 








print.S 中 。 话 说 好 和 久 不 “汇编 ”了 ， 


要 实现 clear， 


新 写 一 个 啦 。 不 过 与 之 前 不 


个 字符 。 其 
， 当 屏幕 输出 很 乱 时 ， 纶 
clear 系统 调 
肯定 要 先 实 现 其 













































































/ 
LO 





























1。 干脆 明 们 就 不 按照 标 ? 























putchar 实现 的 。 它 的 原型 是 “int putchar(int c)” 
即 End Of File，EOF 通常 为 -1。 坦 白 说 ， 咀 们 的 
住 的 putchar 来 实现 了 ,1 























们 的 putchar 

















灾 putchar 对 应 的 内 核实 现 咱们 已 经 有 了 ， 可 以 直接 
们 通常 会 执行 clear 命令 ， 或 者 按 快捷 键 “ctrl 
来 实现 的 ， 本 节 咱 们 也 来 实现 这 个 功能 。 

















j console put char。 
1” 来 实现 清 屏 。 



































底层 ， 也 就 是 对 应 的 内 核实 现 ， 这 部 分 还 没有 现成 可 
同 的 是 clear 对 应 的 内 核 部 分 并 不 叫 sys_clear， 而 是 叫 cls_screen， 这 样 显得 意义 更 
明确 专 一 (当然 您 依然 可 以 定义 为 sys_clear)。 男 外 稍微 有 点 小 恐怖 的 是 它 是 用 汇编 代码 完成 的 ， 它 定义 在 
居然 有 点 心虚 的 感觉 ， 不 过 大 伙 儿 不 要 怕 ， 里 本 











的 函数 ， 肯 定 要 












































j 都 是 曾经 介绍 过 的 代 
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册 
加 
好 
测 
芭 
站 
加 


码 ， 而 且 只 是 很 简单 的 几 行 ， 如 代码 15-7 所 示 ， 不 再 解释 了 。 


代码 15-7 (project/c15/b/lib/kernel/print.S ) 














































































































































































































































































































































































































… 略 
55 global cls_screen 
56 cls_screen: 
57 pushad 
58 7 
59 过 程序 的 cpl 为 3， 显存 段 的 dpl 为 0， 
; 故 用 于 显存 段 的 选择 子 gs 在 低 己 特权 的 环境 中 为 0， 
60 ; 导致 用 户 程序 再 次 进入 中 断后 ，gs 为 0， 
; 故 直接 在 put_str 中 每 次 都 为 gs 赋值 
61 mov ax SELECTOR_ VIDEO ; 不 能 直接 把 立即 数 送 入 gs ， 需 由 ax 中 转 
62 mov gs, ax 
63 
64 mov ebx, 0 
65 mov ecx, 80*25 
66 ols: 
67 mov word [gs:ebx], 0x0720 ;0x0720 是 黑 底 白 字 的 空格 键 
68 add ebx, 2 
69 FOGPY vers 
70 mov ebx, 0 
3 
72 .set cursor: ; 直接 把 set_cursor 搬 过 来 用 ， 省 事 
73 ;;;;?;;;?; 1 先 设置 高 8 位 ;;;;;D;D;D; 
74 mov dx, 0x03d4 ;索引 寄存 器 
75 mov al，0x0e ; 是 供 光 标 位 置 的 高 8 位 
G6 out dx, al 
77 mov dx, Ox03d5 ; 通过 读 写 数据 端口 0x3q5 来 获得 或 设置 光标 位 
78 mov al, bh 
179 out dx, al 
80 
8 人 
82 mov dx, 0x03d4 
83 mov- le Ox0F 
84 out dx, al 
85 mov dx, 0x03d5 
86 mov al, bl 
87 oUt di. .al 
88 popadqd 
89 ret 
… 略 


下 面 是 系统 调用 putchar 和 clear 的 实现 ， 见 代码 15-8。 


代码 15-8 (project/c15/b/lib/user/syscall.c ) 





… 略 

82 /* 输出 一 个 字符 */ 

83 void putchar (char char asci) { 
84 _syscalll (SYS_ PUTCHAR, char asci); 
8:5; 

86 

87 /* 清空 屏幕 */ 

88 void clear (void) { 

89 _syscall0 (SYS_ CLEAR); 

90 1} 

… 略 


这 两 个 函数 完成 之 后 ， 还 要 在 syscall.h 的 enum SYSCALL NR 结构 中 添加 SYS_PUTCHAR 和 SYS _ 
CLEAR， 最 后 在 syscall-initc 中 增加 初始 化 代码 “syscall table[SYS PUTCHAR] = sys_putchar ”和 “syscall table 
[SYS CLEAR] =cls screen;”。 

好 啦 , 基础 的 部 分 实现 得 差不多 了 , 下 节 咱 们 开始 实现 一 个 简单 的 shell, 是 不 是 感觉 有 点 突然 ,哈哈 ， 
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四 实现 一 个 简单 的 4is@ 


本 节 咀 们 实现 一 个 简单 的 shell， 能 处 理 键入 的 命令 ,实现 内 部 命令 及 外 部 命令 ， 文 持 简单 的 快捷 键 等 。 
15.4.1 ”shell 雏形 


操作 系统 是 为 用 户 服务 的 ， 要 想 实现 和 用 户 的 交互 ， 操 作 系 统 得 有 办 法 感知 用 户 的 输入 并 给 予 回馈 ， 
也 就 是 必须 要 为 用 户 提供 个 交互 接口 。 在 Windows 中 ， 图 形 界面 的 资源 管理 器 和 命令 行 窗口 都 是 交互 接 
口 ， 尺 管 这 些 交 互 接口 名 字 及 外 观 各 异 ， 但 它们 往往 被 统称 为 “外 过 ”程序 。 

想 想 看 动物 外 壳 是 什么 。 外 壳 也 称 为 甲壳 ， 它 的 作用 一 是 保护 动物 内 部 的 器 官 组 织 ， 避 免 来 自 外 界 的 破坏 ， 
二 是 通过 它 来 感知 外 面 的 世界 并 给 予 回应 。 您 看 ， 这 其 实 是 典型 的 操作 系统 交互 接口 的 作用 ， 因 此 Linux 系统 
采用 了 更 直接 的 叫 法 ， 它 的 交互 接口 就 叫 shell， 直 译 过 来 就 是 “外 壳 ”。shell 的 功能 大 致 是 获取 用 户 的 键入 ， 
然后 分 析 输 入 的 字符 串 ， 判 断 是 内 部 命令 ， 还 是 外 部 命令 ， 然 后 执行 不 同 的 策略 。Linux 中 的 shell 有 各 种 版 本 ， 
大 家 最 常用 的 应 该 是 bash， 即 Bourne Again shell。 好 啦 ， 这 些 常 识 大 伙 儿 肯定 知道 ， 我 就 不 班 门 弄 短 了 。 

实际 的 shell 实现 是 非常 复杂 的 , 咱们 的 shell 肯定 没 那 么 强大 , 实现 的 比较 简单 ， 所 以 大 伙 儿 请 放心 ， 
4 们 一 定 会 过 得 轻松 愉快 。 本 节 新 建 目 录 shell， 在 其 下 创建 文件 shellc， 好 啦 ， 上 代码 ， 见 代码 15-9。 


代码 15-9 (project/c15/b/shell/shell.c ) 
































































































































































































































































































































et 




























































































… 略 
1 #define cmd len 128 // 最 大 支持 键入 128 个 字符 的 命令 行 输入 
2 #define MAX ARG NR 16 // 加 上 命令 名 外 ， 最 多 支持 15 个 参数 
3 
4 /* 存储 输入 的 命令 */ 
5 static char cmd line[lcmd len] = {0}; 
6 
yy /* 用 来 记录 当前 目录 ， 是 当前 目录 的 缓存 ， 
村 次 执行 cd 命令 时 会 更 新 此 内 容 */ 
8 char cwd cache[64] = {0}; 
9 
20 /* 输出 提示 符 */ 














21 void print prompt (void) { 


22 printf("[rabbit@localhost %s]$ ", cwd cache); 
3 
24 








25 /* 从 键盘 缓冲 区 中 最 多 读 入 count 个 字 节 到 buf */ 
26 static void readqline (char* buf, int32 七 count) { 








































































































27 assert (buf != NULL && count > 0); 

28 char* pos = buf; 

29 while (readl(stdin no pos, 1) != -1 && (pos - buf) < count) { 
/ 在 不 出 错 情 况 下 ， 直 到 找到 回 车 符 才 返回 

30 switch (*pos) { 

31 /* 找到 回 车 或 换行 符 后 认为 键入 的 命令 结束 ， 直 接 返 回 */ 

32 case '\n': 

33 case '\r': 

34 *pos = 0; // 添加 cmqd_line 的 终止 字符 0 

39 putchar ('\n'); 

36 return; 

337 

38 case '\b': 

39 if (puf[0] != '\pb') {// 阻止 删除 非 本 次 输入 的 信息 

40 --pos; // 退回 到 缓冲 区 cmd_line 中 上 一 个 字符 

41 putcehar (Ne) 

42 } 

43 break; 

44 

45 /* 非 控 制 键 则 输出 字符 */ 

46 default: 

47 putchar (*pos) 

48 post+t+; 

49 } 

50 } 
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3 printf("readline: can t find enter key in the cmd line, 
max num of char is 128\n"); 
2. 
53 
54 /* 简单 的 shell */ 
55 void my_shell(void) { 
56 cwd cache[0] = '/'; 
S32 while (1) { 
58 print prompt (); 
59 memset (cmd line, 0, cmd len); 
60 readline (cmd line, cmd len); 
61 if (cmd line[0] == 0) { // 若 只 键入 了 一 个 回 车 
62 continue; 
63 } 
64 } 
65 panic("my shell: should not be here"™); 
66 
用 户 键入 命令 的 命令 是 以 字符 串 形式 提交 的 ， 因 此 其 长 度 是 有 限制 的 ， 下 面 通过 两 个 宏 限 制 命令 串 的 长 度 。 
第 11 行 的 cmd_len 表示 命令 字符 串 最 大 的 长 度 ， 其 值 为 128， 也 就 是 说 用 户 输入 的 命令 字符 串 长 度 是 
有 限 的 ,不 能 超过 128 个 字符 。 下 一 行 的 MAX_ARG NR 表示 最 大 支持 的 参数 个 数 ， 这 里 咱们 定义 为 16。 
数组 cmd_line 用 来 存储 键入 的 命令 。 数 组 cwd_cache 用 来 存储 当前 目录 名 ， 主 要 是 在 命令 提示 符 中 ， 
它 由 以 后 实现 的 cd 命令 来 维护 。 
函数 print_prompt 用 于 输出 命令 提示 符 ， 也 就 是 咱们 登录 shell 后 ， 命 令 行 中 显示 的 主机 名 等 ， 这 里 咱 
们 用 printf 函数 输出 “[rabbit@localhost %s]$ ”， 对 此 格式 大 伙 儿 应 该 比较 熟悉 啦 ， 其 中 “@ ”左边 的 是 用 
户 名 ， 右 边 的 是 主机 名 ,“$” 表 示 普 通用 户 。 当 然 我 们 没 实现 用 户 管理 ， 所 以 并 不 会 把 “$” 换 成 “# 六 





您 懂 的 ,“#” 表 示 root 账号 ， 它 太 可 怕 
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Me 








低 特权 级 的 











过 














字 节 到 buf。 


字符 指针 pos 指向 缓冲 区 buf， 我 们 后 
函数 体 中 主要 是 个 while 循环 ， 每 次 通过 read 系统 i 
您 在 想 ， 为 什么 不 是 一 次 读 入 cmd_ len 个 字符 ?这 样 效率 会 很 高 啊 。 其 实 ， 咱 介 
足 cmd len 个 字符 ， 而 无 法 得 到 及 时 的 处 至 
立即 反映 到 屏幕 上 。 您 想 ， 按 键 时 





账号 下 。 
函数 readline 接受 2 个 参数 ， 绥 冲 区 buf 和 读 入 的 字符 数 ， 功 能 是 从 键盘 缓冲 



































了 ， 平 时 可 不 敢 随便 用 ， 让 我 们 继续 保持 这 种 好 习惯 ,平时 就 待 在 























区 中 最 多 读 入 count 个 





四 将 通过 pos 往 buf 中 写 数据 。 


























第 30 行 通 
控制 键 ， 分 别 是 


结束 ， 

















前 过 switch 结构 判 册 
































模拟 








while 语句 ， 循 环 j 
shell.c 的 代码 





所 以 在 第 34 行使 ppos 为 0， 也 就 是 添 力 
] 户 的 键盘 动作 。 第 38 行 是 对 退 格 键 \b 的 处 天 
有 代码 “站 (buf[0] != \b)” 的 话 ， 按 下 的 退 格 键 会 将 命令 提示 符 及 之 前 的 内 容 肌 
buf 中 前 一 个 字符 ， 并 且 通 过 putchar 输 

函数 my_shell 就 是 所 实现 的 简单 


















































屏幕 上 





前 就 这 些 ， 下 面 只 





i 读 入 的 字符 ， 














周 用 print_prompt 输出 命令 提示 符 ， 然 后 1 
们 得 找 个 机 会 把 my_shel 执行 ， 肯定 是 由 init 这 个 “祖师 和 爷 ” 来 亲自 调 


























用 啦 ， 见 代码 15-10。 


略 


"oO 
18 int main(void) { 


19 
20 
2 
2.2 
23: 
24 


700 





代码 15-10 


put_str("I am kernel\n"); 
init all(); 

cls_screen () ; 
console put str("[rabbit@localhost /]$ "); 
while(1); 
return 0; 


日 
CAAN, 


的 处 班 














周 用 读 入 1 个 字符 到 pos 中 ， 也 就 是 buf 中 。 也 许 




















] 这 样 做 是 避免 用 户 输入 不 




















!， 如 果 非 要 等 读 到 回 车 符 才 处 理 ， 那 么 用 户 键入 的 内 容 并 不 是 
| 户 会 感到 很 迷茫 ， 心 里 
也 就 是 *pos 的 值 ， 然 后 采取 不 同 

















定 在 想 ， 你 这 是 几 个 意思 。 
的 处 理 方法 。 前 三 个 case 是 处 理 


















































可 车 换行 符 及 退 格 键 。 如 果 *pos 的 值 是 字符 \n 或 \， 这 表示 用 
上 了 字符 串 结束 标识 0， 然 后 调用 
第 39 行 的 让 判断 是 阻止 j 




















9 











Hb， 在 屏幕 上 模拟 删 
shell， 函 数 中 先 将 当 


前 














户 键 入 了 回 车 ， 表 示 命 令 输入 
putchar 在 屏幕 上 输出 换行 符 \m， 

出 除非 本 次 输入 的 信息 ， 如 果 没 
| 除 ， 这 就 错 了 。pos 会 减 1， 指 向 
除 。 如 果 不 是 这 些 控制 字符 ， 默 认 就 直接 输出 。 
工作 目录 缓存 cwd_cache 置 为 根 目 录 /， 然 后 通过 








































































































周 用 readline 获取 用 户 输 入 。 














( project/c15/b/kernel/main.c ) 


15.4 ”实现 一 个 简单 的 shell 

















27 /* init 进程 */ 
28 void :init(void) { 


























29 uint32 七 ret pid = fork(); 

30 if(ret pid) { // 父 进程 

31 while(1); 

32 } else { // 子 进 程 

33 my_shell (); 

34 } 

35 panic("init: should not be here"™); 
36 } 

“ODO 























。 男 外 ， 在 主 函 数 中 ， 也 就 是 主线 程 执行 
令 提 示 符 ， 目 的 是 清 掉 屏 幕 上 的 硬盘 、 分 



































my_shell 是 在 第 33 行 调用 的 ， 也 就 是 fork 之 后 的 子 进 程 中 
完 init all 之 后 ， 调 用 了 cls_screen 和 用 console put str 输出 了 命 
区 等 初始 化 信息 。 

好 啦 ， 虽 们 一 气 呵 成 ， 编 译 运行 看 结果 ， 如 图 15-5 所 示 。 

























































































[rabbi oc abcd 
[rabbitelocalhost -]9 abcdef 
[rabbitelocalhost 
[rabbitelocalhost 
[rabbitelocalhost “]9 
[rabbitelocalhost /~ 123234 


[1 ABCDefgNCIIE 
[rabbitelocalhost S 
[rabbitelocalhost “1]5 
[rabbitelocalhost hello,budduy! 
[rabbite@localhost /1$ 





IPS: 26.898M | | | | | | | | | | | 
4 图 15-5 my_shell 


您 看 ， 是 不 是 挺 喀 人 的 ,似乎 咱们 真 的 拥有 了 一 个 shell, 一 直 看 惯 了 挤 满 初始 化 信息 的 屏幕 ， 此 时 
突然 看 上 去 感觉 好 清爽 ， 其 实 离 最 基本 的 shell 还 差 得 老 远 呢 ， 无 论 输 入 什么 系统 都 没有 反应 ， 别 急 ， 慢 慢 
来 吧 。 

感谢 大 伙 儿 的 陪伴 ， 下 节 咱 们 继续 。 





















































15.4.2 添加 Ctrl+u 和 Ctrl+| 快捷 键 


本 节 的 目的 是 为 演示 快捷 键 的 实现 原理 ， 如 题 所 示 ， 我 们 要 实现 快捷 键 “Ctrltu” 和 “Ctrl+l” 的 功能 。 
鉴于 印刷 后 i 和 1 容易 分 不 清 ， 提 示 一 下 ,“Ctrlt1” 中 的 字符 T 不 是 i， 其 大 写字 符 是 LL。 
话说 在 Linux 中 ,“Ctrl+tu” 的 作用 是 清除 输入 ， 也 就 是 在 回 车 前 ， 按 下 “Ctrltu” 可 以 清 掉 本 次 的 输 
入 ， 相 当 于 连续 按 下 退 格 键 的 效果 。“Ctrl+l” 的 作用 是 清 屏 ， 效 果 等 同 于 Clear 命令 ， 但 是 有 一 点 要 注意 ， 
“Ctrl+l” 并 不 会 清 掉 本 次 的 输入 ， 实 际 效 果 如 图 15-6 所 示 。 

您 看 ， 在 按 下 “Ctrlt+l” 快 捷 键 后 屏幕 被 清空 了 ， 但 输入 的 abc 依然 还 在 ， 咱 们 也 实现 这 种 效果 。 

也 许 大 伙 儿 想到 , 哎 ? 在 键盘 驱动 程序 keyboard.c 中 不 是 可 以 处 理 按键 吗 ? 甚至 我 们 已 经 实现 了 一 些 
组 合 键 ， 这 次 是 否 依 然 要 在 keyboard.c 中 添加 ? 回 大 人 ， 还 真 不 是 ， 理 由 如 下 。 
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(1) 操作 系统 虽说 是 由 中 断 驱 动 的 ， 但 中 断 过 多 的 话 ， 系 统 会 被 拖累 得 效率 又 降 。 而 键盘 驱动 程序 是 
中 断 处 理 程序 ， 每 按 下 一 个 键 就 会 产生 两 个 中 断 〈 分 别 是 通 码 和 断 码 产生 的 中 断 )， 中 断 量 大 得 惊人 ， 为 
了 让 中 断 处 理 得 快 一 些 ， 咱 们 尽 可 能 让 中 断 处 理 程序 简洁 。 
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第 15 章 系统 交互 


[work@localhost c]$ 1s 
makefile 


[work@localhost c]$ abdl 





按 下 “ctrl + |” 键 后 


[work@localhost c]$ abd 


4 图 15-6 Linux 中 “ctrl+|” 快 捷 键 的 效果 


(2) 键盘 驱动 是 较 低层 的 程序 ， 它 获取 的 数据 是 最 原始 的 数据 ,为 了 让 上 层 程 序 可 获得 更 丰富 有 用 的 
言 息 ， 键 盘 驱 动 应 该 最 大 限度 地 保留 原始 数据 ， 由 上 层 程 序 决定 如 何 处 理 。 















































































































































回顾 一 下 ， 在 很 久 以 前 ， 我 们 在 键盘 驱动 中 埋 下 了 “伏笔 ”现在 把 “伏笔 ”代码 贴 出 来 给 大 伙 儿 下 
顾 ， 这 是 代码 keyboard.c 中 的 部 分 截图 ， 如 图 15-7 所 示 。 
195 /于 于 于 于 素 素 于 下 素 于 下 素 素 率 寂 率 素 快 挝 键 ctrl+1l 和 Ctrl+u 的 处 理 求 求 求 求 求 求 求 求 求 求 求 求 求 求 求 求 求 求 求 求 束 
196 站 下面 是 把 ctrL+1 和 ctrL+U 这 两 种 组 合 键 产 生 的 字符 置 为 : 
197 下 cur_char 的 asc 码 -字符 aq 的 asc 码 ， 此 差 值 比较 小 ， 
198 # 属于 Qsc 码 表 中 不 可 见 的 字符 部 分 . 故 不 会 产生 可 见 字符 . 
199 # 我 们 在 shell 中 将 ascii 值 为 1-a 和 U-a 的 分 别处 理 为 清 屏 和 删除 输入 的 快 渤 键 */ 
200 if (Cctrl_down_last && cur_char == '1') 11 (ctrl_down_last && cur_char == 'u')) { 
201 cur_char -= 'a'; 
202 
203 // 字 素 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 求 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 事 // 
204 


205 /* 若 kbd_buf 中 未 满 并 县 待 加 入 的 cur_char 不 为 0， 
206 * 则 将 其 加 入 到 缓冲 区 Kkbd_buf 中 */ 


207 if (!lioq_full(&kbd_buf)) { 

208 ioq_putchar(&kbd_buf, cur_char); 
209 + 

210 return; 





4 图 15-7 键盘 驱动 中 的 快捷 键 处 理 


注释 部 分 大 伙 儿 自己 看 吧 ， 我 大 体 给 您 说 下 。 

变量 cur_char 中 存储 的 是 按键 的 ASCII 码 ， 我 们 在 keyboard.c 的 第 200 行将 “ctri+l1” 和 “ctrl+u” 组 
合 键 也 转换 为 ASCII 码 ， 不 过 此 时 cur_char 中 存储 的 是 字符 1 或 字符 u 的 ASCII 码 值 减 去 字符 a 的 ASCII 码 值 
的 差 。 在 ASCII 码 表 中 ，ASCII 码 值 为 十 进 制 0~31 和 127 的 字符 是 控制 字符 ， 它 们 不 可 见 ， 因 此 字符 1 和 
字符 u 的 ASCII 码 值 减 去 a 的 ASCII 后 的 差 会 落 到 控制 字符 中 ， 但 并 不 是 所 有 的 控制 字符 都 可 占用 ， 对 于 
系统 中 已 经 处 理 的 控制 字符 必须 要 保留 。 比 如 退 格 键 Ab”、 换 行 符 An” 和 回 车 符 ”的 ASCII 码 分 别 
是 8、10 和 13， 咱 们 已 经 在 shell.c 中 针对 它们 做 出 了 处 理 ， 因 此 要 定义 其 他 快捷 键 的 话 ， 要 将 这 三 个 控 


二 


制 键 的 ASCII 码 跨 过 去 。 好 啦 ， 可 以 上 代码 啦 ， 见 代码 15-11。 


代码 15-11 (projectc15/c/shelyshellc ) 
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… 略 
25 /* 从 键盘 缓冲 区 中 最 多 读 入 count 个 字 节 到 buf */ 
26 static void readqline (char* buf, int32 七 count) { 





.LO 


















































46 /* ctrl+1 清 屏 */ 

47 Gase. TL EE Ma 

48 /* 1 先 将 当前 的 字符 '1'-'a' 置 为 0 */ 
49 *pos = 0; 

50 /* 2 再 将 屏幕 清空 */ 

sl Clear (); 

52 /* 3 打印 提示 符 */ 

353 print promet()? 

54 /* 4 将 之 前 键入 的 内 容 再 次 打印 */ 
和 人 Brintf (Sor Baf): 

56 break; 

Sy 
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j 清 屏 ， 此 时 屏幕 上 空空 如 也 。 然 后 调用 print prompt 函数 重新 


处 理 按 下 的 键 的 行为 ， 此 次 更 新 的 是 readline 函数 ， 在 








先 将 pos 指向 的 字符 置 为 0， 也 就 是 字 














58 /* ctrltu 清 掉 输 入 xf 

59 case 'u' - "al' 

60 while (buf 1 pos) { 

61 putchar ('\b'); 

62 *(pos--) = 0; 

63 } 

64 break; 

65 

66 /* 非 控制 键 则 输出 字符 */ 

67 default: 

68 putchar (*pos); 

69 Post+;? 

70 } 

i } 

中 printf("readline: can 七 findq enter key in the cmd line, 

max num of char is 128\n"); 
3 
对 于 按键 的 处 理 是 由 软件 决定 的 ， 您 可 以 任意 

第 46 一 56 行 咱 们 把 ctrl+l 键 处 理 为 清 屏 操 作 ， 这 分 为 四 步 来 完成 。 
符 串 结束 符 “0 7” 。 接 着 调用 clear 系统 调 
输出 命令 提示 符 ， 也 就 是 此 时 屏幕 上 出 





























现 了 “[rabbit@localhost/]1$”， 最 后 把 buf 














的 字符 串 ， 也 就 是 用 户 

















刚刚 键入 的 字符 通过 printf 打印 出 来 。 经 过 这 四 步 ， 我 们 模拟 了 Linux 中 的 清 屏 快捷 键 “ctrl+l1” 的 效果 。 



































第 $8 一 64 行 是 处 理 快 捷 键 “ctrl+u”， 其 
逐步 递减 ， 并 将 对 应 位 


实现 | 


















































代码 就 介绍 完了 ， 这 个 例子 还 不 太 好 演示 ， 图 
下 程序 检测 吧 。 
本 小 节 添 加 的 快捷 键 仅 起 到 抛砖引玉 的 作用 ， 











15.4.3 ”解析 键入 的 字符 


























置 为 0， 直 到 pos 指向 了 buf 的 起 始 处 





























个 6 由 








上 节 咱 们 的 shell 还 是 ”shell， 无 论 咱 






















































































们 按 下 什么 键 它 都 没 任何 反应 ， 
个 命令 解析 的 功能 ， 在 shell.c 中 增加 函 











原理 是 通过 while 循环 连续 输出 退 格 符 ， 然 后 使 指针 pos 
































片上 不 容易 看 出 快捷 键 的 效果 ， 大伙 儿 还 是 自行 运行 一 
其 他 的 快捷 键 触 类 旁 通 ， 大 伙 儿 有 兴趣 自己 添加 吧 。 














它 之 所 以 什么 都 不 会 做 








数 


的 原因 是 它 不 知道 用 户 输入 的 是 什么 。 本 节 咱 们 要 添加 个 命令 
cmd parse， 见 代码 15-12。 
代码 15-12 (project/c15/d/shell/shell.c ) 
… 略 
74 /* 分 析 字 符 串 cmd_str 中 以 token 为 分 隔 符 的 单词 ， 
将 各 单词 的 指针 存 入 argv 数组 */ 
75 static int32 七 cmd Parse (char* cmd str, char** argv, char token) { 
76 assert (cmd str != NULL); 
77 int32 t arg idx = 0; 
78 while(arg idx < MAX ARG NR) { 
79 argv[larg idx] = NULL; 
80 arg_idxt++; 
81 } 
82 char* next = cmd str; 
83 int32 t argc = 0; 
84 /* 外 层 循环 处 理 整 个 命令 行 */ 
85 while(*next) { 
86 /* 去 除 命令 字 或 参数 之 间 的 空格 */ 
87 while(xnext == token) { 
88 next++; 
89 } 
90 /* 处 理 最 后 一 个 参数 后 接 空格 的 情况 ， 如 "ls dir2 " */ 
91 if (*next == 0) 
92 break; 
93 } 
94 argv[largc] = next; 
95 
96 /* 内 层 循 环 处 理 命令 行 中 的 每 个 命令 字 及 参数 */ 
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分 隔 符 


第 15 章 系统 交互 
97 while (*next && *next != token) { // 在 字符 串 结束 前 找 单词 
98 next++; 
99 } 
00 
01 /* 如 果 未 结束 ( 是 token 字符 ),， 使 tocken 变 成 0 */ 
02 if (*next) { 
03 *next++ = 0;  // 将 token 字符 替换 为 字符 串 结束 符 0 
// 作为 一 个 单词 的 结束 ， 并 将 字符 指针 next 指向 下 一 个 字符 
04 } 
05 
06 /* 避免 argv 数组 访问 越界 ， 参 数 过 多 则 返回 0 */ 
07 if (argc > MAX ARG NR) { 
08 return -1; 
09 } 
0 argct++; 
4 } 
之 return argc; 
3 
4 
5 char* argv[IMAX ARG NR]; 
// argv 必须 为 全 局 变量 ， 为 了 以 后 exec 的 程序 可 访问 参数 
6 INntE32 tt 这 站 亲人 二 
7 /* 简单 的 shell */ 
8 void my_ shell(void) { 
9 cwd cache[0] = '/'; 
20 while (1) { 
2 print prompt (); 
22 memset (final path, 0, MAX PATH LEN) ; 
pe memset (cmd line, 0, MAX PATH LEN); 
24 readline (cmd line, MAX PATH LEN); 
25 if (cmd line[0] == 0) { // 若 只 键入 了 一 个 回 车 
26 continue; 
2 } 
28 argc = -1; 
29 argc = cmd parse (cmd line, argv, ' '); 
30 if (argc == -1) { 
3 尘 printf("num of arguments exceed Sd\n", MAX ARG NR); 
32 continue; 
33 } 
34 
35 int32 t arg idx = 0; 
36 while(arg idx < argc) { 
SN intt(vSe Vy, argv [arg idxly 
38 arg_idxt++; 
39 } 
40 Printf (Nn ys 
41 } 
42 panic("my_shell: should not be here"™); 
43 } 





函数 cmd_parse 接受 3 个 参数 ， 月 
功能 是 分 析 字 符 串 cmd str 
在 函数 开头 第 78 行 的 
82 行 ， 指 针 next 指向 cmd_str，next 上 
令 行 cmd str。 

在 循环 内 部 的 第 1 个 循环 用 于 跨 过 cmd_str 中 的 空格 。 第 91 行 
的 结尾 就 退出 循环 ， 这 是 为 了 避免 在 最 后 一 个 参数 后 出 现 空格 的 情况 。 

第 94 行 的 “argv[argc] = next”， 每 找 出 一 个 字符 串 就 将 其 在 cmd_ str 

97 行 的 while 循环 


退出 , 随后 在 第 102 
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子 付 ， 



































以 token 为 分 隔 符 的 
while 循环 用 来 清空 数组 argv。 
于 处 理 每 一 个 字符 ， 
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al 













































































有 户 键 入 的 原始 命令 串 cmd_str、 参 数字 符 旧 
单词 ， 将 解析 出 来 的 单词 的 指针 存 入 argv 数组 。 





数组 argv、 分 隔 符 token。 





















































于 处 理 命令 行 中 的 每 个 命令 字 及 参数 
行 判断 跳出 上 个 while 循环 的 





， 在 字符 串 未 结束 的 | 














zz Ar 


子 付 \0'， 











使 








串 ) 从 cmd_str 中 找到 结束 边界 ， 并 使 next 指向 下 一 个 字符 。 


下 面 在 函数 my_shell 中 添加 了 测试 代码 ， 第 136 一 139 行 输 昌 
15-8 所 示 。 























结果 ， 如 图 
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上 每 个 分 离 出 

















数组 argv 中 


xzr Ar 器 


来 所 














85 行 的 while 外 层 循环 处 理 整 个 命 





的 让 判断 ,如果 next 已 经 指向 了 cmd str 


的 起 始 next 存储 到 argv 数组 。 第 
青 况 下 ， 遇 到 分 隔 符 token 后 就 
原因 是 遇 到 了 token 字符 , 还 是 遇 到 了 结束 符 0, 如 果 是 token 
则 将 指针 next 指向 的 token 字符 置 为 0， 也 就 是 人 为 添加 结 





Ai 


的 每 个 元 素 〈 字 多 








字符 中 


和 ， 好 啦 ， 运 行 看 





Bochs x86 emulator, http://bochs.sourceforge.net/ 

















Th ResetsuUspEND Poer 
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DO OO 
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[rabbitelocalhost /19 aa 
aa bb cc 
[rabbitelocalhost /1$ 

aa bbb ccc 
[rabbitelocalhost /1$ 





IPS: 27.994M | | | | | | | | 


4 图 15-8 分 析 命 令 字符 串 


在 图 15-8 中 输入 的 各 个 字符 串 的 结束 都 是 字符 ce， 在 其 后 其 实 都 有 多 个 空格 ， 只 是 图 上 看 不 出 来 。 另 
外 在 输出 的 结果 中 ， 结 束 字符 c 处 没有 空格 。 
好 啦 ， 本 节 较 轻松 ， 到 这 就 结束 了 。 


15.4.4 添加 系统 调用 


到 现在 咱们 的 shell 还 名 不 符 实 ， 它 不 能 帮 用 户 做 任何 事情 。 为 了 让 she 少 够 尽快 与 用 户 互 动 ， 咱 们 
还 需要 做 些 基 础 工作 ， 等 基础 设施 搭建 完成 了 ， 咱 们 的 shell 就 有 具有“ 灵性? 
在 这 之 前 咱们 在 fs.c 中 实现 了 很 多 系统 调用 的 内 核 接 口 ， 就 是 那些 以 cvs ， 开头 的 函数 ， 您 懂 贡 
我 们 早晚 会 为 它们 添加 系统 调用 ， 就 是 今天 。 

下 面 按照 添加 系统 调用 的 三 个 步骤 依次 列 出 相关 代码 ， 见 代码 15-13。 


代码 15-13 (project/c15/e/lib/user/syscall.h ) 
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enum SYSCALL NR { 
SYS_GETPID, 
SYS_WRITE, 
SYS_MALLOC， 
SYS_FREE, 
SYS_FORK, 
SYS_RE 
SYS_PUTCHAR， 
SYS_CLE 
SYS_GET 
SYS_OPE 
SYS_CLOSE, 
SYS_LSEEK, 
SYS_UNL 
SYS_MKD 
SYS_OPEN 
SYS_CLOS 
SYS_CHD 
SYS_RMD 
SYS_RERAD 
SYS_REW 
SYS_STRAT 
SYS_PS 
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DDD 
MS 
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CD 
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DD 
CON On 
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DD 
Oo ~ 


29. .3 


以 上 定义 的 enum SYSCALL NR 是 咱们 系统 中 目前 所 支持 的 所 有 系统 调用 。 下 面 是 新 增 的 系统 调用 
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实现 ， 除 SYS_PS 以 外 ， 其 他 的 系统 调用 号 对 应 的 内 核 部 分 都 已 经 实现 了 ， 见 代码 15-14。 
代码 15-14 (project/c15/e/lib/user/syscall.c ) 




















92 /* 获取 当前 工作 目录 */ 

93 char* getcwd (char*x buf, uint32 t size) { 

94 return (char*) _ syscall2 (SYS GETCWD, buf, size); 
95 3 

















97 /* 以 flag 方式 打开 文件 pathname */ 

98 int32 t open(char* pathname, uint8 t flag) { 

99 return syscall2 (SYS OPEN, pathname, flag); 
00 1} 


02 /* 关闭 文件 fq */ 

03 int32 t wloset{(int32 tt fq) 

04 return syscalll (SYS CLOSE, fd); 
05 } 


07 /* 设置 文件 偏 移 量 */ 

08 int32 t lseek (int32 t fd, int32 t offset, uint8 t whence) { 
09 return syscall3(SYS LSEEK, fd, offset, whence); 

0 } 


/* 删除 文件 pathname */ 
int32 t unlink(const char* pathname) { 
return syscalll (SYS UNLINK, pathname); 




















/* 创建 目录 pathname */ 
int32 七 mkdir(const char* pathname) { 
return syscalll (SYS MKDIR, pathname); 








1 
2 
3 
4 
9 
6 
7 
8 
9 


20 1} 

















22 /* 打开 目录 name */ 

23 struct dir* opendir(const char* name) { 

24 return (struct dir*) syscalll (SYS OPENDIR, name); 
25 } 








27 /* 关闭 目录 dir */ 

28 int32. tCLOSEQLri(e triet .dir ir) 于 

2.9 return syscalll (SYS CLOSEDIR, dir); 
3 上 过 




















32 /* 删除 目录 pathname */ 

33 int32 七 fmdqit (Const char* pathname) { 

34 return syscalll (SYS RMDIR, pathname); 
3.5..} 














37 /* 读 取 目 录 dir */ 

38 struct dir entry* readdir(struct dir* dir) { 

39 return (struct dir entry*)_ syscalll (SYS READDIR, dir); 
40 } 


























/* 回归 目录 指针 */ 
void rewinddir(struct dir* dir) { 
_syscalll (SYS _ REWINDDIR, dir); 

















/* 获取 path 属性 到 buf 中 */ 
nt32.t stat(eonst char* pathy Struct Stat ,bufy ‘{ 
return syscall2 (SYS_ STAT, path, buf); 





于 
2 
3 
4 
8 村 
6 
7 
8 
9 
0 


} 














52 /* 改变 工作 目录 为 path */ 

53 int32 t chdirl(const char* path) { 

54 return syscalll (SYS_ CHDIR, path); 
中 











57 /* 显示 任务 列表 */ 

58 void Ps (void) { 

59 JSYSCAlLO (SYS. PS); 
60 1} 
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会 儿 咱 们 再 说 它 ， 这 些 系统 调用 要 在 syscall table 中 注册 ， 见 代码 15-15。 




















最 后 一 个 系统 调用 是 ps， 





代码 15-15 
… 略 
21 /* 初始 化 系统 调用 */ 
























































22 void syscall init (void) 

23 put_ str("syscall init start\n"™); 

24 syscall table[SYS_ GETPID] = sys_getpid; 
2 syscall table[SYS WRITE] = sys write; 
26 syscall table[SYS MALLOC] = sys _ malloc; 
2 syscall table[SYS_ FREE = sys_free; 

28 syscall table[SYS FORK = sys_fork; 

2.9 syscall table[lSYS READ = sys_read; 

30 syscall table[SYS_ PUTCHAR] = sys_ putchar; 
民 syscall table[SYS CLEAR = cls_ screen; 
32 syscall table[SYS GETCWD] = sys_getcwd; 
3 syscall table[SYS OPEN = sys_open; 

34 syscall table[SYS CLOSE = sys_close; 
35 syscall table[SYS LSEE = sys_ lseek; 
36 syscall table[SYS UNLINK] = sys_ unlink; 
37 syscall table[SYS MKDIR = sys_ mkdir; 
38 syscall table[SYS OPENDIR] = sys_opendir; 
39 syscall table[SYS CLOSEDIR] = sys_closedir; 
40 syscall table[SYS CHDIR = sys_chdir; 
41 syscall table[SYS RMDIR = sys_rmdir; 
42 syscall table[SYS READDIR] = sys_readdir; 
43 syscall table[SYS REWINDDIR] = sys _ rewinddir; 
44 syscall table[SYS STAT] = sys_stat; 

45 syscall table[SYS_ PS] = sys_ps; 

46 put_ str("syscall init done\n"™); 

47 }.… 略 

















下 面 说 一 下 系统 调用 ps。 这 是 为 了 模拟 Linux 中 的 ps 命令 ， 当 然 ， 



































( project/c15/e/userprog/syscall-init.c ) 





由 于 能 力 有 限 ， 并 且 耐 心 比 能 








还 有 限 ， 虽 们 的 ps 命令 极其 简陋 ， 仅 能 打印 出 进程 的 pid、ppid、 状 态 、 运 行 时 间 片 和 进程 名 。 对 应 的 内 


核 部 分 sys_ps 定义 在 thread.c 中 ， 见 代码 15-16。 
















































































char format) { 


int arg UNUSED) { 


代码 15-16 (project/c15/e/thread/thread.c ) 

… 略 
217 /* 以 填充 空格 的 方式 输出 buf */ 
218 static void pad print (char* buf, int32 t buf len, void* ptr, 
219 memset (buf, 0, buf len); 
2 uint8 t out pad 0idx = 0; 
之 这 小 Switch (format) { 
222 Case 's': 
223 out Pad Oidx = sprintf (Buf;, Ss"; ptr)s 
224 break; 
225 case 'd': 
226 out Bad Olidx = Sprintf (Bufy. "Sd *((TntL6.t*) Ete) 
2237 Case 'x': 
228 out pad 0idx = sprintf (buf, "x", w*( (Uint32 tt*)ptr))e 
229 } 
230 while (out pad 0idx < buf_ len) { // 以 空格 填充 
231 buflout pad Oidx] = " '; 
2 当 2 out pad 0idxt++; 
233 } 
234 sys_write(stdout no, buf, buf len - 1); 
2381 中 
236 
237 /* 在 List traversal 函数 中 的 回调 函数 ， 针对 线程 队列 的 处 理 * 
238 static bool elem2thread_info (struct list elem* pelem, 
239 struct task struct* pthread = \ 

elem2entry(struct task struct, all list tag pelem); 
240 char out pad[16] = {0}; 
241 
242 pad print (out pad, 16, &pthread->pid, 'd'); 
243 
244 if (pthread->parent pid == -1) { 
245 pad print (out pad, 16, "NULL", 's'); 
246 } else { 
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247 pad print (out pad, 16, &pthread->parent pid, 'd'); 

248 } 

249 

250 switch (pthread->status) { 

251 case 0: 

252 pad print (out pad, 16, "RUNNING", 's'); 

253 break; 

254 Case 1: 

255 pad. print (out. pad, 16,; "READY™;, “SsS"'); 

256 break; 

257 Case 2: 

258 padprinit(out Bad; L060.. "BLOCGKEDT ,Sn). 

259 break; 

260 case 3: 

261 pad print (out pad, 16, "WAITING", 's'); 

262 break; 

263 case 4: 

264 pad print (out pad, 16, "HANGING", 's'); 

265 break; 

266 Case 5: 

267 pad print (out Pad, Ll6; TDIBDT, Vet)y 

268 } 

269 pad print (out pad, 16, &pthread->elapsed ticks, 'x'); 

270 

2 memset (out pad, 0, 16); 

2.72 ASSERT (strlen (pthread->name) < 17); 

2°73 memcpy (out _ pad, pthread->name, strlen (pthread->name)); 

274 strcat (out pad, "\n"); 

215 sys write(stdout no, out pad, strlen(out pad)); 

276 return false; // 此 处 返回 false 是 为 了 迎合 主 调 函 数 1ist_traversal 
// 只 有 回调 函数 返回 false 时 才 会 继续 调用 此 函数 

2 

278 


279 /* 打印 任务 列表 */ 
280 void sys ps(void) { 





281 char* ps title = "PID PPID STAT\ 
TICKS COMMAND\n™"; 

282 sys_ write(stdout no, ps title, strlen(ps title)); 

283 list traversal (&thread all list, elem2thread info, 0); 

284 } 

.. 略 








代码 就 不 详尽 介绍 了 ， 下 面 从 大 体 上 说 说 。 




































































函数 pad_print 用 于 对 齐 输出 ， 原 理 是 先 用 switch 结构 中 sprintf 函数 把 待 输出 的 字符 串 ptr 写 入 缓冲 区 buf， 
buf 的 长 度 是 buf len， 这 是 固定 的 值 ， 无 论 字符 串 ptr 是 多 少 字符 ， 永 远 输出 buf len 长 度 ， 如 果 ptr 长 度 不 足 









































buf len， 就 以 空格 来 填充 ， 这 是 用 while 循环 完成 的 。 在 pad_print 中 的 switch : 
字符 串 ，case 'd' 用 来 处 理 16 位 整数 ，case x' 用 来 处 理 32 位 整数 。 本 来 case 'd 和 













































































有 三 种 case，case 's' 用 来 处 理 
case x' 取 其 一 即 可 ， 但 由 于 待 












































处 理 的 数据 类 型 不 同 ，pid 是 16 位 宽 ， 若 统一 用 32 位 来 处 理 ， 还 需要 再 改 pid 的 数据 类 型 ， 改 个 类 型 都 不 叫 事 
儿 ， 疏 怖 的 是 与 之 产生 的 “ 雪 裔 效应 ” 我 还 得 改 书 中 所 有 涉及 到 pid 的 代码 和 相关 的 解释 内 容 ， 还 包括 在 这 之 







































































后 的 所 有 章节 中 与 此 相关 的 代码 ， 话 说 我 已 经 改 伤 了 ， 过 程 实在 是 太 痛 苗 了 ， 很 对 不 起 大 家 ， 因 此 为 pid 专门 指 


定 了 case 'd， 使 其 处 理 16 位 数据 ， 解 释 这 个 的 目的 是 想 和 大 伙 儿 说 ， 如 果 当 初 task struct 中 的 pid 为 32 位 数据 









































类 型 ， 此 处 只 需要 处 理 32 位 数据 就 行 了 ， 不 需要 增加 一 种 case 来 分 开 处 理 ， 请 大 伙 包 容 或 无 视 这 个 “补丁 ”。 














函数 elem2thread info 用 于 打印 任务 信息 ， 它 是 list_traversal 函数 中 的 回调 
函数 原理 是 输出 每 个 任务 的 pid、ppid， 然 后 通过 switch 结构 根据 任务 的 







































































函数 ， 用 于 线程 队列 的 处 理 。 
status 输出 不 同 的 任务 状态 ， 














任务 状态 包括 “RUNNING”“READY”“BLOCKED”“WAITING”“HANGING”“DIED” 调用 pad_print 





























函数 把 输出 的 信息 对 齐 为 16 个 字符 的 固定 长 度 ， 然 后 通过 sys_write 输出 。 
最 后 是 函数 sys_ ps， 它 就 是 系统 调用 ps 的 内 核 部 分 。 
有 关系 统 调 用 的 部 分 就 到 这 了 ， 基 本 上 对 于 目前 的 应 用 来 说 已 经 够 用 了 ， 


15.4.5 “路径 解析 转换 







































































本 节 到 这 结束 。 


下 面 咱们 进行 基础 工作 的 剩余 部 分 一 一 路 径 解析 。 两 个 问题 ， 什么 是 路 径 解 析 ? 为 什么 要 进行 路 径 解析 ? 
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户 操作 方便 ， 路 径 有 绝对 路 径 和 相对 路 径 之 分 。 

















民 结 底 的 原因 是 为 了 使 






































通常 情况 下 ， 用 户 为 了 方便 操作 ， 在 输 
实 实地 写 绝对 路 径 ， 毕 竞 太 长 了 ， 输 入 起 来 
很 贴心 ， 它 提供 了 相对 路 径 的 功能 ， 这 样 
都 是 相对 于 当前 工作 路 径 得 出 的 ,“ 当 前 







































































对 目录 应 该 就 是 “.” 和 “..” 了 ， 这 也 是 相对 路 径 的 
录 的 父 目录 。 系 统 是 如 何 区 分 相对 目录 和 绝对 目 
顾名思义 ,“ 根 ” 嘛 ， 这 必然 是 绝对 目 

















路 径 ， 这 里 强 
也 得 是 文件 系统 
如 果 filel 在 当前 目录 中 存在 的 话 ， 系 统 才 会 显示 
路 径 输入 发 生 在 用 户 态 ， 而 系统 调用 通过 中 时 







































































好 麻烦 。“ 相 对 
户 才 方便 。 相 对 路 径 就 是 以 当前 
工作 路 径 ” + 
“/home/work” 和 若 键 入 了 “file1” filel 的 绝对 路 径 训 


录 呢 ?很 简单 ， 如 果 输 入 
录 ， 如 果 路 径 并 非 以 表示 根 目录 的 “/” 玫 
调 的 是 “认为 ”， 也 就 是 会 按照 相对 路 径 来 处 理 ， 
上 存在 的 路 径 ， 如 果 该 路 径 不 存在 ， 系统 会 报错 的 。 比 如 ,用 户 可 以 执行 命令 “1]s 
文件 包 el 的 信息 。 
的 方式 发 和 9 























“相对 路 径 ”=“ 绝 对 路 径 ”。 





是 “/home/workfile1>。Linux 操作 中 用 








入 命令 或 参数 时 ， 往 往 都 输入 的 是 相对 路 径 ， 很 少 有 同学 老 老 
路 径 ”虽然 是 用 户 提出 的 需求 ， 但 根本 上 是 系统 
- 作 路 径 为 基础 ， 命 令 或 参数 
比如 当前 工作 路 径 是 




















的 最 多 的 相 




















表示 方式 ， 它 们 分 别 表示 当前 了 



































它 未 必 是 真 






































芷 系统 虽 是 中 断 驱 动 
要 为 内 核 代码 减 荷 ， 
把 路 径 转换 的 工作 交 给 
数 的 路 径 参数 应 该 是 
以 上 的 内 容 已 经 


让 它们 尽量 快 点 从 内 核 态 返回 ， 
内 核 态 
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程 




















[ 作 目 录 和 
的 路 径 以 “ 根 ” 目 录 “/” 开 头 ， 
F 头 ， 就 被 “认为 ”是 相对 
正 的 相对 路 径 ， 毕 竟 相 对 路 径 


在 内 核 态 ， 咱 们 这 里 反复 强调 上 
的 ， 但 我 们 又 希望 它 不 停 地 运行 ， 故 不 希望 执行 中 断 处 理 
以 处 理 更 多 的 中 断 。 于 是 很 自然 地 想到 ， 





当前 工作 日 





filel”, 


的 一 句 话 是 操 


序 的 时 间 过 长 ， 因 此 我 们 


我 们 不 应 该 














下 的 文件 系统 函数 ,最 好 由 用 户 态 的 程序 完成 , 提交 给 内 核 态 
j 户 态 程序 转换 后 的 绝对 路 径 。 
答 了 本 贡 开 头 的 两 个 问题 。 另 外 ， 有 些 命 令 有 默认 的 参数 ， 也 就 是 在 不 输入 参数 的 



































情况 下 命令 也 会 正确 执行 





















































默认 情况 下 是 回 到 用 户 的 家 目 
文件 ， 并 非特 指 普通 文件 。 

好 啦 ， 以 上 就 是 咱们 本 节 要 完 
是 把 路 径 中 的 “..” 和 “.” 蔡 换 成 实际 的 目录 ， 将 


口 



































> 



































成 的 任务 ,不 过 大 伙 】 


直上 朋 全 





站 文件 系统 函 








只 是 会 自动 执行 某 种 特定 行为 。 举 两 个 例子 ， 直 接 输入 cd 命令 后 不 接 参数 ， 
录 。ls 命令 知 无 参数 ， 则 会 显示 当前 目录 下 的 所 有 文件 ， 此 文件 是 指 一 切 











名 














L 放 心 》 咱 们 的 作风 


单 ， 路 径 解 析 也 主要 











由 十 睹 了 


] 户 键入 的 路 径 ， 无 论 是 绝对 路 径 ， 


还 是 相对 路 径 ， 一 


























律 转换 成 不 含 “.” 和 “..” 的 绝对 路 径 ， 然 后 再 把 转换 后 的 路 径 作 为 命令 的 参数 ， 最 后 再 对 茶 些 有 默认 参 














数 的 命令 做 针对 性 处 理 就 好 了 。 














































































































































































































代码 15-17 (project/c15/e/shell/buildin_cmd.c ) 
洛 
/* 将 路 径 old_abs path 中 的 . .和 .转换 为 实际 路 径 后 存 入 new abs path */ 
2 static void wash path (char* old abs path, char* new abs path) { 
3 assert (old abs path[0] == '/'); 
4 char name [MAX FILE NAME LEN] = {0}; 
3 char* sub path = old abs path; 
6 sub path = path parse (sub path, name); 
水 if (name[0] == 0) { 
// 若 只 键入 了 "/", 直接 将 "/" 存 入 new_abs_path 后 返 匠 
8 new_abs path[0] = '/'; 
9 new_abs path[1] = 0; 
20 return; 
21 } 
22 new abs path[0] = 0; // 避免 传 给 new_abs_path 的 缓冲 区 不 干净 
23 strcat (new abs path, "™/"); 
24 while (name[0]) 
25 /* 如 果 是 上 一 级 目录 “ 4 
26 if" (Lstremp ("es name)) 1 
2 char* slash ptr = strrchr (new abs path, '/'); 
28 /* 如 果 未 到 new_abs_path 中 的 顶层 目录 ， 就 将 最 右边 的 ' /' 替换 为 0， 
29 这 样 便 去 除了 new_abs_path 中 最 后 一 层 路 径 ， 相 当 于 到 了 上 一 级 目录 */ 
30 if (slash ptr != new abs _ path) { 
// 如 new_abs_path 为“/a/b”，".." 之 后 则 变 为 “/a” 
31 *slash ptr = 0; 
32 } else { // 如 new_abs_path 为 "/a"，".." 之 后 则 变 为 "/" 





有 关 路 径 解析 的 代码 咱们 放 在 shell/buildin_cmd.c 中 ， 这 是 新 创建 的 文件 ， 您 看 名 字 就 猜 到 了 ， 这 是 
再 说 ， 还 是 先 做 好 基础 构建 ， 上 代码 啦 ， 见 代码 15-17。 
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33 /* 若 new_abs_path 中 只 有 1 个 '/'， 即 表示 已 经 到 了 顶 录 ， 
34 就 将 下 一 个 字符 置 为 结束 符 0 */ 
35 *(slash ptr + 1) = 0 
36 } 
才子 } else if (strcmp(".", name)) { 
// 如 果 路 径 不 是 “.”， 就 将 name 拼接 到 new_abs_path 
38 if (strcmp (new abs path, "/")) { // 如 果 new abs_path 不 是 "/" 
// 就 拼接 一 个 "/"，, 此 处 的 判断 是 为 了 避免 路 径 开头 变 成 这 样 "//" 
39 strcat (new abs path, "/"); 
40 } 
41 strcat (new abs path, name); 
42 } // 若 name 为 当前 目录 " ."， 无 需 处 理 new_abs_path 
43 
44 /* 继续 遍历 下 一 层 路 径 */ 
45 memset (name, 0, MAX FILE NAME LEN); 
46 if (sub path) { 
47 sub path = path parse (sub path, name); 
48 } 
49 } 
50 4 
地 
52 /* 将 path 处 理 成 不 含 . .和 .的 绝对 路 径 ， 存 储 在 final path */ 
53 void make clear abs path (char* path, char* final path) { 
54 char abs path [MAX PATH LEN] = {0}; 
55 /* 先 判断 是 否 输入 的 是 绝对 路 径 */ 
56 if (path[0] != '/') { // 若 输入 的 不 是 绝对 路 径 ， 就 拼接 成 绝对 路 径 
号 :4 memset (abs path, 0, MAX _ PATH LEN); 
58 if (getcwd(abs path, MAX PATH LEN) != NULL) { 
59 if (!((abs path[0] == '/') && (abs pathn{[1] == 0))) { 
// 若 abs_path 表示 的 当前 目录 不 是 根 目录 / 
60 strcat (abs path, "™/"); 
61 } 
62 } 
63 } 


64 strcat (abs path, path); 
65 wash path (abs path, final path); 


函数 wash_path 接受 两 个 参数 ， 转 换 前 的 旧 绝 对 路 径 old abs_path 和 转换 后 的 新 绝对 路 径 
new_abs_path， 功 能 是 将 路 径 old_abs _path 中 的 “..” 和 “.” 转 换 为 实际 路 径 后 存 入 new_abs_path。 其 中 
old_abs_path 肯定 是 绝对 目录 ， 这 是 由 主 调 函 数 传 入 的 ， 因 此 new_abs_path 必然 也 是 绝对 路 径 ， 这 两 者 的 
区 别 就 是 old_abs_path 中 可 能 包括 “.” 或 “..” 但 new_abs_path 中 绝对 不 包括 它们 。 

wash_path 的 原理 是 调用 函数 path_parse 从 左 到 右 解析 old_abs_path 路 径 中 的 每 一 层 ， 知 解析 出 来 的 
目录 名 不 是 “..” 就 将 其 连接 到 new_abs_path， 若 是 “..”, 就 将 new_abs_path 的 最 后 一 层 目录 去 掉 。 强 
调 一 下 , new_abs_path 才 是 转换 后 的 绝对 路 径 的 结果 , 在 路 径 解 析 中 过 到 “..” 时 就 是 去 修改 new_abs_path。 

函数 开头 定义 了 数组 name[MAX _FILE NAME LEN], 用 它 来 存储 路 径 中 解析 出 来 的 各 层 目 录 名 。 第 
15 行 指针 sub_path 指向 old_abs_path， 用 它 来 配合 函数 path_parse 的 路 径 解析 。 
name 数组 本 身 初始 化 为 0， 它 就 是 空 的 ， 在 经 过 path parse 处 理 后 ， 什 么 情况 下 name 依然 为 空 呢 ? 
如 果 old_abs_path 本 身 为 空 ，name 并 未 改变 ， 因 此 依然 为 空 ， 不 过 函数 开头 的 assert 就 会 报警 ， 后 面 的 代 
码 不 会 执行 。 如 果 old_abs_path 仅 由 一 个 或 连续 多 个 “/” 组 成 ，path_parse 会 将 这 些 “/” 去 掉 ， 此 时 数组 name 
依然 为 空 。 如 果 old_abs_path 不 是 单纯 的 “/” 且 不 为 室 ， 经 过 path parse 返回 后 ，name 必然 不 为 空 。 因 此 在 
第 17 行 ， 如 果 name[0]=0， 即 name 为 空 ， 一 定 是 old abs path 仅 为 1 个 以 上 的 “/” 此 时 把 它 当 根 目录 处 理 ， 
将 new_abs_path 填充 为 根 目 录 “/” 后 返回 。 
第 23 行人 为 在 new_path 后 接 一 个 “/” 作为 路 径 分 隔 符 。 

第 26 行 ， 如 果 解 析出 来 的 目录 是 “..” 按照 语义 就 将 目录 回 退 到 上 一 级 目录 。 先 用 函数 strrchr 从 右 往 
左 找到 new_abs_path 中 最 右边 的 “/” 的 地 址 ， 注 意 是 地 址 ， 并 不 是 下 标 ， 该 地 址 用 指针 slash_ptr 保存 。 
第 30 一 36 行 判 断 slash_ptr 是 否 是 new_abs_path 的 首 字 符 的 地 址 ， 如 果 不 是 ， 就 将 slash_ptr 处 的 值 置 
为 字符 串 结束 字符 “\0”， 也 就 是 0 值 ， 否 则 就 将 slash ptr 处 的 下 一 个 字符 置 为 结束 符 “\0” 是 这 样 的 ， 
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如 果 最 后 一 个 “/” 不 是 new_abs_path 首 字 符 的 “/”， 也 就 是 说 new_abs_path 是 个 多 级 目录 ， 其 中 不 只 有 
根 目录 的 “/”， 类 似 这 种 情况 :“/a/b” slash ptr 是 a 和 b 之 间 的 “/” 将 最 右 一 个 “/2” 
去 除了 new_abs_path 中 最 后 一 层 路 径 ， 相 当 于 到 了 上 一 级 目录 ， 即 new_abs_ path 变 成 了 “/a”。 如 果 slash ptr 
况 :“/a” 就 将 字符 a 变 成 0，new_abs path 变 成 了 “/”。 



























































处 的 “/” 是 new_abs_path 的 首 字符 “/” 类 似 这 种 情 
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果 目 录 名 是 “.”， 就 什么 都 不 做 ， 保 持 new_abs_path 不 变 。 
第 44 一 48 行 继续 下 一 轮 处 理 ， 本 函数 介绍 完 









































地 换 为 0， 这 样 便 























第 37 行 ， 如 果 解 析出 来 的 目录 名 name 不 是 “.” 就 将 目录 名 name 拼接 到 new_abs_path 的 后 面 。 如 


函数 make_clear abs_path 接受 2 个 参数 ， 原 目录 path 和 转换 后 的 绝对 路 径 final path。 其 中 path 是 用 
户 键入 的 路 径 ， 可 能 是 相对 路 径 ， 也 可 能 是 绝对 路 径 ， 也 可 能 包含 “.” 和 “..” 的 相对 路 径 或 绝对 路 径 ， 





而 final path 是 不 含 “.” 和 “..” 的 绝对 路 径 。 
函数 实现 就 是 上 面 介绍 过 的 wash_path 的 封装 ， 就 不 那么 闻 














# 细 地 介绍 了 。 核 心思 路 是 : 为 了 确保 传 给 


























wash_path 的 参数 old_abs_path 是 绝对 路 径 ， 在 第 58 行 调用 了 系统 调用 getcwd 获得 当前 工作 目录 的 绝对 
























































路 径 ， 将 用 户 输入 的 目录 path 追加 到 工作 目录 之 后 形成 绝对 目录 abs_path， 将 3 








进行 目录 转换 。 
下 面 在 shell.c 中 增加 测试 代码 ， 如 代码 15-18 所 示 。 




















代码 15-18 (project/c15/e/shell/shell.c ) 









































图 15-9 所 示 。 




















16 char* argv [MAX ARG NR]; 
// argv 为 全 局 变量 ， 为 了 以 后 exec 的 程序 可 访问 参数 
工 也 .int32.t Arge 二 =13 
18 /* 简单 的 shell */ 
19 void my_ shell (void) { 
20 cwd cache[0] = '/'; 
21 cwd cache[1] = 0; 
2 while (1) { 
3 print prompt (); 
24 memset (final path, 0, MAX PATH LEN); 
5 memset (cmd line, 0, MAX _ PATH LEN); 
26 readline (cmd line, MAX PATH LEN); 
27 if (cmd line[0] == 0) { // 若 只 键入 了 一 个 回 车 
28 continue; 
29 } 
30 argc = -1; 
3 argc = cmd parse(cmd line, argv, ' '); 
32 if (argc == -1) { 
33 printf("num of arguments exceed Sd\n", MAX ARG NR); 
34 continue; 
39 } 
36 
37 char buf [MAX PATH LEN] = {0}; 
38 int32 t arg idx = 0; 
9 while(arg idx < argc) { 
40 make clear abs path(argv[larg idx], buf); 
41 printf("%$s -> Ss\n", argv[arg idx], buf); 
42 hoo Ne bs 
43 } 
44 } 
45 panic("my_ shell: should not be here"); 
46 } 





当前 工作 目录 是 根 目录 ， 目 测 图 中 所 键入 的 路 径 均 被 转换 为 正确 的 绝对 路 径 。 
































好 啦 ， 到 这 该 说 的 都 说 啦 ， 估 计 兄 弟 们 都 已 经 厌倦 了 基础 了 











大 伙 儿 往昔 了 ， 下 节 再 见 。 


其 作为 参数 传 给 wash_path 


第 139 一 143 行 是 本 次 的 测试 代码 ， 循 环 打印 所 键入 的 原始 路 径 字 符 串 和 转换 后 的 路 径 。 运 行 结 果 如 


[ 作 ， 好 吧 ， 下 节 咱 们 开始 让 shell 动 起 来 ， 
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Bochs x86 emulator, http://bochs.sourceforge.net/ 


SetsuspEND Poer 
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[rabbitelocalhost /dir1l/..a 
/dir1l/../a -> /a 
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15-9 路径 转换 演示 





Pp 
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15.4.6 ”实现 ls、cd、mkdir、ps、rm 等 命令 
如 果 您 接触 过 Linux 的 shell 或 微软 的 DoS， 就 一 定 了 解 命 令 分 为 两 大 类 ， 一 种 是 外 部 命令 ， 另 一 种 


是 内 部 命令 。 
外 部 命令 是 指 该 命令 是 个 存储 在 文件 系统 上 的 外 部 程序 ， 执 行 该 命令 实际 上 是 从 文件 系统 上 加 载 该 
序 到 内 存 后 运行 的 过 程 ， 也 就 是 说 外 部 命令 会 以 进程 的 方式 执行， 大 伙 儿 应 该 最 为 熟悉 ls 命令 ， 它 就 是 
型 的 外 部 命令 ， 它 通常 的 存储 路 径 是 /bin/ls。 

内 部 命 命令 也 称 为 内 建 命令 ,是 系统 本 身 提供 的 功能 ， 它 们 并 不 以 单独 的 程序 文件 存在 ， 只 是 一 些 单独 
的 功能 函数 ， 系 统 执行 这 些 命 令 实 际 上 是 在 调用 这 些 函 数 。 比 如 cd、fg、jobs 等 命令 是 由 bash 提供 的 ， 
因此 它们 称 为 BASH BUILTINS 。 

为 了 让 咱们 的 shell 动 起 来 , 本 节 咱 们 要 实现 一 些 命令 , 这 些 命令 包括 1s、 cd、mkdir、 rmdir、 rm、 pwd、 
ps 和 clear。 注 意 啦 ， 虽 然 这 些 命令 在 Linux 中 大 部 分 都 属于 外 部 命令 ， 但 这 并 不 影响 shell 功能 的 实现 ， 
为 了 省 事 ， 咱 们 目前 统统 用 内 部 函数 的 方式 来 实现 它们 ， 先 让 shell 动 起 来 再 说 。 

我 们 的 内 部 命令 是 在 shell/buildin_cmd.c 文件 中 ， 见 代码 15-19。 


代码 15-19 (project/c15/f/shell/buildin_cmd.c ) 
































HTH 



























































































































































上 
‘ 







































































68 /* pwd 命令 的 内 建 函数 */ 
69 void buildin pwd (uint32 七 argc, char** argv UNUSED) { 


了 if (argc != 1) { 

eal printf ("pwd: no argument support!\n"); 

了 多 return; 

全 } else { 

74 if (NULL != getcwd (final path, MAX PATH LEN)) { 
75 printf("%$s\n", final path); 

76 } else { 

3 printf ("pwd: get current work directory failed.\n"); 
78 } 

79 } 

80 } 

81 





82 /* cd 命令 的 内 建 函 数 */ 

83 ehar* buildin cd(uint32 t arge, har** argv) 1 

84 us a ke 0 

85 printf("cd: only support 1 argument!\n"); 
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CD 





54 


return NULL; 














接 返 区 
































若是 只 键入 cd 而 无 参数 ， 
(age 二 天 
final path[0] 
final path[1] 

} else { 

make clear abs path (argv[1], 


到 根 


1 
和 


0; 


} 
if (chdir (final path) 
pintte (ted: 
return NULL; 


二 二 7 下 四 二 


} 
return final path; 


} 


/* 1s 命令 的 内 建 函数 */ 

void buildin ls(uint32 t argc, 
char* pathname = NULL; 
struct stat file stat; 
memset (&file stat, 0, 
bool long info = false; 
uint32 七 arg path nr = 0; 
uint32 t arg idx = 1; 





no such directory %s\n", 


// 跨 过 argv[0]，argv[0] 是 字符 串 “1s 


#7 


判 


final path); 


final path); 


char** argv) { 


sizeof (struct stat)); 





























while (arg idx < argc) { 
if (argv[arg_ idx] [0] == '-') { // 如 果 是 选项 ， 单 词 的 首 字符 是 - 
if (!strcmp("-1", argv[larg idx])) { // 如 果 是 参数 -1 
long info = true; 
else if (!strcmp("-h",， argv[arg idx])) {  // 参数 -h 
printf("usage: -1 list all infomation about the file.\n-h for \ 


return; 

else { 
printf ("ls: 
information.\n", 
return; 


// 1s 的 路 径 参 数 
(arg path nr == 0) { 








} else { 
if 


help\nlist all files in the current dirctory if no option\n™"); 


// 只 支持 -h -1 两 个 选项 
invalid option %s\nTry “1s -h' 
argvlarg idx]); 


for more\ 


only support one path\n"); 


pathname = argvl[larg idx]; 
arg path nr = 1; 
} else { 
printf("1ls 
return; 


} 
} 
arg_idxt++; 
上 


if (Pathname == NULL) { // 若 只 输入 了 1s 或 1s -1 
// 没有 输入 操作 路 径 ， 默 认 以 当前 路 径 的 绝对 路 径 为 参数 
if (NULL != getcwd (final path, MAX PATH LEN)) { 
pathname = final path; 
} else { 
printf("l]s: getcwd for default path failed\n"); 
return; 
} 
} else { 
make clear abs path (pathname, final path); 
pathname = final path; 
} 
if (stat (pathname, &file stat) == -1) { 
printf("ls: cannot access %s: No such file or directory\n", pathname); 
return; 
} 
if (file stat.st filetype == FT DIRECTORY) { 


Struct i dL 
struct dir entry* dir e = 


opendir (pathname); 
NULL; 
char sub pathname [MAX _ PATH LEN] = 


{0}; 
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D5 uint32 t pathname len = strlen (pathname); 

56 uint32 七 last char idx = pathname len - 1; 

Dy: memcpy (sub_pathname, pathname, pathname len); 

58 if (sub pathname[last char idx] != '/') { 

59 sub pathname [pathname len] = '/'; 

60 pathname lent++; 

61 } 

62 rewinddir (dir); 

63 if (long info) { 

64 char ftype; 

65 printf("total: Sd\n", file stat.st size); 

66 while((dir e = readdir(dir))) { 

67 ftype = "'d'; 

68 if (dir e->f type == FT REGULAR) { 

69 ftype = '-'; 

70 } 

2 sub pathname [pathname len] = 0; 

四 strcat (sub pathname, dir e->filename); 

4 memset (&file stat, 0, sizeof (struct stat)); 

74 if (stat (sub pathname, &file stat) == -1) { 

“9 printf("ls: cannot access %$s: No such file or directory\n",\ 

dir e->filename); 

76 return; 

} 

78 Printf("sc %d $d %s\n", ftype, \ dir e->i no file stat.st size, 
dir e->filename); 

J:9 } 

80 belse{ 

81 while((dir e = readdir(dir))) { 

82 printf("%s ", dir e->filename); 

83 } 

84 printeE( Ny 

85 } 

86 closedir (dir); 

87 } else { 

88 ve 部 

89 printf("- %d %d S$%Ss\n",file stat.st ino,\file stat.st size,pathname); 

90 } else { 

91 printf("%$s\n", pathname); 

92 } 

93 } 

94 } 

95 





96 /* ps 命令 内 建 函 数 */ 
97 void buildin ps (uint32 七 argc char** argv UNUSED) { 









































98 if (argc != 1) { 

99 printf("ps: no argument support!\n"); 
200 return; 
201 } 
202 ps (); 
2.03: 
204 
205 /* clear 命令 内 建 函 数 */ 
206 void buildin clear (uint32 t argc, char** argv UNUSED) { 
207 if (argc != 1) { 
208 printf("clear: no argument support!\n"); 
209 ete 
210 } 
211 clear ()}; 
2 业 2 二 
2 
214 /* mkdir 命令 内 建 函数 */ 
2 int32 t buildin mkdqir(uint32 七 argqc char** argv) { 
2 Tint32 tt -Tet = =—13 
217 if (argc != 2) { 
218 printf("mkdir: only support 1 argument!\n"); 
219 } else { 
220 make clear abs path (argv[1], final path); 
221 /* 若 创 建 的 不 是 根 目录 */ 
222 if (Stremp("/"; fifnal pathyy). 4 
2 if (mkdir(final path) == 0) { 
22.4 ret = 0; 


714 





225 } else { 
226 Printf ("mkdqir: create directory %s failed.\n", argv[1]); 


230 return ret; 





233 /* rmdir 命令 内 建 函 数 */ 
234 int32 t buildin rmdir(uint32 七 argqc char** argv) { 
239 int32 t ret = -1; 
236 if (argc != 2) { 
237 printf("rmdir: only support 1 argument!\n"); 
238 } else { 
2.39 make clear abs path(argv[1], final path); 
240 /* 若 删 除 的 不 是 根 目录 */ 
4 if (strcmp("/", final path)) { 
2 if (rmdir(final path) == 0) { 
3 ret = 0; 
4 } else { 
245 printf("rmdir: remove %s failed.\n", argv[1]); 
6 
7 
8 























} 
} 
} 


249 return ret; 





252 /* rm 命令 内 建 函数 */ 

2 Tnt32: 志 , DULLdin rm(uint32 tt rg. "Char*t EQY) 4 
254 int32 t ret = -1; 

299 if. (arge J=.2) 区 

256 printf("rm: only support 1 argument!\n"); 
4 } else { 

258 make clear abs path(argv[1], final path); 
259 /* 若 删除 的 不 是 根 目录 */ 

260 if (strcmp("/", final path)) { 

261 if (unlink (final path) == 0) { 

262 ret = 0; 

263 } else { 

264 printf("rm: delete %s failed.\n", argv[1]); 
269 } 


























267 } 
268 } 
269 return ret; 


























代码 很 长 ， 没 有 将 它们 拆 分 ， 原 因 是 没 必要 细致 介绍 它们 ， 因 为 这 些 内 建 命令 只 属于 应 用 程序 编程 ， 
就 像 大 伙 儿 平时 在 宿主 系统 上 开发 C 程序 是 一 样 的 ， 大 伙 儿 一 定 能 轻松 搞定 。 说 下 咱们 内 部 命令 的 编写 规则 。 

(1) 内 部 命令 都 以 前 级 “buildin ”+ “命令 名 ”的 形式 命名 ， 如 cd 命令 的 函数 是 buildin_cd。 

(2) 形 参 均 是 argc 和 argv，argc 是 参数 数组 argv 中 参数 的 个 数 。 

(3) 函数 实现 是 调用 同 功能 的 系统 调用 实现 的 ， 如 函数 buildin_cd 是 调用 系统 调用 chdir 完成 的 。 

(4) 在 进行 系统 调用 前 调用 函数 make_clear abs _path 把 路 径 转 换 为 绝对 路 径 。 

所 有 内 部 命令 的 函数 实现 都 是 按照 以 上 规则 编写 的 ， 代 码 大 伙 儿 自己 看 吧 。 这 里 稍微 提 一 下 ，Linux 中 
执行 ls 命令 时 ， 默 认 是 不 会 显示 “.” 和 “..” 的 ， 它 们 被 隐藏 了 ， 通 过 参数 -a 才 会 显示 它们 。 咱 们 的 1s 
没 做 那么 复杂 ， 目 前 只 支持 -h 和 -1 参数 ,“.” 和 “..” 总 会 显示 。 

也 许 您 在 想 ， 这 些 内 部 命令 该 如 何 调用 ? 这 肯定 是 在 shell.c 中 完成 的 ，shell 知道 用 户 键入 了 什么 ， 因 | 
此 它 知道 该 调用 什么 样 的 命令 ， 好 啦 ， 下 面 看 最 新 的 shell.c， 它 今天 长 这 样 ， 见 代码 15-20。 


代码 15-20 (project/c15/f/shell/shell.c ) 
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13 /* 存储 输入 的 命令 */ 
14 static char cmd line[MAX PATH LEN] = {0}; 
15 char final path[MAX PATH LEN] = {0}; // 用 于 清洗 路 径 时 的 缓冲 
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{ 


第 15 章 系统 交互 
17 /* 用 来 记录 当前 目录 ， 是 当前 目录 的 缓存 ， 
村 次 执行 cd 命令 时 会 更 新 此 内 容 */ 
18 char cwd cache[MAX PATH LEN] = {0}; 
19 
20 /* 输出 提示 符 */ 
21 void print prompt (void) { 
22 printf("[rabbit@localhost %s]$ ", cwd cache); 
23. } 
… 略 
07 char* argv[IMAX ARG NR]; 
// argv 必须 为 全 局 变量 ， 为 了 以 后 exec 的 程序 可 访问 参数 
O08 "TNnt32 tt droge :~ Ly 
09 /* 简单 的 shell */ 
0 void my_ shell(void) { 
业 cwd cache[0] = '/'; 
2 while (1) { 
3 print prompt (); 
4 memset (final path, 0, MAX _ PATH LEN) 
9 memset (cmd line, 0, MAX PATH LEN); 
6 readline (cmd line, MAX PATH LEN); 
7 if (cmq line[0] == 0) { // 若 只 键入 了 一 个 回 车 
8 continue; 
9 } 
20 argc = -1; 
县 argc = cmd parse (cmdq line, argv, ' '); 
22 if (argc == -1) { 
223 printf("num of arguments exceed %d\n", MAX ARG NR); 
24 continue; 
25 } 
26 1f (tostremp( Le... ‘arogw[lOlyy 
2 buildin ls(argc, argv); 
28 } else if (!strcmp("cd", argv[0])) { 
29 if (buildin cdl(largc, argv) != NULL) 
30 memset (cwd cache, 0, MAX PATH LEN); 
二] strcpy (cwd cache, final path); 
32 } 
马克 else if (!strcmp ("pwd", argv[0])) { 
34 buildin pwd(argc, argvV) 
35 else if (!lstrcmp("ps", argv[0])) { 
36 buildin ps(argc, argv); 
37 else if (!lstrcmp ("clear", argv[0])) { 
38 buildin clearl(argc, argv); 
39 else if (!lstrcmp ("mkdir", argv[0]))t{ 
40 buildin mkdir(argc, argv); 
41 else if (!lstrcmp ("rmdir", argv[0]))t{ 
42 buildin rmdirl(argc, argv); 
43 else if (!lstrcmp ("rm", argv[0])) { 
44 buildin rm(argc, argv); 
45 else 
46 printf ("external command\n"); 
47 
48 } 
49 panic("my_ shell: should not be here"); 
50; 0 
.上 略 





第 15 行 定义 的 final path 是 全 














内 部 函数 都 可 以 使 用 它 。 咱 











代码 第 126 一 147 行 是 shelli 


们 只 支持 单 控制 台 ， 因 此 并 不 会 出 现 final_path 被 覆盖 的 情况 。 








局 数组 ， 它 用 于 存储 路 径 清洗 转换 的 结果 ， 同 时 它 也 是 个 全 局 组 














区 ， 




















函数 与 函数 名 比较 ， 若 相 











等 则 调用 





相应 





前 工作 目录 , 当前 

















复制 到 cwd_cache， 以 更 新 命令 提示 符 
好 啦 ， 想 必 大 伙 儿 尚未 看 完 代 码 ， 就 已 经 等 不 及 想 看 看 运行 效果 了 对 不 对 ， 不 是 的 话 就 当 我 



































了 ， 运 行 结果 如 图 15-10 所 示 。 





限于 屏幕 大 小 有 限 ， 这 里 只 运行 了 几 个 命令 ， 
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大 伙 儿 


























白 | 上 
CD 
























































所 有 


周 用 内 部 命令 的 代码 , 核心 思路 是 argv[0] 被 认为 是 命令 , 然后 调用 strcmp 
的 buildin 函数。 这 里 要 说 下 cd 命令 的 处 理 ，cd 命令 会 改变 当 
作 目 录 也 会 在 命令 提示 符 中 显示 , 因此 cd 命令 成 功 执行 后 , 要 将 最 新 的 路 径 final_path 
FP 的 当前 工作 路 径 部 分 。 











自 娱 自 乐 





























看 下 吧 。 本 节 到 这 也 就 结束 了 ， 咱 








们 下 节 








有 见 。 








Bochs x86 emulator, http://bochs.sourceforge.net/ 


ResetsUspEND Power 


上 
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SsTAT TICKS COMMAND 
READY 292960 init 
READY 292960 ma im 
BLOCKED 0 idle 

4 RUNNING 3 init_fork 

[A 

d: no such directory /dir 

[rabbitelocalhost “]95 cd dir1 

[rabbitelocalhost vdair1195 1s 


[rabbitelocalhost vdair1]19 mkdir dir1l1il 
[rabbitelocalhost vdir1]19 mkdir dirlilvdir1lili1i 
[rabbitelocalhost vdair119 ls dir1li 

. dir111 
[A 
[rabbit@localhost /diri/dirii/dir111]$ pwd 
diri/dir1ii/dir111 
[A 


CTRL + 3rd button enables mouse | | | | | | | | | | | 


4 图 15-10 ”shel| 响应 命令 





COC 加 载 用 户 进程 


上 节 中 ， 咱 们 的 shell 已 经 可 以 支持 内 部 命令 了 ,但 这 还 远 远 不 够 ,我 们 必须 要 做 到 从 硬盘 上 加 载 程序 ， 
实现 真正 的 进程 。 
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15.5.1 ”实现 exec 


大 伙 儿 早 ， 为 了 进一步 完善 用 户 进 程 ， 咱 们 今天 要 完成 exec 的 实现 。 两 个 问题 : 第 一 它 是 干吗 的 ? 第 
二 为 什么 要 实现 exec? 
先 回答 第 一 个 ，exec 会 把 一 个 可 执行 文件 的 绝对 路 径 作 为 参数 ， 把 当前 正在 运行 的 用 户 进程 的 进程 体 
《代码 段 、 数 据 段 、 堆 、 栈 ) 用 该 可 执行 文件 的 进程 体 蔡 换 ， 从 而 实现 了 新 进程 的 执行 。 注 意 ，exec 只 是 
用 新 进程 的 进程 体 蔡 换 老 进程 进程 体 ， 因 此 新 进程 的 pid 依然 是 老 进程 pid。 
下 面 解释 下 第 二 个 问题 。 
我 们 在 上 节 中 虽然 实现 了 一 些 内 部 命令 , 但 显然 那 种 方法 太 笨拙 了 ， 我 们 是 利用 一 系列 的 “if-else if” 
来 完成 的 。 您 看 ， 之 所 以 能 够 用 “if-else if” 结 构 来 实现 命令 处 理 ， 原 因 是 我 们 能 够 提前 预见 用 户 要 键入 
什么 样 的 命令 串 ， 把 于， 与 其 说 是 “预见 ”， 不 如 说 是 “限制 ”实际 上 用 户 只 能 键入 “if-else 让” 结构 中 
包含 的 命令 。 显 然 ， 如 果 按 照 这 种 笨拙 的 方法 继续 添加 新 命令 ， 工 作 量 大 不 说 ， 难 道 每 支持 一 个 新 命令 就 
要 重新 编译 一 次 shell 不 成 ?最 要 命 的 是 外 部 命令 都 是 “mm 
存储 在 文件 系统 上 的 外 部 程序 , 程序 名 可 自由 命名 , 现 i etd han i 
有 的 ols if” 结 构 根 本 无 法 预见 程序 名 是 什么 ， 因 此 i eae 
如 果 用 户 想 运行 一 个 外 部 程 请 。 有 了 exec， 
用 户 酌 可 以 完成 任意 外 部 命 命令 (用 户 进 程 ) 的 运行 。 








































































































































































































































































































































































































extern char **environ; 









































int execl(Cconst char *path, const char *arg, ...); 
eXecC 是 个 簇 ， oe 数 如 图 15-11 所 示 。 int execlpCconst char *file, const char *arg, ...); 
i 本 le int execle(Cconst char *path, const char *arg, 
图 中 这 五 个 exec 函数 功能 类 似 ， 差 别 在 于 程序 对 象 et const eme[Di 
的 表示 方式 和 是 否 传 入 环境 变量 。 参 数 path 表示 是 可 执 tnt edeort chr het, her “pot nhs 














int execvpCconst char PR char *const argv 口 ); 
4 图 15-11 exec 函数 族 




















行文 件 绝对 路 径 ， 参 数 file 表示 可 执行 程序 名 ,具体 的 路 
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径 将 从 shell 的 全 局 变量 $SPATH 中 指定 的 路 径 中 搜索 。 参 数 ... 表 示 可 变 参数 ， 其 中 包括 参数 及 环境 变量 。 
咱们 就 不 细 说 了 ， 因 为 我 们 并 不 会 都 实现 ， 























就 挑 个 简单 的 来 完成 吧 ， 这 里 选 的 是 execv，execv 失败 后 则 











































































































返回 -1， 成 功 则 无 返回 值 。 这 个 看 上 去 有 点 奇怪 是 吧 ， 成功 了 怎么 不 返回 0? 原因 是 : exec 是 去 执行 一 新 进 
星 ， 相 当 于 jmp 指令 一 去 不 回头 ， 并 不 会 “返回 ”， 此 函数 没 必要 有 返回 值 。 既 然 exec 是 执行 新 进程 ， 那 总 






































该 知道 进程 是 否 运行 成 功 吧 ? 有 没有 办 法 获得 进程 的 返回 值 ? 既然 说 了 就 表示 当然 有 办 法 ， 以 后 此 





























们 会 介绍 。 


























exec 函数 定义 在 userprog/exec.c 中 ，exec.c 是 本 节 新 增 的 文件 ， 见 代码 15-21-1。 








代码 15-21-1 














… 略 
9 extern void intr exit (void); 
0 typedef uint32 t Elf32 Word, Elf32 Addr, Elf32 Off; 
1 typedef uint16 七 Elf32 Half; 
2 
3 /* 32 位 elf 头 */ 
4 struct Elf32 Ehdr f 
Sy unsigned char e ident[16]; 
6 El1f32_Half e type; 
7 Elf32 Half e machine; 
8 Elf32 Word e_version; 
9 Elf32 Addr e_entry 
20 Elf32 Off e_ phoff 
人 2 Elf32 _ Off e_shoff 
2 Elf32 Word e_flags 
2.3 Elf32 Half e_ehsize 
24 Elf32.Half e phentsize; 
25 El1f32. Half e_phnum; 
26 EE 让 下马 2 息 让 下 e_shentsize; 
27 Elf32 Half e_shnum; 
28 Elf32 Half e_shstrndx; 
间作 


/* 程序 头 表 Program header 就 是 段 描 述 头 */ 

Struct- Elf32. PRAF > 
Elf32 Word p_type; 
Elf32 Off p offset; 
Elf32 Addr p_vaddr; 
Elf32 Addr p_paddr; 
Elf32 Word p_filesz; 
Elf32 Word p memsz; 
Elf32 Word p_flags; 
Elf32 Word p_align; 





// 见 下 面 




















;0 大 POOOOOOOVOOVOOVOVVW 
Oo WOPO 


.3 

2 

3 /* 段 类 型 */ 

4 enum segment type { 

5 PT_NULL, // 忽略 

6 PT_LOAD, // 可 加 载 程序 段 
7 PT_DYNRAMIC， // 动态 加 载 信息 
8 PT_INTERP, // 动态 加 载 器 名 称 
9 PT_NOTE, // 一 些 辅助 信息 
0 PT_SHLIB, // 保留 
PT_PHDR // 程序 头 表 

2 

略 




















代码 1$-21-1 1 





定义 了 elf 相关 的 数据 结构 。 咱 

















( project/c15/g/userprog/exec.c ) 


的 enum segment type 





们 的 用 户 进程 是 用 C 语言 编写 的 ， 编译 为 elf 格式 ， 


























此 要 把 用 户 程序 从 文件 系统 上 加 载 到 内 存 执行 ， 必 然 涉及 到 elf 格式 的 解析 。 其 实 早 在 加 载 内 核 时 咱们 已 经 接 























触 过 elf 文件 解析 工作 了 ， 只 不 过 那 时 更 困难 



































大 一 部 分 就 是 分 析 ef 中 的 各 种 头 ， 大 伙 儿 忘 了 可 以 回头 翻 翻 
第 10 一 11 行 定义 了 一 些 以 前 级 Elf32_ 开 头 的 变量 ， 








了 继续。 























些 ， 用 的 是 汇编 代码 ， 现 在 咱们 用 
然 更 困难 的 时 期 都 歼 过 来 了 ， 眼 前 的 这 点 都 不 叫 事 儿 。 我 们 在 第 5 间 介 绍 了 elf 格式 的 内 容 ， 下 重 


这 是 为 了 在 “名 称 ” 上 与 elf 相关 结构 














C 语言 来 做 同样 的 工作 。 既 
j 的 加 载 工 作 很 



































的 变量 类 















































型 吻合 , 其 实 变量 类 型 只 是 存储 数值 的 空间 大 小 而 已 , ELF 结构 字段 ， 
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的 变量 大 小 分 别 是 4 字 节 和 2 字 节 。 





结构 体 struct Elf32 Ehdr 定义 的 是 32 位 elf 文件 头 。 接 下 来 是 结构 体 struct El1f32 Phdr， 它 表示 程序 头 





表 ， 也 就 是 段 头 表 。 枚 举 类 型 enum segment type 表示 可 识别 的 段 的 类 天 
段 就 可 以 了 ， 它 是 可 加 载 的 段 ， 也 就 是 程序 本 身 的 程序 体 。 以 上 各 结构 的 详细 
看 代码 15-21-2。 

















节 中 找到 ， 不 再 费 述 。 下 面 





代码 15-21-2 








… 略 
54 /* 将 文件 描述 符 fq 指向 的 
大 小 为 filesz 的 段 加 载 到 虚 # 


55 static bool segment 1 











9， 这 里 中 



































( project/c15/g/userprog/exec.c ) 


文件 中 ， 偏 移 为 offset， 
地 址 为 vaddr 的 内 存 */ 
oadtint3a2 Et Fa 


uint32 t offset, \ 











们 只 关注 类 型 为 PT_ LOAD 的 
内 容 都 可 以 在 第 5 章 中 elf 小 














Uinta2.t fileszs Vint32 tt Vaddre) 



















































































































































































56 uint32 t vaddr first page = vaddr & Oxfffff000; 
// vaddr 地 址 所 在 的 页 框 
57 uint32 t size in first page = PG SIZE - (vaddr & Ox00000fff); 
// 加 载 到 内 存 后 ， 文 件 在 第 一 个 页 框 中 占用 的 字 节 大 小 
58 uint32 t occupy pages = 0; 
59 /* 若 一 个 页 框 容 不 下 该 段 */ 
60 if (filesz > size in first page) { 
61 uint32 t left size = filesz - size in first page; 
62 occupy_pages = DIV _ ROUND UP (left size, PG SIZE) + 1; 
// 1 是 指 vaddr first page 
63 } else { 
64 occupy pages = 1; 
65 } 
66 
67 /* 为 进程 分 配 内 存 */ 
68 uint32 t page idx = 0; 
69 uint32 t vaddr page = vaddr first page; 
70 while (page idx < occupy pages) { 
天 uint32 tx pde = pde ptr(vaddr page); 
72 uint32 tx pte = pte ptr(vaddr page); 
V3 
74 /* 如 果 pqde 不 存在 ， 或 者 pte 不 存在 就 分 配 内 存 . 
75 * pde 的 判断 要 在 pte 之前， 否则 pde 若 不 存在 会 导致 
76 * 判断 pte 时 缺 页 异常 */ 
et if (!(*pde & Ox00000001) || !(*pte & 0x00000001)) { 
78 if (get a page (PF USER, vaddr page) == NULL) { 
-79 return false; 
80 
81 } // 如 果 原 进程 的 页 表 已 经 分 配 了 ， 利 用 现 有 的 物理 页 
// 直接 覆盖 进程 体 
82 vaddr page += PG SIZE; 
83 page_idxt++; 
84 } 
85 sys_lseek (fd, offset, SEEK SET); 
86 sys_read(fd, (void*)vaddr, filesz); 
87 return true; 
8.8; :J} 
… 略 








函数 segment load 接受 4 个 参数 ， 文 件 描 

















述 符 伺 、 段 在 文件 中 的 字 节 偏 移 量 offset、 段 大 小 filesz、 段 




















被 加 载 到 的 虚拟 地 址 vaddr， 函 数 功 能 




















是 将 文件 描述 符 乌 指向 的 文件 中 ， 








偏 移 为 offset， 大 小 为 flesz 的 段 
的 形 参 为 filesz， 而 不 是 类 似 























加 载 到 虚拟 地 址 为 vaddr 的 内 存 空间 。 也 许 您 会 感到 奇怪 ， 为 什么 段 大 小 
segmentsz 之 类 的 ? fesz 给 人 的 感觉 是 文件 大 小 …… 究 其 原因 是 由 了 
好 吧 不 纠结 了 ， 反 正 这 也 是 无 伤 大 雅 的 事 。 


























六 程序 头 中 的 段 大 小 就 叫 p_filesz 











将 段 加 载 到 内 存 ， 其 实 就 是 我 们 平时 所 说 的 操作 系统 为 用 户 进 


程 分 配 内 存 。 程 序 是 由 多 个 段 组 成 的 ， 















































因此 咱们 这 里 按 段 来 处 理 ， 分 别 为 每 个 可 加 载 的 段 分 配 内 存 ， 内 存 分 配 时 采 / 
变量 vaddr first_page 用 于 获取 虚拟 地 址 vaddr 所 在 的 页 框 起 始 



































文件 第 一 个 段 的 起 始 地 址 一 般 情况 下 都 不 是 























况 ， 多 少 都 会 落 在 页 框 中 的 某 部 分 。 这 种 段 并 未 占用 完整 的 自然 页 ， 
























































段 中 其 余 的 尺寸 将 占用 的 页 框 数 , 将 此 部 分 占 











] 的 1 页 框 与 剩余 部 分 

















j 页 框 粒度 。 


也 址 。 
自然 页 ， 也 就 是 段 的 起 始 地 址 很 少 有 0xXXXXX000 的 情 











因此 要 根据 段 中 此 部 分 的 尺寸 计算 出 
占用 的 页 框 数 加 起 来 才 是 该 段 实际 需 





















































要 的 页 框 总 数 。 按 照 这 种 
occupy_pages 表示 该 段 占用 的 总 页 框 数 。 











思路 ， 变 量 size in first page 就 表示 文件 在 











第 一 个 页 框 中 占用 的 字 节 大 小 ， 变 量 
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第 60 行 判 断 ， 如 果 段 大 小 flesz 大 于 size in first page， 这 表示 一 个 页 框 容 不 下 该 段 ， 下 面 第 62 行 
计算 该 段 占 用 的 页 框 数 并 赋值 给 occupy pages。 第 64 行 ， 如 果 段 比较 小 ， 一 个 页 框 可 以 容纳 该 段 ， 就 将 
occupy pages 置 为 1。 
第 68 一 84 行 “ 打 算 ” 分 配 occupy_pages 个 页 框 。 为 什么 说 “打算 ” 呢 ? 原因 是 : exec 是 执行 新 进程 ， 
也 就 是 用 新 进程 的 进程 体 蔡 换 当 前 老 进 程 , 但 依然 用 的 是 老 进程 的 那 套 页 表 ， 这 就 涉及 到 老 进 程 的 页 表 是 
否 满足 新 进程 内 存 要 求 了 。 如 果 老 进程 已 经 分 配 了 页 框 , 我 们 不 需要 再 重新 分 配 页 框 ， 只 需要 用 新 进程 的 
进程 体 履 盖 老 进程 就 行 了 ， 只 有 新 进程 用 到 了 在 老 进程 中 没有 的 地 址 时 才 需 要 分 配 新 页 框 给 新 进程 。 因 此 
第 71 一 72 行 分 别 获取 新 进程 虚拟 地 址 vaddr page 的 pde 和 pte。 第 77 行 判 断 ， 如 果 该 虚拟 地 址 在 老 进程 
中 未 分 配 ， 就 调用 get a_page 分 配 内 存 。 接 着 在 第 82 一 83 行 更 新 为 下 一 虚拟 页 ， 回 到 循环 开头 继续 处 理 。 
把 段 所 需要 的 内 存 分 配 好 后 ， 下 面 是 从 文件 系统 上 加 载 用 户 进程 到 刚刚 分 配 好 的 内 存 中 ， 先 在 
第 85 行 通过 sys_lseek 函数 将 文件 指针 定位 到 段 在 文件 中 的 偏 移 地 址 ,然后 第 86 行将 该 段 读 入 到 虚拟 地 
址 vaddr 处 。 自 此 ， 一 个 段 被 加 载 到 了 内 存 ， 见 代码 15-21-3。 


代码 15-21-3 (project/c15/g/userprog/exec.c ) 















































































































































































































































































































































































































































… 略 
90 /* 从 文件 系统 上 加 载 用 户 程序 pathname， 

成 功 则 返回 程序 的 起 始 地 址 ， 否 则 返回 -1 */ 
91 static int32 t load(const char* pathname) { 


















































92 int32 tt Tet = =]? 
93 struct Elf32 Ehdr elf header; 
94 struct Elf32_ Phdr prog header; 
95 memset (&elf header, 0, sizeof (struct Elf32 Ehdr)); 
96 
97 int32 t fd = sys_open (pathname, O_ RDONLY); 
98 if (fd == -1) { 
99 return -1; 
00 } 
01 
02 if (sys readl(fd, &elf header, sizeof (struct Elf32 Ehdr)) !=\ 
sizeof (struct Elf32 Ehdr)) { 

03 ret = -1; 
04 goto done; 
05 } 
06 
07 /* 校 验 elf 头 */ 
08 if (memcmp (elf header.e ident, "“\177ELF\1\1\1", 7) \ 
09 11 elf header.e type != 2 \ 

0 || elf header.e machine != 3 \ 

1 || elf header.e version != 1 \ 

2 || elf header.e phnum > 1024 \ 

区 || elf header.e phentsize != Sizeof(struct Elf32 Phdr)) { 
4 ret = -1;} 

5 goto done; 

6 } 

4 

8 Elf32 Off prog header offset = elf header.e phoff; 

9 Elf32 Half prog header size = elf header.e phentsize; 
20 
21 /* 遍历 所 有 程序 头 */ 
2 uint32 t prog idx = 0; 
23 while (prog idx < elf header.e phnum) { 
24 memset (&prog header, 0, prog header size); 
25 
26 /* 将 文件 的 指针 定位 到 程序 头 */ 
2 sys_lseek (fd, prog header offset, SEEK SET); 
28 
29 /* 只 获取 程序 头 */ 
30 if (sys readl(fd, &prog header, prog header size) !=\ 

prog header size) { 

| ret = -1;} 
2 goto done; 
33 } 
34 
35 /* 如 果 是 可 加 载 段 就 调用 segment_1load 加 载 到 内 存 */ 
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36 if (PT LOAD == prog header.p type) { 

汪汪 if (!segment load(fd, prog header.p offset, \ 
prog header.p filesz, prog header.p vaddr)) 

38 ret = -1; 

39 goto done; 

4 0 } 

41 } 

42 

43 /* 更 新 下 一 个 程序 头 的 偏 移 */ 

44 prog header offset += elf header.e phentsize; 

45 Prog_idxt++; 

4 6 } 

47 ret = elf header.e entry; 

48 done: 

49 sys_close (fqd); 

50 return ret; 


























/* 用 path 指向 的 程序 替换 当前 进程 */ 
int32 七 sys execv(const char* path, const char* argv[]) 
uint32 t argc = 0; 
while (argv[argc]l) { 
argc++; 








} 

int32 t entry point 

if (entry poin 
区 


load (path); 
== -1) { // 若 加 载 失 败 ， 则 返 








加 








Gy Gy STATIC 
Ma ND Om DL 


} 














{ 


{ 



























































































































































63 

64 struct task struct* cur = running thread(); 

65 /* 修改 进程 名 */ 

66 memcpy (cur->name, path, TASK NAME LEN); 

67 cur->name [TASK NAME LEN-1] = 0; 

68 

69 struct intr stack* intr 0 stack = (struct intr stack*)\ 
Cuint32 tyeur +. PG SIZE 一 Sie0f (Struet intr staok} ks 

0 /* 参数 传递 给 进程 */ 

本 intr 0 stack->ebx = (int32 t)argyv; 

72 intr 0_ stack->ecx = argc; 

了 党 intr 0 stack->eip = (void*)entry point; 

74 /* 使 新 用 户 进程 的 栈 地 址 为 最 高 用 户 空 间 地 址 */ 

75 intr 0_ stack->esp = (void*)0Oxc0000000; 

76 

77 /* exec 不 同 于 fork， 为 使 新 进程 更 快 被 执行 ， 直 接 从 中 断 返 回 */ 

78 asm volatile ("movl $0, %S%esp; jmp intr exit" : :\ 

"g" (intr 0 stack) : "memory") 7 

79 KEWuENn 07 

80 1} 

函数 load 接受 1 个 参数 ， 可 执行 文件 的 绝对 路 径 pathname， 功 能 是 从 文件 系统 上 加 载 用 户 程序 
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Ee 





旦 序 的 起 始 地 址 ， 否 则 返 


I 











pathname， 成 功 则 返 一 1 。 























函数 开头 先 定义 了 elf 头 elf_header 和 程序 头 prog_header， 主 要 用 在 
头 到 elf header。 
第 108 行 开 始 校 验 ef 头 ， 判 断 加 载 的 文件 是 否 是 elf 格式 的 。 








ef 头 的 e ident 字段 是 eff 格式 的 魔 数 ， 它 是 个 16 
测 e ident[0 一 6] 这 七 个 成 员 。 开 头 的 4 个 字 节 是 固 











定 不 变 的 ， 它 们 分 别 是 0x7f 和 


第 102 行 ， 


字 节 的 数组 ，e ident[7 一 15] 暂时 未 用 ， 


xz Ar 时 


字符 


读 取 可 执行 文件 的 elf 





























羽 此 咱们 只 需要 检 
“ELF” 的 asc 码 0x45、 




















0x4c 和 0x46。 成 员 e ident[4] 表 示 elf 是 32 位 ， 还 是 64 位 ， 值 为 1 表示 32 位 ， 值 为 2 表示 64 位 。e_ident[5] 表 
示 字 节 序 ， 值 为 1 表示 小 端 字 节 序 ， 值 为 2 表示 大 端 字 节 序 。e_ident[6] 表示 elf 版 本 信息 ， 默 认为 1。 以 上 














e ident[4-6] 值 为 0 均 表 示 非 法 、 不 可 识别 ， 咱 们 是 在 8086 平台 上 开发 ， 
因此 这 三 位 值 均 取 1， 故 e ident[0-6] 应 该 分 别 等 于 -+ 
第 108 行 通过 memcmp 函数 比 对 elf 头 ! 


是 e ident[0] 的 固定 值 。 如 果 您 C 语言 开发 经 验 较 少 ， 或 许 您 在 想 
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释 下 。 大 伙 儿 知道 ， 有 些 不 可 见 字符 (多 是 控制 字符 〉 是 没 法 直接 通过 “键入 





它 是 小 端 字 节 序 ， 并 
于 十 六 进 制 0x7F、0x45、0x4C、0x46、0xl1、0xl 和 0x1。 

的 e ident 魔 数 ， 其 中 “\177” 是 八进制 ， 十 六 进 制 为 0x7f， 
“177” 是 什么 意思 ， 这 里 多 说 两 句 解 


ez A 


字符 





目 是 32 位 系统 ， 
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须 通 过 其 ASCII 码 。 在 


















































来 表示 ， 注意 ， 字 
进 制 ， 故 若 用 “\x7f” 表 示 0x7f 
用 3 位 八进制 “\177” 来 表示 。 


e_type 表示 目标 文件 类 型 ， 其 值 应 该 为 ET_ EXEC， 即 等 于 2。e_machine 表示 体系 结构 ， 其 值 应 该 为 





























] ASCII 码 表示 字符 可 以 采用 “加 3 位 八进制 ”或 “x 加 2 位 十 六 进 制 ” 
jelf 魔 数 ， 由 于 字符 串 “ELF” 和 0x7f 前 后 挨 着 ， 并 且 EE 属于 十 六 
译 器 会 把 它 识别 成 “\x7 人 三 ”LF， 也 就 是 0x7fe， 这 样 就 错 了 ， 故 采 

























































































EM _386， 即 等 于 3。e_version 表示 版 本 信息 ， 其 值 应 该 为 1。e_phnum 用 来 指明 程序 头 表 中 条 目的 数量 ， 也 就 












































是 段 的 个 数 ， 基 值 应 该 小 了 












































因此 ， 第 108 一 113 行 如 果 不 满足 人 
到 标号 done 处 ， 也 就 是 第 149 行 ， 执 行 “sys 
程序 头 的 起 始 地 址 记录 在 e phoff 中 ， 将 其 获取 到 变量 prog_header_offset。 程 序 头 条 目 大 小 记录 在 




















e_phentsize ! 




































































等 于 1024。e_phentsize 用 来 指明 程序 头 表 中 每 个 条 目的 字 节 大 小 ， 也 就 是 每 个 用 来 








苗 述 段 信息 的 数据 结构 的 字 节 大 小 ， 该 结构 就 是 struct El1f32 Phdr， 因 此 值 应 该 为 sizeof (struct Elf32 Phdn)。 
E 意 条 件 ， 则 认为 该 文件 不 是 elf 文件 ， 于 是 就 将 返回 值 ret 置 为 -1， 跳 









































close(fd)” 关 闭 打开 的 新 可 执行 文件 ， 然 后 返回 ret 的 值 。 












































, 将 其 获取 到 变量 prog_header_size 中 。 下 面 第 122 一 146 行 , 在 程序 头 表 中 遍历 所 有 程序 头 。 












































程序 头 即 段 头 ， 段 的 数量 在 e phnum 中 记录 ， 第 123 行 while 循环 处 理 e phnum 个 段 信息 。 第 127 


行 通过 sys_lseek 将 文 伯 
的 类 型 ， 如 果 该 段 是 PT_LOAD, 





























系统 中 加 载 到 











执行 文件 并 返 





最 后 一 个 








础 性 的 代码 放 在 前 面 介绍 ，i 
分 同学 基础 较 # 
喜欢 自 上 而 下 先 从 

























































































的 指针 定位 到 程序 头 ， 第 130 行 读 取 段 信息 到 prog_header 中 。 第 136 行 判断 段 
载 的 段 ， 那 么 就 调用 函数 segment load 为 该 段 分 配 内 存 ， 从 文件 
里 完 所 有 上段 后 ， 将 程序 的 入 口 ， 即 e_entry 作为 返 下 
回 ， 至 此 load 函数 结束 。 
函数 是 sys_execv， 它 接受 2 个 参数 ，path 是 可 执行 文件 的 绝对 路 径 ， 数 组 argv 是 传 给 可 执 
行文 件 的 参数 ， 函 数 功 能 是 用 path 指向 的 程序 蔡 换 当前 进程 。 函 数 失败 则 返回 -1， 如 果 成 功 则 没 机 
会 返回 ， 因 此 第 176 行 的 “return 0” 只 是 为 满足 编译 器 gcc 的 c 语法 ， 即 “make gcc happy”。 
大 伙 儿 已 经 了 解 到 了 ， 基 本 上 最 后 要 介绍 的 函数 都 是 前 面 所 有 函数 的 封装 ， 我 个 人 习惯 先 把 所 依赖 的 、 基 
上 ”地 学 习 方 式 深 受 “ 好 钻研 ， 喜 欢 抠 细 节 ” 的 同学 欢迎 。 还 有 一 部 


























es 


直 赋 值 给 ret， 随 后 关闭 可 























































































































































































































第 159 行 调 


看 也 能 猜 得 差不多 ， 因 此 喜欢 从 上 到 下 ， 只 需要 从 全 局 上 掌握 思路 即 可 。 如 果 您 
是， 可 以 从 后 往 前 看 ， 哈 哈 ， 不 用 我 说 ， 我 想 您 已 经 这 样 做 了 ， 咳 咳 ， 看 代码 。 
第 156 一 158 行 通过 while 循环 ， 统 计 出 参数 个 数 ， 存 放 到 变量 argc 中 。 

] load 加 载 文 件 path， 成 功 后 ， 需 要 修改 内 核 栈 中 的 参数 。 先 在 第 164 一 167 行将 pcb 中 







































































的 name 更 新 为 进 


























name 数组 长 度 ， 
定义 了 。 然 后 在 第 
intr_exit 返回 ， 









































早 名 ， 这 样 执 行 ps 时 便 会 看 到 正在 执行 的 命令 ， 其 中 TASK_ NAME_LEN 就 是 pcb 中 的 
值 为 16， 一 直 纠 结 于 之 前 的 硬 编码 不 太 好 ， 所 以 本 次 通过 宏 的 方式 重新 在 thread.h 中 
内 核 栈 的 地 址 ， 此 内 核 栈 中 的 数据 还 属于 老 进程 ， 我 们 一 会 要 利用 该 栈 从 
比 接 下 来 在 第 171 一 175 行 修改 栈 中 的 数据 为 新 进程 。 首 先 将 参数 数组 argv 的 地 址 赋值 






























































给 栈 中 ebx 寄存 器 ， 参 数 个 数 argc 赋值 给 栈 中 ecx 寄存 器 ， 新 进程 从 intr_exit 返回 后 才 是 第 一 次 运行 ， 




















此 运行 之 初 通 





值 都 是 无 效 的 ， 只 有 运行 之 后 寄存 器 中 的 值 才 是 有 意义 的 ， 故 argc 和 argv 其 





实 放 在 哪 两 个 通 / 
argv 本 来 就 是 所 有 参数 的 基地 址 ，ecx 经 常 做 循环 控制 次 数 寄存 器 ，argc 本 来 就 是 argv 的 参数 个 数 ， 也 就 
于 习惯 用 法 ， 并 不 是 强制 ， 现 在 把 参数 放 在 哪个 寄存 器 中 ， 将 来 在 获取 参数 时 就 从 哪 
己 协调 好 就 行 , 将 来 咱们 会 实现 简易 版 运行 库 , 那 会 涉及 到 从 寄存 器 中 获取 参数 ， 


是 循环 次 数 ， 因 
些 寄存 器 中 取 , 只 要 








寄存 器 中 都 可 以 ， 这 里 分 别 将 它们 放 在 ebx 和 ecx 的 原因 是 : ebx 经 常 做 基 址 寄存 器 ， 








































































































到 时 您 就 会 清楚 ] 










































































。 接 着 说 代码 ， 第 173 行将 可 执行 文件 的 入 口 地 址 赋值 给 栈 中 eip 寄存 器 。 然 后 将 内 核 






































栈 中 的 用 户 栈 指针 esp 恢复 为 0xc0000000, 这 样 做 的 原因 有 两 个 ,一 是 老 进程 用 户 栈 中 的 数据 只 适用 于 老 











进程 ， 对 新 进程 没 用 



























































过 了 ， 用 户 空 间 的 最 高 处 用 于 
接着 在 第 178 行 ; 
从 中 断 返 回 ， 实 现 了 
exec 使 程序 一 去 不 回头 地 执行 了 ， 因 














没 机 会 执行 。 
722 






































j 户 栈 应 该 从 新 开始 。 二 是 为 了 后 续 传 入 参数 做 准备 ， 在 很 久 以 前 就 说 
令 行 参数 ， 以 后 实现 传 参 时 您 就 清楚 了 。 
[ 编 ， 将 新 进程 内 核 栈 地 址 赋值 给 esp 寄存 器 ， 然 后 跳 转 到 intr_exit， 假 装 






























































此 第 179 行 的 return 0 只 是 为 了 满足 编译 器 语法 要 求 ， 其 实 根本 























代码 





好 啦 ，sys_execv 就 介绍 完了 ， 接 下 来 您 懂 的 ， 添 加 系统 调用 


了 。 
本 节 到 此 结束 ， 感 谢 大 伙 儿 的 陪伴 








人 


o 





15.5.2 ”让 shell 支持 外 部 命令 





大 伙 儿 一 定 听 说 过 ，Linux 中 执行 命令 ， 是 bash (或 





去 执行 命令 ， 其 实 更 严格 地 说 ， 是 执行 外 部 命令 时 bash 才 
































命令 对 应 的 程序 ， 然 后 执行 该 程序 ， 从 而 实现 了 外 部 命令 
于 有 了 系统 调用 exec, 我 们 的 shell 也 能 调用 外 部 命令 了 ， 下 夯 




































































execv， 步 又 您 太 熟悉 了 ， 绅 





就 不 单独 贴 


























他 shell) 先 fork 一 个 子 进程 ， 然 后 调用 exec 





























代码 15-22 (project/c15/g/shell/shell.c ) 





























































































































… 略 

55 else { // 如 果 是 外 部 命令 ， 需 要 从 磁盘 上 加 载 

56 int32 t pid = fork(); 

57 if (pid) { // 父 进程 

58 /* 下 面 这 个 while 必须 要 加 上 ， 否 则 父 进 程 一 般 情况 下 会 比 子 进程 先 执 行 ， 
59 因此 会 进行 下 一 轮 循环 将 find1l_path 清空 ， 

这 样子 进程 将 无 法 从 final _ path 中 获得 参数 */ 

60 while(1); 

61 } else { // 子 进 程 

62 make clear abs path(argv[0], final path); 
63 argv[0] = final path; 

64 /* 先 判 断 下 文件 是 否 存在 */ 

65 struct stat file stat; 

66 memset (&file stat, 0, sizeof (struct stat)); 
67 if (stat(argv[0], &file stat) == -1) { 
68 printf("my_ shell: cannot access %s: 

No such file or directory\n", argv[0]); 

69 } else { 

70 execv (argv[0], argv); 

71 } 

2 while(1); 

73 } 

74 } 

2 int32 t arg idx = 0; 

76 while(arg idx < MAX ARG NR) { 

17% argv[larg idx] = NULL; 

78 arg_idxt++; 

9 } 

80 } 

81 panic("my_ shell: should not be here"); 

8.2> 





死 特 
么 官 
些 全 




































































会 fork 出 子 进程 并 调用 exec 从 磁盘 上 加 载 外 部 
的 执行 ， 如 今 我 们 也 效仿 这 种 方式 。 
我 们 改进 shell.c， 见 代码 15-22。 


从 第 155 行 起 便 是 对 外 部 命令 的 处 理 ， 当 前 的 进程 shell 先 fork 出 子 进 程 ， 接 着 在 父 进程 中 通过 while(1) 
环 使 父 进程 悬 停 ， 即 什么 都 不 做 。 为 什么 这 样 安排 呢 ? 这 是 由 咱们 程序 本 身 的 逻辑 决定 的 ， 并 不 是 什 
方 做 法 。 我 们 在 外 层 循 环 的 开头 〈 可 见 之 前 的 代码 ， 这 部 分 不 属于 本 次 新 内 容 ， 故 未 贴 出 ) 会 清空 

局 数组 , 如 final path。 父 进程 一 般 情况 下 会 比 子 进程 先 执行 , 因此 会 更 快 进入 下 一 轮 循环 将 findl path 






























































二 估 
主人 下 








， 这 样子 进程 将 无 法 从 final_path 中 获得 参数 。 






























































































































































execv 去 执行 该 可 执行 文件 。 
参数 数组 argv 是 由 readline 函数 维护 的 ， 它 会 履 盖 argv， 并 且 参 数 个 数 是 
越界 的 情况 。 但 为 了 防止 出 现 意外 的 问题 ， 在 第 175 一 179 行 还 是 清空 参数 数组 argv， 这 样 更 放心 一 





出 现 
b 


ke， 


件 ， 
































调试 结束 后 可 以 清除 掉 。 



























































忆 此 本 节 是 欢快 的 一 节 ， 就 这 么 爽快 地 结束 啦 。 






























































argc 来 保 订 



































在 子 进程 中 ， 先 调用 make_clear abs_path 获取 可 执行 文件 argv[0] 的 绝对 路 径 到 final_path 中 ， 然 后 将 
argv[0] 重 新 指向 final path。 接 着 调用 系统 调用 stat 判断 可 执行 文 从 








是 否 存在 ， 如 果 存 在 ， 则 执行 系统 调用 


的， 也 不 会 


























好 啦 ， 硬 盘 上 也 没有 用 户 程序 昵 ， 咱 们 还 真 没 办 法 测试 ， 下 节 咱 们 再 想 办 法 在 硬盘 上 写 入 用 户 程序 文 
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15.5.3 ”加 载 硬盘 上 的 用 户 程序 执行 


虽然 我 很 想 一 次 就 把 用 户 程 序 演示 完 , 但 担心 跨度 有 点 大 。 那 咱们 还 是 按部就班 吧 ， 本 节 先 安装 个 不 
接受 参数 的 用 户 程序 ， 也 就 是 用 户 程 序 中 无 argc 和 argv， 没 关系 ， 现 在 最 重要 的 是 让 用 户 程 序 先 跑 起 来 。 

本 节 要 完成 三 件 事 。 

(1) 编写 第 一 个 真正 的 用 户 程序 。 

(2) 将 用 户 程 序 写 入 文件 系统 。 

(3) 在 shell 中 执行 用 户 程 序 ， 即 外 部 命令 。 

下 面 先 看 用 户 程序 的 代码 吧 ， 本 节 新 建 command 目录 ,在 其 中 建立 了 文件 prog_no_ arg.c， 如 代码 15-23 
所 示 。 

















































































































TT 



















































































代码 15-23 (project/c15/g/command/prog_no_arg.c) 


1 #include "stdio.h" 
2 int main(void) { 


3 brintf' ("Hrod no areg Fron disk\Vi")s 
4 while(1); 

» return 0; 

6 } 





代码 还 是 非常 简单 的 ， 基 本 上 就 输出 “prog no_arg from disk”。 目前 尚未 实现 系统 调用 exit， 因 此 第 
4 行 的 死 循环 “while()” 是 必须 的 ， 没 它 的 话 ， 程 序 就 不 知道 运行 到 哪里 去 了 ， 在 此 借助 这 个 死 循 环 将 程 
序 “ 卡 住 ”。 
下 面 看 编译 ， 具 体 见 代码 15-24。 
代码 15-24 (project/c15/g/command/compile.sh ) 




















NOS 
































fl 


BIN="prog_no_arg™ 

CFLAGS="-Wall -c -fno-builtin -W -Wstrict-prototypes \ 
-Wmissing-prototypes -Wsystem-headers" 

LIB="../1ib/" 

OBJS="../build/string.o ../build/syscall.o \ 

9 ../build/stdio.o ../build/assert.o" 

20 DD_IN=$BIN 

21 DD OUT="/home/work/my workspace/bochs/hd60M.img" 


1 坦 ### ”此 脚本 应 该 在 command 目录 下 执行 

2 

EB | -build® Mj?then 
4 echo "dependent dir don\‘t exist!" 

5 cwd=$ (pwd) 

6 cwd=$ {cwd##*/} 

7 cwd=$ {cwd%®/} 

8 if [[ $cwd != "command" ]];then 

9 echo -e "youN qd better in command dir\n" 
0 人 

下 exit 

2 

3 

4 

5 

6 

7 

8 





23 gcc $CFLAGS -I S$LIB -oO $BIN".o" $BIN".c" 
24 ld -e main $BIN".o™" $0OBJS -o $BIN 
25 SEC_CNT=$ (ls -1 $BIN|awk '{printf("%d", ($5+511)/512)}') 


2:6 

27 if [[ -f SBIN ]];then 

28 dd if=./$DD_IN of=$DD OUT bs=512 \ 
29 Count=$SEC CNT seek=300 conv=notrunc 
3.0. 7 

3 








32 # 间 非 间 # 提 提 提 提 非 以 上 核心 就 是 下 面 这 三 条 命令  ##### 非 间 ### 提 ## 

33 #gcc -Wall -c -fno-builtin -WwW -Wstrict-prototypes -Wmissing-prototypes \ 
34 # -Wsystem-headers -I ../lib -o prog no arg.o prog no arg.c 

35 #1ld -~e main prog no arg.o ../build/string.o ../build/syscall.o\ 

36 3# ../build/stdio.o ../build/assert.o -o prog no arg 

37 #dd if=prog no arg of=/home/work/my workspace/bochs/hd60M.img \ 

38 # bs=512 count=10 seek=300 conv=notrunc 
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这 是 个 shell 脚本 , 看 上 去 似乎 挺 复杂 ,3 
脚本 写 得 并 不 严谨 ,大伙 儿 不 用 耐 着 心思 缉 


链接 、 写 入 硬盘 hd60M.img。 


没 喻 合 量 , 而且 
这 个 脚本 的 功能 是 自动 完成 编译 、 

















目 . 生气 


其 实 核心 就 是 第 33 一 38 行 的 三 条 命令 ， 








前 面 全 是 配置 和 判 















































只 要 是 包括 prog no arg.c 的 同 级 
在 程序 prog no _arg.c 1 



































录 就 行 )， 在 脚本 前 
用 到 了 函数 printf， 咱 们 已 经 





看 脚本 了 ， 























直接 看 
脚本 最 好 在 command 目录 下 执行 〈 
1 部 有 判断 ， 执 行 方 式 是 “ 
加 了 头 文件 “stdio.h”， 





最 后 注释 的 那 三 条 命令 即 

















其 实 
sh compile.sh ”。 


因此 在 gcc 编译 时 添加 了 














“-I .lib” 为 其 指定 头 文件 目录 。 由 于 用 到 了 stdio.h, 故 在 链接 的 时 候 除 了 要 加 上 stdio.o 外 , 还 要 加 上 stdio.h 


(也 是 stdio.o) 所 依赖 的 目 











下 的 ， 因 此 一 定 要 先 编译 内 核 ， 但 这 并 














标 文件 ， 它 们 包括 string.o、 





























十 
= 





了 这 些 目标 文件 ， 其 








不 是 说 























关 单 独 再 写 


























标 文件 就 








内 存 中 它们 是 独立 的 两 份 揽 贝 ， 互 不 
条 条 大 路 都 通 往 北 京 ， 不 同 的 库 文人 
断 门 连接 到 唯一 的 内 核 ， 殊 途 


系统 调用 的 封装 而 已 ， 
送 0x80 号 中 断 ， 利 用 
本 着 “调用 在 前 ， 定 义 在 后 ”， 
































F 涉 。 总 之 ， 








syscall.o 和 asserto。 这 些 











标 文 件 都 是 build 目录 


























j 户 程序 的 库 文件 依赖 
份 库 文件 也 是 可 以 的 ， 不 过 完全 没 2 
是 执行 了 内 核 的 代码 ,这 仅仅 表示 用 户 进程 中 执行 的 代码 和 内 核 目 标 文件 中 





内 核 的 





标 文件 ， 
要 ， 并 不 是 用 
的 代码 是 一 致 的 , 在 






































无 论 是 用 谁 的 目标 文件 都 不 重要 
F 最 终 的 出 路 都 是 相同 的 ， 





























标 ( 库 ) 文件 只 是 
都 是 通过 系统 调用 发 








里 女 ， 
































同 归 。 提 醒 一 





否则 执行 ld 时 可 能 会 提示 符号 找 不 到 。 





也 许 有 同学 会 有 
以 被 随意 使 
录 下 这 并 不 重要 ， 日 






























































录 只 是 咱们 为 方便 


]? 比如 string.h 经 常 被 内 核 使 ) 











下 , 一 定 要 注意 目标 文件 的 链接 顺序 ， 








些 疑 惑 :“ 哎 ? 不 是 lib/user 目录 下 的 文件 才 属 于 











] 户 进 








= 


星 吗 ? lib 目录 中 的 文件 也 可 



































j， 难 


道 





j 户 进程 





























自己 开发 1 








的 交 汪 。 并 不 是 说 某 些 文件 中 的 代码 只 是 





























么 划分 
1 处 理 
王 何 代码 在 处 理 器 
CPL， 因 此 在 用 户 进 程 中 即 
令 ， 除 非 遇 
普通 指令 ， 处 理 器 一 律 


},， 但 本 质 上 ， 内 核 和 













































































执行 。 





j 户 进程 
器 决定 的 , 也 就 是 代码 段 寄存 器 CS ， 
眼中 都 是 一 样 








j 规 


























的 ， 差 另 
使 包含 了 内 核 文件 
到 某 些 只 能 在 特权 级 0 下 执行 上 
换 句 话 














全 














有 
处 理 器 只 知道 0、1、2、3 这 四 






































说 实在 的 ， 它 也 没 办 法 直接 知道 ， 甚 至 ; 
个 特权 级 。 














只 是 特权 级 














让 














岂可 以 使 ) 











j 内 核 代 码 ?”” 其 实 代码 在 哪个 目 





划 出 来 的 逻辑 结构 。 


























任何 目录 中 的 代码 本 质 都 是 普通 


人 | 


























1 内 核 使 用 ， 





其 他 代码 





























上 的 差别 ， 并 不 是 由 
选择 子 的 低 两 位 
就 体现 在 执行 
也 是 没关系 的 ， 无 3 
的 指令 时 才 会 报错 ， 














j 户 进程 使 用 








， 当 然 这 在 逻辑 上 可 以 这 























如 
































内 核 级 ， 但 谁 说 一 定 得 这 样 
级 2 可 以 做 用 户 级 
同学 会 说 ， 可 以 通过 


令 。 



































了 ， 处 到 
， 剩 下 的 两 个 特权 级 0 和 3 就 
旨 令 的 地 址 来 判断 ， 如 果 指 
没 错 ， 编 译 器 会 根据 咱们 的 需求 把 内 核 代码 的 








器 提供 








了 四 











说 ， 处 理 器 根本 不 知道 当前 
村内 核 级 和 用 户 级 都 不 和 
人 们 习惯 让 内 核 在 0 特权 级 
个 特权 级 呢 ， 


出 ] 





因 上 出 


代码 在 项 目 ! 





这 些 代码 时 处 理 器 所 处 
E 就 是 特权 3 级 下 去 执 
pushf、sti 等 ， 对 于 那么 特权 级 不 敏感 的 
执行 的 指 
I 道 是 人 









































的 ， 并 不 是 处 理 器 硬件 一 
如 0x80000000 以 上 的 空 
为 判断 内 核 指令 或 用 户 指 
只 要 库 文 件 中 不 包含 特权 级 敏感 # 
下 面 看 如 何 把 程序 写 入 文件 












































这 里 说 的 是 把 程序 写 入 “文件 系统 ” 不 是 写 入 “硬盘 ”， 这 还 是 有 











级 的 要 求 。 吸 
间 是 内 核 。 总 之 地 址 空间 
令 的 依据 。 处 至 

















们 高 兴 《的 话 ， 














总 
征 代 


令 














哪个 目录 决定 的 ， 而 是 
即 处 理 器 的 当前 特权 级 。 
的 身份 一 一 当前 特权 级 
行 同 内 核 一 样 的 指 



























































令 属于 内 核 ， 还 是 用 





户 进 程 ， 而 











| 么 ， 因 为 这 是 人 来 界定 的 概念 嘛 ， 
下 运行 ， 因 此 可 以 把 0 特权 级 称 为 
特权 级 1 也 可 以 做 所 谓 的 内 核 级 ， 特 权 














冰 不 用 























划 


器 在 任何 特权 级 下 都 








统 昌 说 最 终 都 是 往 硬盘 











上 写 入 数据 ， 但 

















直接 “生硬 地 ” 往 某 个 局 
文件 系统 元 信息 的 























同步 维护 ， 否 

















方式 是 不 一 样 的 。 
又 填 数据 ， 而 写 入 文件 系统 则 是 把 数据 
则 就 会 破坏 文件 系统 。 








hd80M.img 上 创建 了 文件 系统 ， 





大 





此 程序 必须 写 入 到 


过 文件 系统 函数 才 行 ， 不 能 绕 过 它们 强行 写 入 。 





这 是 
这 是 由 脚本 中 最 后 一 个 命令 dd 
hd60M.img。hd60M.img 是 裸 盘 ， 















































完成 的 ， 
无 文件 








两 步 来 完成 的 ， 为 了 不 破坏 hd80M.img 上 











也 行 的 ， 只 是 大 多 数 人 不 这 么 做 而 已 。 
bh 址 在 0xc0000000 以 上 ， 这 就 说 明 是 内 核 的 数据 或 # 
也 址 编译 为 0xc0000000 以 上 ， 但 


完全 可 以 把 32 位 的 4GB 空 
分 是 为 人 设计 的 管理 策略 ， 和 处 理 器 无 关 ， 








也 许 有 











王 






































这 只 是 咱们 人 为 安排 
¥ 间 平分 给 内 核 和 用 户 空间 ， 
并 不 能 作 









































9] 




















以 执行 特权 级 不 敏感 的 指令 ， 
旨 令 ， 用 户 进程 可 以 包括 内 核 的 库 文件 ， 内 核 也 可 以 包含 用 户 进程 的 库 文件 。 
系统 ， 也 就 是 写 入 hd80M.img 中 。 





丸 此 原则 上 
































点 区 别 的 。 写 入 硬盘 和 写 入 文件 系 




















shell 3 





写 入 硬盘 完全 


可 以 直接 用 dd 命令 或 者 硬盘 驱动 








按照 文件 
通过 文件 系统 来 获取 外 部 命令 














系统 的 入 人 硬盘， 这 涉及 到 


， 我 们 只 在 


规则 写 














hd80M img 中 ， 并且 把 程序 写 入 硬盘 的 操作 必须 要 通 





的 文件 系统 ， 




















系统 ， 


它 负责 


因此 




















第 1 步 先 将 文件 写 入 到 hd60M.img 中 ， 
把 编译 出 来 的 二 进 和 








| 文件 prog_no_arg 写 入 到 硬盘 




















可 以 随便 写 入 而 


不 存在 破坏 文件 系统 的 问题 。 本 例 中 
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第 15 章 系统 交互 


把 它 写 到 了 hd60M.img 中 偏 移 300 个 扇 区 的 位 置 ， 即 “seek=300”， 写 入 了 10 个 扇 区 大 小 的 数据 



































， 即 


“count=10”。 偏 移 300 扇 区 的 原因 是 咱们 的 内 核 文件 也 是 在 hd60M.img 中 ， 目 前 其 大 小 约 为 73KB 左右 ， 


















































大 概 占 142 个 扇 区 。 程 序 文 件 prog no arg 也 是 写 在 hd60M.img 中 ， 因 此 偏 移 300 扇 区 足够 跨 过 内 核 程序 ， 





避免 破坏 内 核 。 为 什么 写 入 10 个 户 区 的 数据 呢 ? 原因 是 程序 prog_no arg 大 小 为 4777 字 节 【脚本 中 会 自 
断 文 件 大 小 )， 它 是 通过 ls-! 命令 获得 的 ，ls 命令 的 输出 信息 中 包括 文件 的 大 小 ， 这 里 就 不 单独 贴图 了 ， 
儿 只 要 知道 prog no arg 大 小 为 4777 字 节 就 行 了 。4777 字 节 至 少 占用 了 10 个 扇 区 。 脚 本 compile.sh 写 
不 严谨 ， 仅 是 为 了 编译 时 方便 ， 不 细 说 了 ， 您 只 要 了 解 核心 三 条 命令 的 意义 即 可 。 有 兴趣 查看 脚本 执行 
的 同学 ， 您 可 以 在 command 目录 下 执行 “sh -x compile.sh”，shell 会 以 调试 方式 执行 并 输出 信息 。 
第 2 步 是 将 hd60M.img 上 的 程序 读 出 来 ， 再 通过 文件 系统 函数 写 入 hd80M.img 中 。 这 得 写 代 
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动 判 
大 伙 
得 也 
细节 








码 来 






































完成 ， 有 具体 是 在 main.c 中 加 入 了 读 取 prog no_arg 的 代码 ， 见 代码 15-25。 
代码 15-25  ( project/c15/g/kernel/main.c ) 












































21 int main(void) { 

2 put_ str("I am kernel\n"); 

Z init .all(); 

24 

25 / 术 太 太太 大 大 大 大 类 大 大 大 大 与 入 应 程序 大 大 大 大 大 大 大 大 大 大 大 大 大 / 

26 uint32 t file size = 4777; 

2 uint32 t sec cnt = DIV_ROUND UP (file size， 512); 
28 struct disk* sda = &channels[0] .devices[0]; 

29 void* prog buf = sys malloc (file size); 

30 ide readl(sda, 300, prog buf, sec cnt); 

31 int32 t fd = sys open("/prog no arg", O_CREAT|O RDWR); 
32 if (fd != -1) { 

33 if(sys writel(fd, prog buf, file size) == -1) { 
34 printk("file write error!\n"); 

35 while(1); 

36 } 

3 

38 / 术 太 太太 大 大 大 大 类 大 大 大 大 与 入 应 程序 结束 大 大 大 大 大 大 大 大 大 大 大 大 大 / 

39 cls. screen (); 

40 console put str("[rabbit@localhost /]$ "); 

41 while (1); 

42 return 0; 

43 1} 


ns] 


第 26 一 37 行 的 代码 是 本 次 写 入 文件 的 代码 ， 


















































prog_ no_arg 占用 的 扇 区 数 。 第 28 行 指定 操作 的 设备 是 sda， 即 第 0 个 ide 通道 上 的 第 0 块 硬盘 。 
第 29 一 31 行 ， 以 sba 上 第 300 个 扇 区 为 起 始 ， 读 取 sec_cnt 个 户 区 到 缓冲 区 prog_buf。 




















































































































下 面 就 差 第 三 件 事 没 做 了 ， 在 shell 中 执行 prog_no_arg 测试 ， 结 果 如 图 15-12 所 示 。 


[RT 














[rabb host /1$ . 
brog_no_arg from disk 





IPS: 21.999H Num [cars lcre hn:o-hlhn:o-s| 1 外 -| 
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在 文件 写 入 之 后 就 没 用 了 ， 下 次 再 运行 时 记得 注释 掉 。 
第 26 行 的 file size 是 prog_no_arg 的 字 节 大 小 ， 其 值 正 如 前 所 说 是 4777 字 节 。 下 一 行 的 sec_cnt 是 


第 31 一 33 行 在 根 目录 下 创建 文件 prog_ no_arg， 并 将 缓冲 区 中 的 数据 ， 也 就 是 程序 文件 写 入 prog no arg。 

















图 中 先 执行 了 “1s -1” 命 令 ， 列 出 了 根 目录 下 的 所 有 文件 。 其 中 包括 prog no arg， 已 经 写 入 成 功 。 下 



































面 执行 “./prog_no_arg” 执 行 该 程序 ， 输 出 了 “prog_no_arg from disk”。 目 测 符合 预期 ， 这 说 明 我 们 第 一 
个 真正 的 用 户 进程 成 功 了 ， 我 去 喝 瓶 酸奶 庆祝 下 。 


















































本 节 就 到 这 了 ， 下 节 咀 们 想 办 法 让 
15.5.4 使 用 户 进程 支持 参数 
































j 户 进程 接受 参数 ， 兄 弟 们 下 节 见 。 




















我 们 为 内 部 命令 传递 参数 还 是 很 简单 的 ， 在 调用 内 部 命令 时 直接 代入 参数 就 行 了 ， 但 对 于 外 部 命令 ， 


参数 传递 就 没 那么 简单 了 。 















































大 伙 儿 知道 ， 根 据 C 调用 约定 ， 参 数 是 通过 栈 来 传递 的 ， 在 同一 个 进程 中 ， 由 于 栈 已 经 存在 了 ， 参 
数 可 以 直接 压 在 栈 中 ， 被 调 函数 便 可 以 从 栈 中 获取 参数 了 ， 这 使 得 咱们 处 理 内 部 命令 时 很 容易 。 获 取 参 数 
是 在 执行 命令 之 前 ， 要 想 把 获取 到 的 参数 传递 给 某 个 命令 ， 该 命令 所 属 的 进程 必须 先 有 栈 。 但 外 部 命令 的 
执行 ， 实 质 上 是 加 载 一 个 用 户 程序 的 过 程 ，shell 执行 外 部 命令 前 ， 外 部 命令 〈 用 户 进程 ) 尚未 创建 ， 它 的 






































栈 当然 也 不 存在 了 ， 参 数 就 没 法 传递 了 




























































































吗 ? 这 该 怎么 办 呢 ? 






































您 看 ， 我 们 在 编写 用 户 程序 时 都 要 有 个 main 函数 ， 它 是 主 函数 ， 可 能 在 初次 接触 编程 时 便 被 教导 : 
main 函数 是 第 1 个 函数 。 其 实 并 不 是 这 样 ，main 函数 的 声明 一 般 是 “void main(argc, argv)”、“int main(argc， 
argv)”“vVoid main0” 等 ， 通 过 这 几 种 声明 ， 我 们 至 少 可 以 看 出 两 件 事 。 

(1) 无 论 返 回 值 和 形 参 如 何 变动 ， 不 变 的 是 函数 名 main， 在 标准 情况 下 它 永 远 为 main (当然 它 也 可 












































以 变 ， 一 会 您 就 知道 了 )。 










































































(2) main 函数 有 形 参 ， 参 数 是 被 调用 时 才 传递 的 ， 这 说 明 main 函数 也 是 被 别人 调用 后 才 运行 的 ， 因 此 
main 函数 其 实 并 不 是 真正 的 第 1 个 函数 。main 函数 数 声明 中 有 返回 值 类 型 ， 这 充分 说 明 main 是 被 调用 才 
































执行 的 。 


想 想 看 ， 既 然 main 是 被 调用 执行 的 ， 并 且 有 返回 值 ， 那 么 它 执行 完成 后 ， 程 序 会 返回 到 哪里 ? 或 者 








说 ， 为 什么 main 函数 要 返回 ? 



































































































































原来 ， 为 了 让 用 户 可 以 更 方便 地 编程 ， 前 非 们 开发 了 大 量 的 标准 化 框架 ， 也 就 是 各 种 库 ， 其 中 很 著名 




















的 就 是 C 标准 库 和 C 运行 库 。 
为 什么 要 有 标准 库 ? 这 个 是 历史 发 





| 






















































































展 必然 的 结果 。 任何 程序 员 为 了 方便 自己 开发 程序 ， 都 会 把 一 些 常 























用 的 功能 写成 通用 的 函数 ， 以 后 随时 调用 ， 使 开发 效率 提升 。 随 着 平时 积累 的 通用 函数 越 来 越 多 ， 渐 渐 形 
成 规模 ， 也 就 是 形成 了 早期 的 函数 库 ， 属 于 此 库 中 的 函数 就 称 为 库 函 数 。 当 然 这 个 库 中 通用 的 函数 有 可 能 是 


















































多 个 人 联合 开发 的 , 比如 项 目 组 中 每 个 人 负责 开发 一 块 , 这 样 每 个 人 都 积累 出 一 些 通用 函数 , 大 伙 儿 一 合计 ， 


把 每 个 人 的 通用 代码 集成 到 一 起 咱们 一 块 用 吧 ， 这 也 是 函数 库 。 与 此 同时 ， 所 有 的 项 目 组 都 在 开发 自己 的 函 
数 库 。 但 很 明显 ， 这 种 开发 出 来 的 函数 库 具 有 很 强 的 本 地 性 ， 即 茶 个 项 目 组 开发 出 来 的 库 只 被 本 项 目 组 的 人 
接受 ， 并 不 通用 ， 因 为 很 有 可 能 其 他 项 目 组 的 人 会 想 ， 我 们 组 也 实现 了 一 个 叫 “ 义 久久 ”的 函数 ， 参 数 比 你 
们 的 少 , 但 功能 更 为 强大 ， 你 们 做 的 还 不 如 我 们 的 好 ， 应 该 用 我 们 的 库 。 这 还 只 是 项 目 组 之 间 的 矛盾 ， 在 项 
目 组 内 部 也 同样 出 现 类 似 的 情形 , 茶 个 成 员 认 为 同 组 人 开发 出 来 的 函数 , 在 名 称 上 不 合适 或 者 在 功能 上 有 所 
欠缺 ， 很 不 情愿 地 被 动 接 受 。 类 似 重复 造 轮子 的 情况 比比 省 是 ， 各 个 单位 、 公 司 ， 甚 至 教育 机 构 都 开发 出 自 















































































































































































































































标准 接口 ， 也 就 是 今天 所 说 的 C 标准 库 ， 























C 标准 库 是 与 操作 系统 平台 无 关 的 , 它 诞生 之 初 就 是 为 了 实现 用 户 程序 跨 操 作 系统 平台 而 规约 的 标准 
接口 ， 使 用 户 进程 无 论 在 哪个 操作 系统 上 调用 同样 的 函数 接口 ， 执 行 的 结果 都 是 一 样 的 。 














己 的 库 ， 没 有 统一 的 标准 接口 ， 大 家 都 认为 自己 的 好 ， 总 之 谁 也 不 服 谁 ， 这 时 候 需要 有 个 大 家 都 服 的 老大 出 
来 震慑 ， 它 就 是 美国 国家 标准 协会 ， 即 ANSI (American National Standards Institute )， 它 规定 出 一 套 C 函数 



































明确 规定 了 每 个 函数 的 作用 及 原型 ， 大 家 要 共同 遵守 。 
















































































C 运行 库 也 称 为 CRT(C RunTime library), 它 是 与 操作 系统 息息相关 的 , 因为 谁 也 不 愿意 重复 造 轮子 ， 








故 它 的 实现 也 基于 C 标准 库 ， 因 此 CRT 


















































属于 C 标准 库 的 扩展 。CRT 多 是 补充 C 标准 库 中 没有 的 功能 ， 为 




















适 配 本 操作 系统 环境 而 定制 开发 的 。 因 此 CRT 并 不 通用 ， 只 适用 于 在 本 操作 系统 上 运行 的 程序 。 



































CRT 都 做 了 什么 呢 ? 很 多 ， 最 主要 




















的 就 是 初始 化 运行 环境 ， 在 进入 main 函数 之 前 为 用 户 进程 准备 条 


727 











件 ， 传 递 参 数 等 ， 待 条 件 准 备 好 后 再 调用 用 户 进程 的 main 函数 ， 这 样 用 户 进程 才能 顺利 地 跑 起 来 。 当 用 
户 进程 结束 时 ，CRT 还 要 负责 回收 用 户 进程 的 资源 。 其 实 想 想 这 也 是 必然 的 ，main 函数 是 用 户 自己 写 的 ， 
无 论 代码 多 少 ， 总 有 结束 那天 〔 死 循环 不 算 )， 如 果 main 执行 到 了 边界 ， 此 时 没有 固定 的 代码 执行 ， 程 序 
不 就 “ 飞 ” 了 吗 ， 也 就 是 说 处 理 器 会 越过 边界 自动 向 下 取 指 令 ，cs:eip 寄存 器 中 的 值 肯定 就 不 对 了 ， 因 此 
程序 不 知道 会 跑 哪里 去 了 ， 处 理 器 一 直 会 执行 到 抛 异 常 为 止 ， 操 作 系统 也 就 失去 了 处 理 器 的 控制 权 ， 整 个 
计算 机 系统 瘫痪 了 , 这 就 是 咱们 经 常 在 程序 的 最 后 添加 死 循环 























































































































































































































代码 “while(1)” 的 原因 。 综 上 所 述 ，main 函数 一 定 是 被 call 编译 后 的 用 户 程 序 
指令 调用 的 ， 必 须 有 去 有 回 ， 目 的 是 当 用 户 进程 执行 完 用 户 所 a 
写 的 main 函数 后 能 够 执行 固定 的 代码 一 一 系统 调用 exit 或 “| “运行 库 开发 人 员 所 写 的 代码 















































int main(int argc, char* argv[]) 
{ 








_exit， 这 样 用 户 程序 陷入 内 核 ， 使 处 理 器 的 控制 权重 新 回 到 操 || 半 各 运行 条 作 
作 系 统 手 中 o call main 

其 实 CRT 代码 才 是 用 户 程序 的 第 一 部 分 ， 我 们 的 main 函数 | 商情 ot 系统 
实质 上 是 被 夹 在 CRT 中 执行 的 ， 它 只 是 用 户 程序 的 中 间 部 分 ， 编 。 | 站 轨 和 和 村 





































































































处 理 器 控制 权 ， 
译 后 的 二 进 制 可 执行 程序 中 还 包括 了 CRT 的 指令 ， 其 结构 如 开始 回收 当前 

任务 的 资源 , 然 
图 15-13 所 示 。 后 调度 下 一 个 

















您 看 ， 咱 们 似乎 要 做 个 CRT 了 ， 其 实 我 这 么 说 的 时 候 也 任务 
吓 了 我 自己 一 跳 ， 哈 哈 ， 我 可 没 那么 大 的 本 事 ， 咱 们 就 写 个 功 
能 类 似 的 简易 版 本 吧 ， 见 代码 15-26。 
代码 15-26 (project/c15/h/command/start.S ) 












































4 图 15-13 ”CRT 与 用 户 程 请 





1 LE | 

2 extern main 
3 section .text 
4 global start 
bstart: 
6 ; 
7 
8 
9 











下 面 这 两 个 要 和 execv 中 10ad 之 后 指定 的 寄存 器 一 致 
push ebx ; 压 入 argv 

push ecx ; 压 入 argc 

call main 



































这 一 次 我 们 是 在 command 目录 中 创建 startS， 它 是 用 户 程序 真正 的 第 一 个 函数 ， 是 程序 的 真正 入 口 ， 
这 是 我 们 编译 后 的 用 户 程 序 中 的 第 一 部 分 。 代码 贴 出 来 后 我 都 觉得 有 些 断 愧 了 , 代码 何止 是 简易 , 简直 是 简陋 ， 




























































































第 2 行 通过 “extern main” 声 明了 外 部 函数 main， 这 个 就 是 咱们 用 户 程序 中 的 主 函 数 main。 介 绍 到 

便 说 一 下 ，main 函数 名 其 实 也 可 以 用 其 他 名 称 来 替换 ， 无 论 是 什么 名 字 作 为 主 函 数 ， 这 里 要 用 extern 
声明 它 。 咱 们 就 不 单独 测试 了 ， 很 简单 的 ， 大 伙 儿 感 兴趣 自行 测试 吧 。 

第 5 行 是 标号 _start， 它 是 链接 器 默认 的 入 口 符号 ， 如 果 ld 命令 链接 时 未 使 用 链接 脚本 或 -e 参数 指定 
入 口 符 号 的 话 ， 默 认 会 以 符号 _start 为 程序 入 口 。 我 们 这 里 就 用 这 个 默认 的 _start。 

在 文件 exec.c 中 我 们 已 经 把 新 进程 的 参数 压 入 内 核 栈 中 相应 的 寄存 器 ，sys_execv 执行 完成 从 
intr_exit 返回 后 ， 寄 存 器 ebx 是 参数 数组 argv 的 地 址 ， 寄 存 器 ecx 是 参数 个 数 argc。 因 此 在 第 7~8 行将 它们 
压 入 栈 ， 此 时 的 栈 是 用 户 栈 ， 这 就 是 之 前 咱们 所 说 的 ， 自 己 和 自己 协调 好 就 行 了 : 在 sys_execv 中 ， 往 0 特 
权 级 栈 中 哪个 寄存 器 写 入 参数 ， 此 处 就 从 哪个 寄存 器 中 获取 参数 ， 然 后 再 压 入 用 户 栈 为 用 户 进程 准备 参数 。 
第 9 行 通过 call 指令 调用 外 部 函数 main， 也 就 是 用 户 程序 开发 人 员 所 负责 的 主 函数 main， 至 此 ， 用 
户 程 序 的 主 函数 开始 运行 。 

好 啦 ， 参 数 传递 的 问题 解决 了 ， 下 面 看 下 本 次 的 用 户 程序 吧 ， 见 代码 15-27。 

代码 15-27 (project/c15/h/command/prog_arg.c ) 

1 #include "stdio.h" 


2 #include "syscall.h" 
3 #include "string.h" 
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4 int main(int argc char** argv) { 
5 int arg idx = 0; 
6 while(arg idx < argc) { 
7 printf("argv[%d] is %s\n", arg idx, argvlarg idx]); 
8 arg_idxt++; 
9 } 
0 int pid = fork(); 
1 i£.. (pid) 1 
2 int delay = 900000; 
3 while (delay--); 
4 Pintf( NE Im father prog, my pid:%d, 
I will show process list\n", getpid()); 
5 ps (); 
6 } else { 
| char abs path[512] = {0}; 
8 printf("\n Im child prog, my pid:%d, 
I will exec %s right now\n", getpid(), argv[1]); 
9 if (argv[1][0] != '/') { 
20 getcwd (abs path，512) 
2 strcat (abs_path，"/n) 7， 
22 StzeattabgscpatEhy “argvlLl)? 
23 execv (abs path, argv); 
24 } else { 
25 execv (argv[1], argv); 
26 } 
2 } 
28 while(1); 
29 return 0; 
30.} 


大 体 上 说 下 代码 ， 这 次 的 测 斌 内容 四 
序 的 名 称 ， 即 prog_arg， 参 数 argv[1] 是 让 prog _arg 去 执行 的 可 执行 文件 

第 10 行 调用 fork 系统 调用 派生 出 子 进程 。 父 进程 先 用 while 循环 了 900 
迟 ， 目 的 是 避免 和 子 进程 输出 信息 混杂 在 一 起 。 然 后 调用 getpid 系统 调用 打印 
调用 打印 任务 信息 ， 此 时 在 任务 列表 中 应 该 包括 子 进程 的 信息 了 。 在 子 进程 中 
表示 自己 马上 要 执行 程序 prog no_arg， 也 就 是 参数 argv[1] 中 的 可 执行 文件 
径 ， 还 是 绝对 路 径 ， 如 果 是 相对 路 径 ， 调 用 getcwd 系统 调用 获得 工作 目录 ， 
之 后， 最 后 在 第 23 行 调 月 

代码 写 得 很 不 严谨 ， 意 思 到 了 就 行 ， 请 大 伙 儿 和 包涵。 下面 


上 
my = 
EH 
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代码 15-28 (project/c15/h/command/compile.sh ) 
#### ”此 脚本 应 该 在 command 目录 下 执行 
if [[ ! -dad "../lib" || ! -d "../build" ]];then 


echo "dependent dir don\‘t exist!" 
cwd=$ (pwd) 

Cwd=$ {Cwad##*/} 

cwd=$ {cwd%®/} 


if [[ S$cwd != "command" ]];then 

echo -e "youN qd better in command dir\n" 
fi 
exit 


于 人 


BIN="prog_arg" 

CFLAGS="-Wall -cc -fno-builtin -W -Wstrict-prototypes 
-Wmissing-prototypes -Wsystem-headers" 

LIBSS"=T 5 ALib. SL Ss-/LIBYUSer SL /ES 

OBJS="../build/string.o ../build/syscall.o \ 
../build/stdio.o ../build/assert.o start.o" 

DD_IN=$BIN 

DD_OUT="/home/work/my_ workspace/bochs/hd60M.img" 





nasm -f elf ./start.S -o ./start.o 
ar rcs simple crt.a $0OBJS start.o 
gcc $CFLAGS S$LIBS -Oo SBIN" .o" $BIN".c" 


日 execv 去 执行 它 。 如 果 argv[1] 是 绝对 路 径 ， 直 接 在 第 25 行 


， 先 在 函数 开头 打印 了 接受 的 参数 ， 参 数 argv[0] 是 本 程 
的 路 径 。 

000 次 delay--， 相 当 于 一 段 时 间 延 
上 自己 的 pid， 最 后 调 ) 
E 打 印 


AAA 


19 行 判断 argv[1] 是 相对 路 























j ps 系统 
出 信息 ， 


白 | 上 
[ 

















的 pid 及 输 




















后 将 argv[1] 追 加 到 工作 目录 
周 用 execv 执行 即 可 。 














看 编译 脚本 ， 见 代码 15-28。 
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26 ld $BIN".o" simple crt.a -o $BIN 
27 SEC_CNT=$ (ls -1 $BIN|awk '{printf("%d", ($5+511)/512)}') 


28 

29 if [[ -f $BIN ]];then 

30 dd if=./$DD IN of=$DD OUT bs=512 \ 

31 count=$SEC CNT seek=300 conv=notrunc 

32 二 

33 

34 非 提 非 并 # 提 提 提 并 非 以 上 核心 就 是 下 面 这 五 条 命令  ##### 非 间 ### 提 # 




















35 #nasm -f elf ./start.S -o ./start.o 
36 #ar rcs simple crt.a ../build/string.o ../build/syscall.o \ 








37 ../build/stdio.o ../build/assert.o ./start.o 
38 #gcc -Wall -c -fno-builtin -W -Wstrict-prototypes -Wmissing-prototypes \ 
39 -Wsystem-headers -I ../lib/ -I ../lib/user -I ../fs prog arg.c -0o prog arg.o 


40 #1ld prog arg.o simple crt.a -o prog arg 
41 #dd if=prog arg of=/home/work/my workspace/bochs/hd60M.img \ 
42 bs=512 count=11 seek=300 conv=notrunc 


脚本 只 是 为 了 方便 扩展 和 快速 编译 ， 大 伙 儿 还 是 直接 看 最 下 面 的 五 条 核心 命令 吧 。 和 上 节 的 
compile.sh 类 似 ,不 过 是 多 了 两 个 命令 , 先 用 nasm 把 start.S 编译 为 starto。 为 了 方便 ,这 里 还 调用 了 ar 命 
令 ， 将 string.o、syscall.o、stdio.o、assert.o 和 start.o 打包 成 静态 库 文件 simple_crt.a，simple_crt.a 类 
似 于 CRT 的 作用 ， 它 就 是 我 们 所 说 的 简陋 版 C 运行 库 。 后 面 的 用 户 程 序 目 标 文件 prog_arg.o 和 它 直 
接 链 接 就 可 以 了 。 后 面 的 指令 之 前 说 过 了 ， 下 面 看 main.c 中 的 代码 ， 见 代码 15-29。 


代码 15-29  ( project/c15/h/kernel/main.c ) 

















































































































































































































… 略 

21 int main(void) { 

22 put_str("I am kernel\n"); 

2 init all(); 

24 

总 / 术 太 大火 大 大 大 类 大大 大大 大 写 入 应 用 程序 大 大 大 大 大 大 大 大 大 大 大 大 大 / 

26 uint32 t file size = 5307; 

2 uint32 t sec cnt = DIV _ ROUND UP (file size, 512); 
28 struct disk* sda = &channels[0] .devices[0]; 

29 void* prog buf = sys malloc (file size); 

30 ide readl(sda, 300, prog buf, sec cnt); 

3 int32 t fd = sys open("/prog arg", O_CREAT|O RDWR); 
3322 if (fd != -1) { 

3 if(sys writel(fd, prog buf, file size) == -1) { 
34 printk("file write error!\n"); 

35 while(1); 

36 } 

3 } 

38 / 术 太 大火 大 大 大 炎炎 大 类 大 大 写 入 应 程序 结束 大 大 大火 炎 大 大 大 类 类 大 大大/ 

39 cls_screen (); 

40 console put str("[rabbit@localhost /]$ "); 

41 while(1); 

42 return 0; 

43 } 

… 略 














依然 还 是 老 样 子 ， 只 是 在 第 31 行 往 根 目录 中 写 入 的 文件 名 是 prog arg。 好 啦 ， 编 译 运 行 看 结果 ， 如 
图 15-14 所 示 。 
图 中 先 执行 了 “ls -1 命令 查看 了 文件 的 写 入 情况 , 果然 prog arg 已 经 写 入 到 根 目 录 下 , 然后 执行 “./prog arg 
/prog no_arg” 意图 是 让 prog arg 去 调用 我 们 上 节 中 完成 的 用 户 程序 prog_ no_arg。 执 行 过 后 ， 屏 幕 上 和 输出] 
参数 名 ， 然 后 父 进 程 执行 90 万 次 的 空 循环 ， 随 后 二 打印 出 “Tm child prog, my pid:6…”， 然 后 
执行 程序 prog no arg，prog_no arg 执行 后 输出 “prog no_arg from disk”。 父 进程 的 空 循环 执行 过 后 ， 刀 
姗 来 迟 地 输出 了 “Tm father prog, my pid:5…”。 接 着 打印 了 任务 信息 ， 其 中 pid 为 5 的 任务 是 父 进程 ， 其 
STAT 为 RUNNING， 其 执行 的 COMMAND 是 /prog arg。pid 为 6 的 是 子 进程 ， 其 STAT 为 READY， 典 
执行 的 COMMAND 是 /prog no arg。 

目测 运行 符合 预期 ， 本 节 到 此 结束 ， 下 节 再 见 。 
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TD 3 ResetsuspEnD Pober| 
< 0 OD 
BS, CONFIG 


[Crabb .Aprog_arg /prog_no_arg 
argv[O] is /prog_arg 
| 























Im child prog, my pid:6, I will exec /prog_no_arg right now 
lprog_no_arg from disk 


Im father prog, my pid:5, I will show process list 
ID 


TICKS COMMAND 
NULL READY ?D8A0 init 
NULL READY ?D8C0O main 
NULL BLOCKED 0 idle 
READY 2820 init 
RUNNING AA /prog_arg 
READY 2Z6C0 /Aprog_no_arg 





IPS: 28.598H nm lears lscre Im:o-nlh:osl | 1 1 1 
4 图 15-14 ”接受 参数 的 用 户 进程 



































0 实现 系统 调用 ，》 埋 光 和 漆 潭 


大 伙 儿 可 能 经 常会 使 用 exit， 它 是 如 此 普遍 ， 以 至 于 无 论 是 在 哪 种 语言 中 都 会 有 它 的 影子 。 它 还 有 
个 好 兄弟 一 一 wait， 它 其 实 总 是 与 exit 配合 使 用 ， 这 两 兄弟 虽然 是 成 对 使 用 的 ， 但 未 必 都 常用 ， 尤 其 
wait， 初 次 接触 时 不 容易 理解 其 作用 ， 甚 至 对 开发 经 验 较 少 的 同学 来 说 ，wait 是 “最 熟悉 的 陌生 人 ”。 


15.6.1 wait 和 exit 的 作用 


由 于 wait 和 exit 是 成 对 使 用 的 好 兄弟 ， 咱 们 就 不 把 它们 拆 开 了 ， 一 块 说 吧 。 

无 论 是 业务 上 的 需要 ,还 是 调试 需要 ， 大 多 数 同学 实际 工作 中 经 常 使 用 exit、_exit 或 其 他 功能 类 似 的 
系统 调用 ，exit 的 作用 很 直 白 ， 就 是 使 进程 “主动 ”退出 ， 结 束 运 行 。 其 实在 图 15-13 中 已 经 透露 了 一 件 
事 ,， 在 C 运行 库 中 调用 main 函数 执行 ,main 函数 执行 结束 后 程序 流程 会 回 到 C 运行 库 ，C 运行 库 的 结束 
代码 处 会 调用 exit。 这 表明 任何 时 候 进 程 都 会 调用 exit， 即 使 程序 员 未 写 入 调用 exit 的 代码 ， 在 C 运行 库 
的 最 后 也 会 发 起 exit 的 调用 。 由 此 可 见 ， 结 束 程 序 运行 始终 是 通过 主动 调用 exit 系统 调用 实现 的 ， 因 为 这 
是 唯一 让 系统 重新 拿 回 处 理 器 控制 权 的 机 会 。 

可 能 有 些 同学 对 wait 有 些 不 解 ， 不 知道 其 具体 是 干吗 的 。wait 的 作用 是 阻塞 父 进程 自己 ， 直 到 任意 

个 子 进程 结束 运行 。wait 通常 是 由 父 进程 调用 的 ， 或 者 说 ， 尽 管 某 个 进程 没有 子 进 程 ， 但 只 要 它 调 用 了 
wait 系统 调用 ， 该 进程 就 被 认为 是 父 进 程 ， 内 核 就 要 去 查找 它 的 子 进程 ， 由 于 它 没有 子 进程 ， 此 时 wait 
会 返回 -1， 表 示 其 没有 子 进 程 。 如 果 有 子 进程 ， 这 时 候 该 进程 就 被 阻塞 ， 不 再 运行 ， 内 核 就 要 去 遍历 其 所 
有 的 子 进程 ， 查 找 哪个 子 进程 退出 了 ， 并 将 子 进 程 退 出 时 的 返回 值 传递 给 父 进程 ， 随 后 将 父 进程 唤醒 。 
读 了 上 面 这 段 文字 似乎 对 wait 明白 了 一 些 ， 但 似乎 又 没 说 到 点 上 。 上 面 这 段 文件 解释 了 wait 的 作用 
主要 有 两 个 ， 一 是 使 父 进程 阻塞 ， 二 是 获得 子 进程 的 返回 值 。 其 实 第 二 个 作用 和 第 一 个 作用 相 比 “ 显 得 ” 
没 那么 重要 ，wait 的 主要 作用 就 是 使 父 进程 阻塞 。 大 伙 儿 想 想 看 ， 什 么 是 阻塞 ?” 阻塞 是 指 任务 不 在 就 绪 队 
列 当中 ， 这 样 调 度 器 就 不 会 调度 它 ， 因 此 该 任务 就 不 会 运行 。 这 里 的 重点 就 是 “不 运行 ” 这 才 是 wait 的 
使 命 ， 通 过 阻塞 父 进程 ， 可 以 解决 父子 进程 同步 的 问题 ， 其 实 咱们 已 经 遇 到 了 这 种 问题 了 。 

上 一 节 中 ， 为 了 使 父子 进程 输出 的 信息 不 混杂 在 一 起 ， 咱 们 特意 在 父 进 程 中 通过 while 执行 了 个 90 万 次 
的 无 意义 的 循环 以 实现 延迟 。 先 不 说 浪费 宝贵 的 CPU 资源 , 这 种 空 兜 CPU 的 方式 也 并 不 是 万 全 之 策 , 那个 while 
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第 15 章 系统 交互 


循环 产生 的 延迟 取决 于 实际 CPU 的 主 频 ， 如 果 CPU 主 频 很 低 ， 自 然 延 迟 的 时 间 相 对 较 长 ， 如 果 主 频 比较 高 ， 
10 万 次 的 循环 也 起 不 到 多 大 的 作用 ， 父 子 进程 的 信息 还 是 会 混杂 在 一 起 。 除 此 之 外 ， 进 程 的 调度 时 机 是 由 调 
度 器 的 调度 算法 决定 的 ， 如 果 系 统 很 忙 ， 父 进程 把 10 万 次 循环 都 执行 完了 ， 调 度 器 却 一 直 未 开始 新 的 调度 ， 
当 父 进程 又 打印 了 一 句 话 后 ， 此 时 调度 器 开始 调度 子 进程 上 CPU， 子 进程 开始 输出 ， 这 下 父子 进程 的 信息 
又 混杂 在 一 起 了 ， 您 看 ， 还 是 没 从 根本 上 解决 问题 ， 总 之 空 忽 CPU 实现 的 延迟 只 是 在 大 多 数 情况 下 有 效 。 
想 想 看 ， 其 实 这 本 质 上 属于 进程 同步 的 问题 ,也 就 是 协调 父子 进程 某 些 代码 的 执行 次 序 ， 我 们 希望 子 进程 执 
行 完 某 些 代码 后 再 让 父 进 程 执行 。 对 于 父子 进程 的 同步 ， 可 以 用 wait 系统 调用 来 解决 ， 这 其 实 就 是 wait 的 
初 心 。 
也 许 我 们 对 wait 的 概念 有 些 模糊 的 原因 是 它 不 像 exit 那样 表意 直 白 ， 从 名 字 上 就 能 理解 其 功能 ， 
wait 是 等 待 的 意思 ， 初 次 接触 时 不 禁 要 问 了 ， 等 待 什么 ? 如 果 wait 不 叫 wait， 而 是 更 直 白 地 叫 作 诸 如 
“plock_myself”， 甚 至 更 直 白 一 点 :“let_child execute_ first” 我 想 大 伙 儿 就 不 会 对 其 作用 感到 拿捏 不 准 了 。 
好 啦 ， 本 节 结 束 啦 。 


15.6.2” 扳 儿 进程 和 僵尸 进程 


话说 Linux 系统 中 为 什么 有 孤儿 进程 和 僵尸 进程 ?原因 是 因为 有 wait 和 exit 系统 调用 。 

前 面 介 绍 到 ， 进 程 到 最 后 都 会 调用 exit 结束 运行 ， 无 论 它 是 主动 调用 的 exit， 还 是 C 运行 库 中 的 exit。 

“如 果 一 个 子 进程 的 运行 结束 了 ， 它 的 父 进程 没有 调用 wait (Linux 中 还 有 waitpid 也 是 同样 的 功能 )， 那 么 该 
进程 就 变 成 僵尸 进程 。” 这 是 大 多 数 对 僵尸 进程 的 解释 ， 我 当初 接触 这 个 概念 时 不 禁 发 问 ， 为 什么 父 进程 不 
wait 的 话 ， 子 进程 就 变 成 僵尸 ? 或 者 说 ， 父 进程 到 底 在 “等 ”什么 ? 父 进程 想 从 子 进 程 那里 等 来 什么 ?什么 
东西 这 么 重要 以 至 于 子 进程 不 交付 给 父 进程 的 话 会 变 成 僵尸 而 死 不 虐 目 ? 
前 面 咱们 也 说 过 了 ，wait 的 一 个 作用 就 是 阻塞 父 进程 ， 使 父子 进程 同步 ， 另 外 一 个 作用 就 是 获得 子 进 
程 的 “退出 状态 ” 父 进程 派生 出 子 进程 的 目的 是 让 子 进 程 帮忙 做 一 些 工 作 ， 子 进程 在 其 有 限 的 生命 中 要 
拼命 工作 ,但 未 必 会 把 工作 成 功 完成 ， 这 就 像 咱们 的 实际 工作 一 样 ， 有 的 工作 难度 较 低 ， 很 容易 完成 ， 有 
的 工作 难度 较 大 ， 最 终 失 败 了 ， 子 进程 工作 完成 的 成 功 与 否 ， 不 能 光子 进程 自己 知道 ， 还 得 向 上 级 汇报 ， 
子 进程 是 由 父 进 程 委 派 的 ， 因此 必须 要 告诉 父 进程 自己 的 任务 完成 了 没有 。 怎样 汇报 呢 ? 这 是 通过 子 进程 
的 返回 值 体 现 的 ， 也 就 是 子 进程 main 函数 中 最 后 的 retum 语句 的 值 ， 就 是 进程 所 谓 的 “退出 状态 ” 当 子 进 
程 执行 完 main 函数 后 ， 程 序 流程 会 回 到 C 运行 库 ，C 运行 库 会 把 进程 return 的 返回 值 通过 系统 调用 exit 提 
交 给 内 核 。 这 是 子 进程 的 主 函数 全 部 执行 完 的 情况 ,如果 进 程 还 没 到 returm 就 想 半 路 主动 退出 呢 ? 其 返回 值 
该 如 何 传递 给 父 进程 ? 这 个 好 办 ， 因 为 exit 的 原型 就 是 “void _exit(int status)” 其 中 status 就 是 子 进程 的 返 
可 值 ，C 运行 库 中 调用 exit 的 形式 就 是 exit( 子 进程 的 返回 值 )， 那 子 进程 直接 调用 exit( 返 回 值 ) 就 可 以 了 ， 这 
就 是 咱们 调用 exit 时 必须 要 提供 个 返回 值 的 原因 。 其 实 子 进程 的 返回 值 并 不 是 手 递 手 直接 交 给 父 进程 的 , 您 
想 ， 进 程 都 是 独立 的 地 址 空间 ， 即 使 是 父子 进程 ， 它 们 之 间 也 是 相互 独立 不 可 互 访 的 ， 因 为 这 就 是 与 线程 的 
区 别 ， 进 程 间 要 想 相 互通 信 必 须要 借用 内 核 (无 论 是 管道 、 消 息 队 列 ， 还 是 共享 内 存 等 进程 间 通 信 形 式 , 无 
例外 都 是 借助 内 核 这 个 中 间 人 )， 子 进程 的 返回 值 肯定 是 先 要 交 给 内 核 ， 然 后 是 父 进 程 向 内 核 要 子 进程 的 
返回 值 。 在 子 进 程 的 返回 值 提 交 给 内 核 后 ， 父 进程 该 如 何 向 内 核 要 子 进程 的 返回 值 呢 ? 这 时 系统 调用 wait 
的 第 二 个 作用 就 发 挥 出 来 了 ，wait 的 原型 是 “pid t wait(int *status)”， 其 中 status 是 父 进程 用 于 存储 子 进程 返 
值 的 地 址 ， 父 进程 调用 它 之 后 ， 内 核 就 会 把 子 进 程 的 返回 值 存 储 到 status 指向 的 内 存 空 间 ， 至 此 父 进程 终 
于 了 解 了 子 进程 的 临终 遗言 ， 也 就 是 退出 状态 。 
大 伙 儿 有 没有 想 过 ， 进 程 是 单独 执行 的 个 体 ， 每 个 进程 都 有 自己 的 返回 值 ， 那 返回 值 存放 在 哪里 呢 ? 

估计 您 也 想到 了 ， 为 了 方便 管理 ， 与 进程 相关 的 数据 都 统一 放 在 pcb 中 ， 当 进程 生命 结束 时 ， 它 的 遗言 ， 
也 就 是 返回 值 ， 会 被 内 核 放 在 pcb 中 。 另 外 ， 进 程 在 调用 exit 时 就 表示 进程 生命 周期 结束 了 ， 其 占用 的 资 
源 可 以 被 回收 了 ， 因 此 进程 在 调用 exit 后 ， 内 核 会 把 该 进程 占用 的 大 部 分 资源 都 回收 ， 比 如 内 存 、 页 表 等 ， 但 
肯定 不 能 将 进程 的 pcb 所 占 的 内 存 回收 ， 原 因 是 里 面 存储 着 子 进程 的 遗言 ， 必 须要 交付 给 父 进程 ， 父 进程 收 到 
子 进程 的 遗言 后 才能 回收 子 进程 的 pcb， 否 则 子 进程 会 “ 死 不 卓 目 ”。 这 表示 进程 的 pcb 是 进程 最 后 占用 的 资 
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源 ， 它 应 该 在 父 进 程 调用 wait 获取 子 进 程 的 返回 值 后 ， 再 由 内 核 回 收 子 进程 
坊 收 pcb 内 存 空 间 的 工作 是 在 系统 调 
系统 调用 的 期 间 ， 因 上 
进程 结束 时 会 通 ; 
结果 ， 父 进程 为 了 获知 子 进程 的 成 果 如 何 ， 





说 ， 匠 











wait 之 后 、 内 核 受理 
小 总 结 一 下 》 























三 床 过 汪 : 


















































wait 对 应 的 
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= » 
百 ， 











寸 exit 留 下 点 









































是 父 进程 调用 wait 系统 调 
exit 把 信 交 给 了 内 核 ， 父 进程 知 









































] 。 如 果 把 父子 进程 


内 核实 现 中 。 子 进程 pcb 的 区 
“相当 于 ” 父 进程 为 子 进程 “ 收 
也 就 是 返回 











pcb 所 占 的 1 页 框 内 存 ， 也 就 是 
收 是 发 生 在 父 进程 


调用 


户 ” 其 实 是 内 核 为 子 进 程 “ 收 尸 ”。 





















































值 ， 它 代表 了 子 进程 这 一 生 工 作 的 








必须 要 获得 子 进程 的 返回 

















道子 进程 








间 起 到 了 邮递 员 的 作 / 
以 上 是 正常 情况 
在 子 进程 提交 给 父 进程 返 下 


























把 子 进程 的 返回 值 投递 给 父 进 程 。 












































的 父 于 





在 运 





了 ,没有 一 个 执行 了 exit, 因为 它们 























Ne 
当 寺 











进程 ， 








进程 在 派生 出 子 进程 后 并 没有 调 


四 











下 进程 是 怎 























然 没 人 来 


尸 "说 


法 获知 


程 就 称 为 孤儿 进程 。 这 时 
进程 退出 时 会 由 init 负责 为 其 “ 
将 子 进程 托付 给 init 是 再 合理 
么 回 事 呢 ， 僵 尸 进程 也 称 为 zombie， 下 面 还 拿 子 进程 提交 返回 值 来 举例 说 明 。 如 果 父 
] wait 等 待 接收 子 进程 的 返回 值 ， 这 时 某 个 子 进程 调用 








接收 返 蕊 





























进程 间 的 
值 的 


























， 有 这 样 
的 生命 周期 












































吴 所 有 


























































































































子 进程 的 返 下 

















还 在 进 





值 ， 从 而 
因此 您 懂 的 ， 僵 尸 进程 是 没有 进程 体 的 ， 因 为 其 





因此 其 pcb 所 占 的 空 
| 对 子 进程 的 返 蕊 
内 核 就 无 法 回 





























收 子 进程 pcb 所 





尚未 结束 , 还 
的 子 进程 会 被 init 进程 收养 
想 这 也 是 顺 至 


占 的 空 




















通信 ， 说 了 这 么 多 ， 下 面 该 解释 
种 情况 ， 当 父 进 程 提 前 退出 时 
在 运行 中 , 个 个 都 扩 
，init 进程 会 成 为 这 些 


值 ， 而 获得 子 进程 返回 
间 的 通信 比喻 成 邮 信 ， 子 进程 通过 exit 来 给 父 进 程 写 信 
定 会 写 信 给 它 ， 因此 它 主 动 i 

















值 的 方法 ， 就 














周 用 wait 收 信 ， 内 核 在 父子 进程 之 











儿 进 程 和 僵尸 进程 了 。 
， 它 所 有 的 子 进 程 还 
ji 有 “全 尸 ”( 进 程 体 )， 
进程 的 新 父亲 






























































成 章 的 ， 毕 竟 init 进程 是 所 有 进程 的 父 














值 了 ( 父 进 程 未 退出 ， 因 此 子 进程 不 能 过 继 给 init，init 也 不 能 帮 子 
只 有 父 进程 才 有 权限 为 子 进程 收 尸 )， 
了 ， 伪 性 进程 就 是 外 


间 不 能 释放 ， 没 人 为 其 “ 收 尸 ”， 
值 是 否 成 功 提交 给 父 进程 而 提出 的 ， 父 进程 不 调用 wait， 就 无 






























































exit 退出 了 ， 
旦 做 善后 收 己 ， 


进 程 


习 然 就 成 了 “ 僵 






























































间 ， 
































因此 就 会 在 队列 中 














占据 一 个 进程 表 项 。 



























































程 队 列 中 ， 它 3 
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Ei 


进程 体 已 在 调用 exit 时 被 内 核 回收 了 ， 现 在 只 剩 下 一 个 pcb 
占 太 多 的 资源 。 在 Linux 中 ， 用 ps 命令 查看 的 任务 列表 当中 ，stat 为 “2Z” 














init 会 很 好 地 为 其 善后 ， 基 








此 并 












































































































































程 表 项 pcb， 理 
， 这 是 最 合适 的 选择 ， 至 少 区 和 








1 如 下 。 
了 单独 保存 退出 状态 

































































































































































其 他 所 有 资源 都 可 以 释放 。 
































程 的 合理 





性 ， 似 乎 没什么 危害 ， 是 这 样 

























































































| 于 pcb 不 释放 ， 它 原本 的 pid 








僵尸 进程 数量 很 大 时 ， 系 统 将 无 可 用 pid 分 配给 新 进程 ， 从 而 加 载 进程 失 败 。 然 后 僵尸 








i 上 功能 是 使 子 进程 结束 运行 并 传递 返回 值 给 内 核 ， 本 质 上 是 内 核 在 幕后 




















此 对 于 这 种 情况 ， 就 要 将 僵尸 进程 的 父 进 
E 务 的 pid 和 ppid， 找 到 状态 为 Z 的 进程 ， 查 看 其 ppid， 跟 着 






































































































































上 3 























力 能 是 使 父 进程 阻塞 自己 ， 直 到 子 





















































值 ， 本 质 上 是 内 核 在 幕后 将 子 进程 的 返回 值 传递 给 父 进程 




















是 僵尸 进程 ， 也 就 是 Zombie。 
对 系统 而 言 ， 有 了 init 进程 的 “收养 “， 扳 儿 进程 并 没有 什么 
不 会 额外 占用 资源 ， 它 和 普通 的 进程 一 样 ， 原 理 上 对 系统 不 会 产生 不 良 影响 。 
下 面 多 说 两 句 僵 尸 进程 ， 僵 尸 进 程 的 本 质 是 不 占 资 源 ， 仅 含有 进 
首先 进程 退出 状态 得 保存 在 某 处 ， 保 存在 pcb : 
的 空间 ， 并 且 由 于 每 个 进程 都 有 唯一 的 退出 状态 ， 放 在 pcb 中 容易 与 进程 相关 联 ， 好 管理 
其 次 ， 进 程 的 退出 状态 未 被 父 进程 取出 前 ， 除 了 pcb 以 外 ， 了 
以 上 是 僵尸 进程 pcb 必然 残留 的 原因 ， 部 分 程度 上 解释 了 僵尸 进 
吗 ? 咱们 继续 看 。 僵 尸 进程 虽然 没有 进程 体 ， 只 在 内 存 中 保留 一 个 pcb， 但 
也 会 继续 被 占用 ， 当 
进程 并 不 是 问题 所 在 ， 问 题 的 根源 在 于 产生 僵尸 进程 的 父 进 程 ， 医 
程 kill 掉 。 在 Linux 中 可 以 利用 ps -ef 查看 所 有 个 
向 pid 为 ppid 的 进程 发 送 kill -9， 手 起 刀 落 ， 系 统 又 和 谐 了 。 
总 结 : 
exit 是 由 子 进 程 调用 的 ， 表 了 国 
会 将 进程 除 pcb 以 外 的 所 有 资源 都 回收 。wait 是 父 进程 调用 的 ， 表 面 
进程 调用 exit 结束 运行 , 然后 获得 子 进程 的 返回 
并 会 唤醒 父 进程 ， 然 后 将 子 进程 的 pcb 回收 。 
好 啦 ， 本 节 终 于 结束 了 ， 基 础 内 容 就 介绍 到 这 ， 大 伙 儿 下 节 见 。 
5.6.3 一 些 基础 代码 














在 进一步 实现 exit 和 wait 之 前 ， 有 一 些 基础 工作 还 是 必 不 可 少 的 ， 下 面 分 别 介绍 下 。 
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进程 的 返回 值 ， 也 就 是 退出 状态 存储 在 pcb 中 ， 因 此 我 们 要 在 pcb 中 增加 一 个 成 员 来 记录 返回 值 ， 芽 
在 完整 的 pcb 如 代码 15-30 所 示 。 


代码 15-30 (project/c15/i/thread/thread.h ) 

































































78 /* 进程 或 线程 的 pcb， 程 序 控制 块 */ 
79 struct task struct { 
































80 uint32 tx self kstack;  // 各 内 核 线程 都 用 自己 的 内 核 栈 
81 idet. Pi 

82 enum task status status; 

83 char name [TASK NAME LEN]; 

84 Uintect: Driority 

85 uint8 = ticks; // 每 次 在 处 理 器 上 执行 的 时 间 咬 噶 数 



































86 /* 此 任务 自 上 cpu 运行 后 至 今 占 用 了 多 少 cpu 咬 哄 数 ， 
87 * 也 就 是 此 人 FE 务 执行 了 多 久 */ 






































































































































































































































































































































88 uint32 t elapsed ticks; 
89 /* general tag 的 作用 是 线程 在 一 般 的 队列 中 的 结 点 */ 
90 struct list elem general tag; 
91 /* all 1ist_tag 的 作用 是 用 于 线程 队列 thread_all _1ist 中 的 结 点 */ 
92 struct list elem all list tag; 
93 uint32 t* pgdir; // 进程 E 己 页 表 的 虚 处 地 址 
94 struct virtual addr userprog vaddr; // 进程 的 虚拟 地 址 
95 struct mem block desc u block desc[DESC CNT]; 
// 进程 内 存 块 描述 符 

96 int32 t fd table[MAX FILES OPEN_PER PROC];  // 已 打开 文件 数组 
97 uint32 t cwd inode nr; // 进程 所 在 的 工作 目录 的 inode 编号 
98 pid t parent pid; // 父 进程 pid 
99 int8 七 exit status; // 进程 结束 时 自己 调用 exit 传 入 的 参数 
100 uint32 t stack magic; 

// 用 这 串 数字 做 栈 的 边界 标记 ， 用 于 检测 栈 的 溢出 
0 二 
. 略 














其 中 第 99 行 的 exit_ status 就 是 进程 的 退出 状态 值 。 
除 此 之 外 还 要 添加 个 内 存 释 放 的 函数 ， 这 定义 在 memory.c 中 ， 见 代码 15-31。 





























代码 15-31 (project/c15/i/kernel/memory.c ) 


























.. 略 
578/* 根据 物理 页 框 地 址 pg_phy_addr 在 相应 的 内 存 池 的 位 图 清 0， 不 改动 页 表 */ 











579 void free a phy page (uint32 t pg phy addqr) { 

580 struct pool* mem pool; 

581 uint32 t bit idx = 0; 

S82 if (pg phy addr >= user pool.phy addr start) { 

583 mem pool = &user pool; 

584 bit idx = (pg phy addr - user pool.phy addr start) / PG SIZE; 
585 } else { 

586 mem pool = &kernel pool; 

587 bit idx = (pg phy addr - kernel pool.phy addr start) / PG SIZE; 
588 } 

589 bitmap set (&mem pool->pool bitmap, bit idx, 0); 

S90 省 

… 略 
































函数 free a phy page 接受 1 个 参数 ， 物 理 页 框 地 址 pg phy addr， 功 能 是 根据 物理 页 框 地 址 
pg_phy_addr 在 相应 的 内 存 池 的 位 图 清 0， 此 函数 并 不 会 改动 页 表 。 

函数 的 实现 很 容易 ， 根 据 pg_phy_addr 的 值 ， 判 断 它 所 属 的 物理 内 存 池 ， 算 出 与 物理 内 存 池 的 起 始 物 
里 地 址 的 差 ,使 差 再 除 以 PG_SIZE， 所 得 的 商 便 是 在 位 图 中 的 索引 bit_idx， 最 后 调用 bitmap_set 在 相应 物 
里 内 存 池 中 将 bit_idx 置 为 0。 

memory.c 就 介绍 完了 ， 下 面 是 重点 ， 我 们 在 thread.c 中 增加 一 些 内 容 ， 见 代码 15-32。 


代码 15-32 (project/c15/i/thread/thread.c ) 






























































a 




















ra 

















… 略 

14 /* pid 的 位 图 ， 最 大 支持 1024 个 piqd */ 
15 uint8 t pid bitmap bits[128] = {0}; 
16 
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17 /* pid 池 */ 
18 struct pid pool { 














19 struct bitmap pid bitmap; // pid 位 医 
20 uint32 t pid start; // 起 始 pid 
2 struct lock pid lock; // 分 配 pid 锁 
22 }pid pool; 

… 略 


56 /* 初始 化 pid 池 */ 
57 static void pid pool init (voidq) { 


58 pid pool.pid start = 1; 

5:9. pid pool.pid bitmap.bits = pid bitmap bits; 
60 pid pool.pid bitmap.btmp bytes len = 128; 
61 bitmap init(&pid pool.pid bitmap); 

62 lock init(&pid pool.pid lock); 

63 1} 

64 


65, /分 配 pid*/y 
66 static pid t allocate pidl(void) { 


67 lock acquire(&pid pool.pid lock); 

68 int32 t bit idx = bitmap_ scan(&pid pool.pid bitmap, 1); 
69 bitmap_ set (&pid pool.pid bitmap, bit idx, 1); 

70 lock release(&pid pool.pid lock); 

71 return (bit idx + pid pool.pid start); 

了 2 

73 


74 /* 释放 piqd */ 
75 void release pid(pid t pid) { 








































































































































































































76 lock acquire(&pid pool.pid lock); 
了 了 int327t bit Tdxe pid pid PooL, pid start» 
78 bitmap set (&pid pool.pid bitmap, bit idx, 0); 
79 lock release(&pid pool.pid lock); 
80 1} 
309 /* 回收 thread over 的 pcb 和 页 表 ， 并 将 其 从 调度 队列 中 去 除 */ 
310 void thread exit(struct task struct* thread over, bool need schedule) { 
314 /* 要 保证 schedule 在 关中 断 情况 下 调用 */ 
312 intr disable(); 
号 下 thread over->status = TASK DIED; 
314 
315 /* 如 果 thread over 不 是 当前 线程 ， 
就 有 可 能 还 在 就 绪 队 列 中 ， 将 其 从 中 删除 */ 
316 if (elem find(&thread ready list, &thread over->general tag)) { 
317 list remove(&thread over->general tag); 
318 } 
319 if (thread over->pgdir) { // 如 是 进程 ， 回 收 进程 的 页 表 
320 mfree page (PF_ KERNEL, thread over->pgdir, 1); 
321 } 
322 
323 /* 从 all_thread 1ist 中 去 掉 此 任务 */ 
324 list remove(&thread over->all list tag); 
329 
326 /* 回收 pcb 所 在 的 页 ， 主 线程 的 pcb 不 在 堆 中 ， 跨 过 */ 
区 if (thread over != main thread) { 
328 mfree page (PF KERNEL, thread over, 1); 
32:9 } 
330 
331 /* 归还 piqd */ 
这 release pidl(thread over->pid); 
333 
334 /* 如 果 需 要 下 一 轮 调度 则 主动 调用 schedule */ 
号 35 if (need schedule) { 
336 Schedule (); 
337 PANIC ("thread exit: should not be here\n"™); 
338 } 
39 
340 


341 /* 比 对 任务 的 pid */ 
342 static bool pid check(struct list elem* pelem, int32 t pid) { 


343 struct task struct* pthread = elem2entry(struct task struct, \ 
all list tag, pelem); 

344 if (pthread->pid == pid) { 

345 return true; 


735 
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346 } 
347 return false; 
348 } 
349 
350 /* 根据 pia 找 pcb， 若 找到 则 返回 该 pcb， 否 则 返 区 
351 struct task struct* pid2thread (int32 t pid) 
352 struct list elem* pelem = 


{ 


NULL */ 


list traversal (&thread all list, 


353 if (pelem == NULL) { 

354 return NULL; 

355 } 

356 struct task struct* thread = elem2entry(struct task struct,\ 
all list tag, pelem); 

3527 return thread; 

3582 

359 

360 /* 初始 化 线程 环境 */ 


void thread init(void) { 



















































































362 put_str("thread init start\n"); 
363 
364 list init(&thread ready list); 
365 ist. nit (thread all List}y 
366 pid pool init(); 
367 
368 /* 先 创建 第 一 个 用 户 进程 :init */ 
369 process execute (init, "init"); 
// 放 在 第 一 个 初始 化 ， 这 是 第 一 个 进程 , init i 

370 
371 /* 将 当前 main 函数 创建 为 线程 */ 
2 make main thread(); 
373 
374 /* 创建 idle 线程 */ 
了 和 idle thread = thread start ("idle", 
3:76 
377 put_str("thread init done\n"); 
378 中 
… 略 

这 次 我 们 改进 了 pid 的 分 配 ， 























也 就 是 pcb 和 pid 都 不 释放 ， 虽 们 为 ] 
为 它 专门 定义 了 pid 池 ， 池 中 包含 了 位 图 ， 由 位 图 去 
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妈 去 管理 


局 











10, idle, 











程 的 pid 为 1 


NULL); 





之 前 的 pid 只 有 分 配 ， 不 能 释放 ， 前 面 

















第 15 行 的 pid_bitmap_bits 是 我 们 为 pid 池 定 义 的 位 图 





以 下 的 pid_pool init 是 初始 化 pid_pool， 对 位 图 、 起 始 pid、 锁 进行 了 




















中 被 调用 ， 也 就 是 第 366 行 ， 实 现 很 简单 ， 不 
已 经 是 老生 常 谈 了 ， 函 数 release_pid 









































j 多 说 了 。 接 下 来 的 函 





以 上 几 个 函数 是 为 回收 pid 做 出 的 改进 ， 下 寿 













































































于 释放 pid， 函 数 实现 也 一 样 很 老 套 了 ， 不 Y 

















已 经 介绍 过 僵 









































站 进程 
解决 这 个 问题 ， 把 pid 分 配 策略 彻底 改 了 。 为 了 实现 pid 的 管 到 
Epid 的 分 配 与 释放 。 

， 它 为 128 字 节 ， 这 说 明 
第 18 一 22 行 定 义 的 struct pid_pool 是 我 们 的 pid 池 、 并 且 生 成 了 实例 pid_pool。 


pid check, pid); 


的 浆 端 了 ， 























们 最 大 支持 1024 个 pid。 








































































































































































































人 体 初 始 化 工作 ， 它 在 therad init 
数 allocate_pid 用 于 分 配 pid， 其 内 部 操作 
良 费 大 伙 儿 时 间 介 绍 了 。 
i 几 个 函数 是 为 释放 进程 的 pcb 添加 的 新 功能 。 












































thread_exit 接受 2 个 参数 ， 待 退出 的 任务 thread_over、 是 否 要 调度 标记 need_schedule， 功 能 是 回收 
thread_over 的 pcb 和 页 表 ， 并 将 其 从 调度 队列 中 去 除 。 

函数 实现 中 ， 先 将 thread_over 的 status 置 为 TASK DIED， 这 表示 该 任务 马上 要 结束 生命 周期 。 

当前 线程 肯定 不 在 就 绪 队 列 当 中 ， 如 果 thread_over 不 是 当前 线程 ， 就 有 可 能 在 就 绪 队 列 中 ， 因 此 在 
第 316 行 ， 判 断 thread_over 是 否 在 就 绪 队 列 thread ready_list 中 ， 如 果 是 ， 就 将 其 去 掉 。 

第 319 行 ， 如 果 thread_over 是 进程 的 话 ， 就 在 下 一 行 通过 mfree_page 回收 其 页 目录 表 占 用 的 1 页 框 。 

第 324 行 ， 把 thread_over 从 all thread list 中 去 掉 。 

退出 的 线程 有 可 能 是 主线 程 ， 而 主线 程 的 pcb 并 不 是 在 堆 中 分 配 的 ， 因 此 第 327 行 对 此 特殊 处 理 ， 对 
回收 除 主线 程 之 外 的 任务 的 pcb。 

第 332 行 通过 release_pid 释放 了 进程 的 pid。 

第 335 行 通过 need_schedule 判断 是 否 要 调用 schedule 重新 调度 新 进程 。 在 后 面 您 就 会 看 到 ， 我 们 在 
调用 thread_exit 时 ， 有 时 候 需 要 开始 新 调度 ， 不 用 回 到 主 调 函 数 ， 有 时 候 不 需要 新 调度 ， 调 用 thread exit 
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后 还 要 回 到 主 调 函 数 中 。 
函数 pid_check 是 函数 listr_traversal 的 回调 函数 , 它 用 于 比 对 任务 的 pid, 找到 特定 pid 的 任务 就 返回 。 
函数 pid2thread 接受 1 个 参数 ， 任 务 的 pid， 功 能 是 根据 pid 找 pcb， 若 找到 则 返回 该 pcb， 否 则 返回 NULL,， 
其 原理 是 调用 list_traversal 遍历 全 部 队列 中 的 所 有 任务 ， 通 过 回调 函数 pid_check 过 滤 出 特定 pid 的 任务 。 
好 啦 ， 基 础 工作 完成 了 ， 下 节 我 们 可 以 正式 完成 wait 和 exit 了 ， 下 节 见 。 
15.6.4 实现 wait 和 exit 
前 面 为 完成 本 节 的 内 容 做 了 很 多 铺 热 ， 终 于 到 了 面 对 wait 和 exit 的 时 刻 了 ， 有 了 它们 ， 我 们 的 父 进 









































程 就 能 够 获取 子 进程 的 返回 值 ， 并且， 





我 们 不 用 在 程序 中 人 为 添加 死 循环 while(1) 来 限制 程序 “边界 ”了 。 
Linux 中 exit 的 系统 调用 是 exit， 其 原型 是 “void _exit(int status)” 其 中 status 是 返回 的 状态 值 ， 是 子 
进程 代入 的 参数 。 直 接 叫 _exit 还 真 不 习惯 ， 为 了 具有 亲和力 ， 我 们 还 是 叫 exit 吧 ， 接 口 的 实现 形式 不 变 。 
wait 的 原型 是 “pid t wait(int *status)”， 其 中 status 是 父 进程 传 入 的 地 址 ， 该 地 址 空间 用 于 接收 子 进 程 
值 ， 成 功 则 返回 子 进程 的 pid， 失 败 则 返回 -1。 

好 ， 上 代码 ，wait 和 exit 我 们 定义 在 userprog/wait exit.c 中 ， 
见 代码 15-33-1。 























































































































于 














返 





目 . 生气 


而 是 第 一 部 分 ， 





尺码 有 点 长 ， 分 为 几 部 分 ， 下 











































































































































































































































































































代码 15-33-1 (project/c15/i/userprog/wait_exit.c ) 
… 略 
1 /* 释放 用 户 进程 资源 : 
2 * 1 页 表 中 对 应 的 物理 页 
3 * 2 虚拟 内 存 池 占 物理 页 框 
4 * 3 关闭 打开 的 文件 */ 
5 static void release prog resource(struct task struct* release thread) { 
6 uint32 tx pgdir vaddr = release thread->pgdir; 
uint16 t user pde nr = 768, pde idx = 0; 
8 uint32 t pde = 0; 
9 uint32 tx v pde ptr = NULL; // 表示 var， 和 函数 pde_ptr 区 分 
20 
21 uint16 t user pte nr = 1024, pte idx = 0; 
22 uint32 t pte = 0; 
23 uint32 t* v pte ptr = NULL; // 加 个 v 表示 var， 和 函数 pte ptr 区 分 
24 
2 uint32 t* first pte vaddr in pde = NULL; 
// 用 来 记录 pde 中 第 1 个 pte 指向 的 物理 页 起 始 地 址 
26 uint32 七 pg phy addr = 0; 
党 
28 /* 回收 页 表 中 用 户 空 间 的 页 框 */ 
29 while (pde idx < user pde nr) { 
30 Vv_pde ptr = pgdir vaddr + pde idx; 
31 pde = *v pde ptr; 
32 if (pde & Ox00000001) { 
// 如 果 页 目录 项 p 位 为 1， 表 示 该 页 目录 项 下 可 能 有 页 表 项 
33 Firet pte vaddr in pde = pte ptr(pde idx * Ox400000); 
// 一 个 页 表 表 示 的 内 存 容量 是 4MB， 即 0x400000 
34 pte idx = 0; 
35 while (pte idx < user pte nr) { 
36 Vv_pte ptr = first pte vaddr in pde + pte idx; 
37 pte = xV_ pte ptr; 
38 if (pte & Ox00000001) { 
39 /* 将 pte 中 记录 的 物理 页 框 直接 在 相应 内 存 池 的 位 图 中 清 0 */ 
40 pg_phy_addr = pte & Oxfffff000; 
41 free a phy page (pg _ phy addr); 
42 } 
43 pte_idxt++; 
44 } 
45 /* 将 pde 中 记录 的 物理 页 框 直接 在 相应 内 存 池 的 位 图 中 清 0 */ 
46 pg_phy addr = pde & Oxfffff000; 
47 free a phy page (pg phy _addr); 
48 } 
49 pde_idxt++; 
50 } 
51 
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虚拟 地 址 池 所 占 的 物理 内 存 */ 


(release thread->userprog vaddqr .vaddr bitmap.btmp_ bytes_ len) 


uint8 tx user vaddr pool bitmap = \ 


release thread ->userprog vaddr.vaddr bitmap.bits; 


mfree page (PF KERNEL, user vaddr pool bitmap, 














程 打 开 的 文件 */ 
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52 /* 回收 
总 uint32 t bitmap pg_cnt =\ 
/ PG SIZE; 
54 
55 
56 
57 /* 关闭 i 
58 uint8 t fd idx = 3; 
59 
60 站 
61 
62 } 
63 hb 
64 } 
65 1} 


函数 release_prog_resource 接受 1 个 参数 ， 待 释放 的 全 


whilel(fd idx < MAX FILES OPEN PER PROC) { 
(release thread->fd table[fdq idx] != 
sys_close (fd idx); 














源 包括 : 页 表 中 的 物理 

















函数 中 先 完 成 的 


pcb->userprog vaddr 回 | 

















实现 fork 时 为 复制 
17 行 
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ly 














名 25 行 


Ry 





Rsy 




















页 、 虚 拟 内 存 池 占 物理 页 、 关 闭 打开 的 文件 。 











工作 是 巨 





收 页 表 中 的 




















发， 检查 位 图 中 被 置 为 1 的 bit， 计 算出 相 
对 直接 一 点 ， 直 接 遍 历 页 表 ， 如 果 页 表 的 p 位 为 1， 这 说 明 已 经 分 


物理 页 框 ， 加 











bitmap_pg_cnt); 


F 务 release_thread， 功 能 是 释放 任务 的 资源 ， 资 











收 的 方法 有 两 种 ， 一 是 按照 虚拟 内 存 池 
应 虚拟 地 址 ， 





区 





收 。 另 一 种 方法 相 





逐 位 
































的 变量 user_pde_nr 表示 用 户 空 间 中 pde 的 数量 ， 
21 行 的 变量 user_pte_nr 表示 每 个 页 表 中 pte 的 数据 ，] 
的 变量 first_pte_ vaddr in pde 表示 pde 中 第 0 个 
有 29 一 50 行 通过 两 层 while 循环 回收 页 表 中 


,下 大 A 


























] 户 空间 




















细 说 了 ， 大 体 上 是 在 乡 

页 表 ， 为 什么 说 可 能 有 了 呢 ? 原因 是 回收 内 存 空间 时 ， 页 表 : 
pde 并 不 释放 ， 也 就 是 说 pde 中 的 页 表 地 址 还 在 ， 

能 表示 的 内 存 范围 是 1024*4KB=4MB， 一 个 pde 便 表示 

















配 了 物理 页 框 。 
j 户 地 址 空间 用 过 了 ， 现 在 咱们 尝试 第 二 种 方法 。 
其 值 为 768，pde_idx 表示 pde 的 索引 值 ， 从 0 起 。 
其 值 为 1024，pte idx 表示 pte 的 索引 值 ， 从 0 起 。 
pte 的 地 址 ， 主 要 是 
的 页 框 ， 大 伙 儿 能 看 到 这 ， 代 码 肯 定 是 不 需要 
层 循环 中 判断 页 目录 中 的 pde， 如 果 pde 的 p 位 为 1， 表 示 该 pde 中 “可 能 ”会 有 








第 1 种 方法 咱们 已 经 在 






































它 来 遍历 页 表 ， 








所 有 pte。 
























































pde idx 的 值 ， 推 算出 









































虚拟 地 址 范围 

















于 该 物理 页 的 起 始 地 址 便 可 。 第 33 行 的 first pte_vaddr in _pde 通 
第 0 个 pte 的 虚拟 地 址 。 














的 是 通过 虚拟 地 址 














pte 的 P 位 为 1， 表 示 已 分 配 了 物理 
接 下 来 第 353 一 55 行 是 下 






































收 用 户 

















以 上 代码 我 想 应 该 不 用 解释 了 。 





下 面 是 第 二 部 分 ， 


略 


67 /* list traversal 


68 
static bool fi 


struct tas 


见 代 码 15-33-2。 


代码 15-33-2 





的 下 








调 函 数 ， 


页 ， 将 其 通过 free a_phy_page 回 
虚拟 地 址 池 所 占 的 物理 内 存 , 最 后 
































遍历 页 表 中 的 所 有 








pte。 























过 pte_ptr 函数 获取 第 pde_idx 


收 。 























* 查找 pelem 的 parent_pid 是 否 是 ppidq， 成 功 返 匠 
nd child(struct list elem* pe 








/* elem2entry 中 间 的 参数 all list t 


k_ struct* pthread = \ 





true， 失 败 则 返 























ag 取决 于 





elem2entry(struct task struct, all list tag, pelem); 


LE 





74 } 
return fal 
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Teturn: trues 


/* list traversal 的 区 
* 查找 状态 为 TASK_HANGING 的 人 
static bool find hanging child(struct list elem* pelem, int32 t ppid) { 


(pthread->parent pid == ppid) { 
// 若 该 任务 的 parent _ pid 为 ppid， 返 区 











// list traversal 只 有 人 在世 

















调 函 数 返 下 











// 继续 遍历 ， 所 以 在 此 返 世 


se; // 让 list trav 











调 函数 ， 

















true 








ersal 继续 传递 下 一 个 元 素 


E 务 */ 








的 pte 很 可 能 被 回收 干净 了 ， 但 该 页 表 所 在 的 
当初 是 为 了 减少 页 表 的 频繁 变动 而 有 意 为 之 。 一 个 页 表 
个 页 表 ， 故 我 们 可 以 根据 当 
， 有 了 这 个 范围 便 足 够 了 ， 无 需 精确 到 具体 ， 只 要 知道 虚拟 地 址 对 应 





前 是 第 几 个 pde， 即 


























大 二 


个 页 表 中 


























内 层 循环 用 来 遍历 每 一 个 pte， 如 果 
名 58 一 64 行 是 关闭 进程 打开 的 文件 ， 





( project/c15/i/userprog/wait_exit.c ) 


false */ 


lem, int32 t ppid) { 
pelem 对 应 的 变量 名 */ 


true 时 才 会 停止 


81 struct task struct 


pthread->status == 


83 return true; 
84 } 

85 return false; 

8.6. 寺 

87 


* pthread = elem2entry(struct task struct,\ 
all list tag, pelem); 

82 if (pthread->parent pid == ppid &&\ 

TASK HANGING) { 











88 /* list traversal 的 回调 函数 ， 
89 * 将 一 个 子 进 程 过 继 给 init */ 














90 static bool init adopt a childl(struct list elem* pelem, int32 七 piq 
* pthread = elem2entry(struct task struct,\ 




















// 若 该 i 








程 的 parent_pid 为 pid， 返 区 





// 让 list traversal 继续 传递 下 一 个 元 素 


91 struct task struct 
all list tag, pelem); 
92 if (pthread->parent pid == pid) { 
93 pthread->parent pid = 1; 
94 } 
95 return false; 
9:6:/ 守 
… 略 


函数 fmnd child 是 list_traversal 的 回调 函数 ， 功 

















败 则 返回 false。 函 数 实现 挺 直 




















的 ， 就 是 找 父 进程 





能 是 查找 


pid 为 ppid 的 子 进程 ， 找 到 后 返 





pelem 的 parent_pid 是 否 是 ppid， 成 功 返 回 tue， 失 
true， 大 伙 儿 自己 看 下 吧 。 














I 




















函数 fnd hanging_child 是 专门 找 状 态 为 TASK HANGING 的 子 进程 ， 同 上 面 的 find_child 类 似 ， 只 是 多 


了 个 状态 判断 。 


函数 init_adopt_a_child 也 是 list_traversal 的 





可 调 函 数 ， 


























使 init 作为 该 进程 的 父 进程 。 实 现 也 很 简 


代码 15-33-3 















































98 /* 等 待 子 进程 调用 exit， 将 子 进程 的 退 t 


































































































功能 是 将 parent_pid 等 于 pid 的 进程 过 继 给 init， 























EE， 不 说 啦 。 下 面 看 最 后 一 部 分 ， 见 代码 15-33-3。 





( project/c15/i/userprog/wait_exit.c ) 


状态 保存 到 status 指向 的 变量 . 





















































































































































































































































99 * 成 功 则 返回 子 进程 的 pid， 失 败 则 返回 -1 */ 
00 pid t sys wait (int32 t* status) { 
01 struct task struct* parent thread = running thread(); 
02 
03 while(1) 
04 /* 优先 处 理 已 经 是 挂 起 状态 的 任务 */ 
05 struct list elem* child elem = list traversal (&thread all list,\ 
find hanging child, parent thread->pid); 
06 /* 若 有 挂 起 的 子 进程 */ 
07 if (child elem != NULL) { 
08 struct task struct* child thread = \ 
elem2entry(struct task struct, all list tag, child elem); 
09 *status = child thread->exit status; 
0 
1 /* thread exit 之 后 ，pcb 会 被 回收 ， 因 此 提前 获取 piqd */ 
2 uint16 t child pid = child thread->pid; 
3 
4 /* 2 从 就 绪 队 列 和 全 部 队列 中 删除 进程 表 项 */ 
5 thread exit (child thread, false); 
// 传 入 false, 使 thread exit 调用 后 回 到 此 处 
6 /* 进程 表 项 是 进程 或 线程 的 最 后 保留 的 资源 ， 至 此 该 进程 彻底 消失 了 */ 
7 
8 return child pid; 
9 } 
20 
21 /* 判断 是 否 有 子 进程 */ 
22 child elem = list traversal (&thread all list,\ 
find child, parent thread->pid); 
23 if (child elem == NULL) { // 若 没 有 子 进程 ， 则 出 错 返 回 
24 return -1; 
29 } else 
26 /* 车子 进程 还 未 运行 完成 ， 即 还 未 调用 exit， 则 将 自己 挂 起 ， 
直到 子 进程 在 执行 exit 时 将 自己 唤醒 */ 
5 thread block (TASK WAITING); 
28 } 
29 } 
30 } 
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/* 





53 
54 } 





函数 sys_wait 接收 一 个 参数 ， 存 
程 的 退出 状态 

函数 开头 先 ? 
在 第 103 行 通过 list_traversal 在 全 部 队列 thread all list ! 
程 pid (parent pid) 为 parent thread->pid， 
经 退出 的 进程 。 
[I 果 有 已 退出 的 子 进程 ， 








FF 


义 过 
先 处 开 
妇 













































































统 交 互 
子 进程 用 来 结束 自己 时 调用 */ 
































void sys exit (int32 七 status) 
struct task struct* child thread 


{ 


running thread(); 


child thread->exit status = status; 








if (child thread->parent pid == -1) { 

PANIC ("sys exit: child thread->parent pid is -1\n"); 
} 
/* 将 进程 chilg_thread 的 所 有 子 进程 都 过 继 给 init */ 




















list traversal (&thread all 


收 六 




















口 








/* 程 child_ thread 的 资 








-ist, Tinit adopt..d child,; 


原 */ 


release prog resource (child thread); 











EE 


























/* 如 果 父 进程 正在 等 待 子 进程 退出 











struct task struct* parent thread 
hild thread->parent pid); 


pid2thread(c 












































和 《NA 
， 付 义 


程 唤醒 */ 
= 
































if (parent thread->status == TASK WAITING) { 
thread unblock (parent thread); 

} 

/* 将 自己 挂 起 ， 等 待 父 进程 获取 其 status， 并 回收 其 pcb */ 











thread block (TASK HANGING); 








保存 到 status 指 问 的 变量 
周 用 running thread 获 和 


o 

















就 在 














中 获取 子 进程 的 状态 到 status 中 ， 然 后 第 112 行 获取 子 进 








从 队列 中 删除 ， 这 里 传 给 thread_exit 的 第 二 个 





口 








S 
ce 


























函数 开头 先 i 
exit_status 中 。 

当前 退出 的 进 
通过 回调 函数 init adopt a_child 将 


因为 我 们 还 要 在 


面 看 过 函数 sys_exit 之 后 ， 大 伙 儿 和 
函数 sys_exit 接受 一 个 参数 ， 退 出 状态 status， 此 函 





A 
EPE 














118 行 把 子 






































第 122 行 ， 如 果 没 有 已 退出 的 子 进程 ， 
返回 -1， 如 果 有 子 进 程 ， 此 时 说 明 它 





因此 在 第 127 行 执行 “thread block(TASK _ WAITING)” 阻 塞 民 








人 赃 子 进程 返回 值 的 地 址 status， 功 能 是 



































child thread->pid); 














等 待 子 进程 调 





] exit， 将 子 进 





parent_thread， 接 着 是 一 个 while 循环 ， 





导 当 前 任务 ， 也 就 是 父 进程 
裔 历 ， 通 过 区 





























调 函 数 find_hanging_child 过 滤 出 




















第 108 一 118 行 开始 做 善后 工作 。 先 在 第 109 行 从 子 进 
程 的 pid 到 child_ pid 中 ， 随 后 
参数 是 false， 即 表示 调用 thread_exit 后 还 要 
进程 的 pid， 即 child pid 返 























鞍 


o 














省 且 status 为 TASK HANGING 的 子 进程 。 此 处 是 为 了 优 























程 的 exit_status 
j thread_ exit 把 子 进程 
回来 ， 并 不 是 一 去 不 











周 









































这 时 候 再 遍历 一 次 查看 是 否 有 子 进 程 





的 状态 必然 不 是 TASK_HANGING， 人 也 裔 


上 ，» 如 果 没 有 ， 就 在 第 124 行 
是 说 子 进程 尚未 调用 exit， 










































































1 
已 ， 























pA 

















周 用 


running thread 获 





本 





知道 子 进程 是 怎 


旦 


样 把 它 唤醒 的 了 。 




















直到 了 





进程 执行 exit 时 把 自己 唤醒 。 下 








数 是 子 进 














程 有 可 能 还 有 子 进 程 ， 

















于 是 在 第 141 行 











自己 的 














程 还 没 
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第 144 行 调 


第 147 行 
进程 退出 ， 如 果 父 进程 正在 等 待 E 
“thread_ unblock (parent thread)” 

最 后 通过 thread block ; 
程 已 经 退出 了 ， 可 以 获取 退出 状态 值 ， 并 

好 啦 ， 代 码 部 分 到 
代码 了 ， 下 节 咀 们 利 月 











子 进程 全 部 过 继 给 init。 


EE 








ea 




















父 进 程 在 


SR 




















Me 








j release_prog_resource 释放 


来 收 走 呢 ， 因 此 pcb 和 











,除了 pcb 以 外 的 资源 ， 您 懂 


程 用 来 结束 自己 时 调用 。 
自己 的 pcb， 即 child thread， 随 后 将 status 存 入 自己 pcb 的 





周 用 list_traversal 遍历 全 部 队列 thread_all list， 





的 ，pcb 中 的 exit_status 父 进 























调用 wait 获取 其 状态 时 再 


口 






































过 函数 pid2thread 获 条 





过 









































年 
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己 的 父 进程 parent thread， 第 148 行 判断 父 进程 
己 ， 其 状态 status 应 该 为 TASK_WAITING， 于 是 在 
巴 父 进程 唤醒 
己 挂 起 ， 并 将 


收 了 。 



































自己 的 状态 置 为 TASK HANGING， 这 样 父 进 程 便 知道 子 进 











回收 









































0 系统 调用 wait 和 exit， 











自己 的 pcb。( 说 到 这 里 
说 完了 ， 接 下 来 就 是 添 力 
有 上 这些 代码 做 点 实事 ， 本 节 到 这 就 结束 啦 ， 大 伙 儿 六 苦 了 。 


阵 伤 感 凝重 。) 
这 个 大 伙 儿 不 用 说 了 吧 ， 不 单独 贴 

















15.6.5 “实现 cat 命令 
直 以 来 0 
们 实现 一 个 简单 的 cat， 

目前 我 们 系统 中 的 系统 调 





















































最 后 的 exit 和 wait 是 我 悄悄 安装 好 的 。 
用 死 循 环 “ 卡 住 ”程序 了 。 前 面 说 过 了 ， 进 程 






























































自 们 缺少 个 查看 文件 的 命令 ， 在 Linux 中 最 著名 的 文件 查看 工 
真 的 非常 简单 ， 不 支持 选项 参数 ， 



































如 图 15-15 所 示 。 








LL 莫 过 于 cat 命令 了 ,今天 


只 能 查看 普通 文本 文件 
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SYSCALL_NR { 


SYS_GETPID, 
SYS_WRITE, 
SYS_MALLOC， 
SYS_FREE， 
SYS_FORK， 
SYS_READ， 
SYS_PUTCHAR, 
SYS_CLEAR, 
SYS_GETCWD， 
SYS_OPEN, 
SYS_CLOSE, 
SYS_LSEEK, 
SYS_UNLINK, 
SYS_MKDIR, 
SYS_OPENDIR, 
SYS_CLOSEDIR, 
SYS_CHDIR, 
SYS_RMDIR, 
SYS_READDIR， 


SYS_REWINDDIR， 


SYS_STAT， 
SYS_PS， 
SYS_EXECV， 
SYS_EXIT， 
SYS_WAIT 








汶 世 




















于 我 人 


都 会 调 


























用 











15-15 系统 调 


门 已 经 实现 exit 和 wait,， 1 
wait， 无 论 是 进程 



































们 现在 不 
己 调 用 





在 函数 结束 处 


wait， 还 是 由 C 运行 库 






























































( project/c15/i/command/start.S ) 















































值 ， 这 是 ABI 规定 的 





调用 ， 现 在 咱们 把 exit 加 入 到 我 们 的 简陋 C 运行 库 中 ， 见 代码 15-34。 
代码 15-34 
1 "bits 3 
2 extern main 
3 extern exit 
4 section .text 
5 Vlobal tartk 
6 _start: 
六 ;下面 这 两 个 要 和 execv 中 1o0ad 之 后 指定 的 寄存 器 一 致 
8 Push ebx ; 压 入 argv 
9 push ecx ; 压 入 argc 
10 call main 
和 
12 ;将 main 的 返回 值 通过 栈 传 给 exit，gcc 用 eax 存储 返 区 
13 push eax 
14 call exit 
15 ;exit 不 会 返 区 

















start.S 的 主要 变更 是 第 12 行 ， 根 据 ABI 规定 ， 陋 





如 

















口 


值 eax 明 





第 13 行 把 main 的 返 





E 栈 ， 这 是 为 第 14 行 Y 























户 进程 差不多 就 结束 ] 
下 面 是 今天 的 主角 ， 简 易 














#include "syscall.h" 
#include "stdio.h" 
#include "string.h" 


， 后 面 是 内 核 开始 为 其 








口 





Wx 


[一 
J 








版 cat 的 实现 ， 


代码 15-35 








周 用 exit 系统 调 
收 资源 ， 父 进程 获取 子 进程 的 返 
定义 在 command/cat.c 中 ， 见 代码 15-35。 


OOOODP 


int main (int Aargce; Char** argv) 1 
if (argc > 2 || argc == 1) { 


值 是 在 eax 寄存 器 中 。 在 第 10 行 调用 main 之 后 ， 
压 入 的 参数 ， 相 当 于 exit(eax)。 到 这 用 
值 ， 然 后 回收 子 进程 pcb。 












































加 




















I 





I 

















( project/c15//command/cat.c ) 
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6 printf("cat: only support 1 argument .Aneg: cat filenameNn" ) 
| exit (-2); 

8 } 

9 int buf size = 1024; 

0 char abs path[512] = {0}; 

1 void* buf = malloc (buf size); 

2 if (buf == NULL) { 

3 printf("cat: malloc memory failed\n"); 

4 return -1; 

5 
6 
7 
8 


} 





if: "(argv[LT[O Te /yy 未 
getcwd (abs path, 512); 
strcat (abs path, ™/"); 

9 strcat (abs path, argv[1]); 
20 } else { 
pel. strcpy(abs path, argv[1]); 
2 } 
3 int fd = openl(abs path, O RDONLY); 
24 if (fd == -1) { 
25 printf("cat: open: open %s failed\n", argv[1]); 
26 return -1; 
2.7 } 
28 int read bytes= 0; 
29 while (1) { 
30 read bytes = readl(fd, buf, buf size); 
3 If (read bytes == -1) { 
32 break; 
33 } 
34 write(1l, buf, read bytes); 
35. } 
36 free (buf); 
37 close (fqd); 
38 return 66; 
对 
































函数 开头 对 参数 个 数 判断 ， 咱 们 的 cat 只 支持 1 个 参数 ， 就 是 待 查看 的 文件 名 。 如 果 参 数 个 数 大 于 2 

或 者 没有 参数 ， 也 就 是 argc 为 1， 那么 输出 报错 后 就 调用 “exit(-2)” 退 出 ， 此 处 传 入 的 状态 值 为 -2。 
接着 通过 malloc 从 堆 中 了 1024 字 节 的 内 存 用 作 缓 冲 区 buf, 512 字 节 的 abs_path 用 于 存储 参数 的 
绝对 路 径 。 
第 16 一 22 行 处 理 参数 文件 的 路 径 为 绝对 路 径 ， 之 后 存 入 到 abs_buf 中 。 
第 23 行 通过 open 打开 参数 文件 ， 第 29 一 35 行 循环 读 取 文 件 ， 然 后 通过 write 输出 ， 直 到 read 返回 
值 为 -1， 也 就 是 一 直 读 到 文件 尾 。 

最 后 释放 buf 并 关闭 参数 文件 ， 把 66 作为 返回 值 返回 。 

下 面 是 编译 脚本 compile.c， 它 实现 的 功能 大 伙 儿 都 清楚 了 ， 具 体 见 代码 15-36。 


代码 15-36 (project/c15/i/command/compile.sh ) 
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iT 






























































1 #### ”此 脚本 应 该 在 command 目录 下 执行 

之 

3.Lf, LL Sd Ti eAlib® 下 d,s/buiLdY J]ithen 

4 echo "dependent dir don\‘t exist!" 

5 cwd=$ (pwd) 

6 cwd=$ {cwd##*/} 

7 cwd=$ {cwd%®/} 

8 if [[ $cwd != "command" ]];then 

9 echo -e "youN qd better in command dir\n" 

0 fi 

dL exit 

pa 下 

电 

4 BIN="cat" 

5 CFLAGS="-Wall -c -fno-builtin -W -Wstrict-prototypes \ 
6 -Wmissing-prototypes -Wsystem-headers" 

7 LIBS="-I ../lib/ -I ../lib/kernel/ -I ../lib/user/ -I \ 
8 ../kernel/ -I ../device/ -I ../thread/ -IN 
9 /USerprog/. -1 /£8/- -I /Shell/™ 
20 OBJS="../build/string.o ../build/syscall.o \ 


DD_IN=$BIN 
DD_OUT="/home/ 


nasm -f elf ./ 
ar rcs Simple 
gcc $CFLAGS $L 
ld $BIN".o" si 
SEC_CNT=$ (ls - 
if 


ET 过 SBIN 





脚本 中 的 dd 命令 会 将 


../build/stdio.o 


在 command 目录 下 执行 sh compile.sh 后 ， 当 前 command 目录 下 就 生成 了 cat 命令， 共 


../build/assert.o start.o" 
work/my_ workspace/bochs/hd60M.img" 


Start.S -o ./start.o 
crt.a SOBUS start.o 

TBS' GO BING ,SBIN" EY" 
mple crt.a -o $BIN 

1 SBINIawk, "(printf("sa", (S55LT1)y/5012)}") 


] ] ?then 


dd if=./SDD_IN of=$DD OUT bs=512 \ 
Count=$SEC CNT seek=300 conv=notrunc 








大 小 是 5476 字 节 ， 














其 写 入 hd60M.img 的 第 300 个 扇 区 以 后 。 
































有 了 wait 之 后 ， 咱 











们 要 把 相关 的 “while(1)” 去 掉 ， 首 先是 shell.c， 见 代码 15-37。 









































































































































































































































































































































代码 15-37 (project/c15/i/shell/shell.c ) 
… 略 
55 } else { // 如 果 是 外 部 命令 ， 需 要 从 磁盘 上 加 载 
56 int32 t pid = fork(); 
57 if (pid) { // 父 进程 
58 int32 七 status: 
59 int32 t child pid = wait (&status); 
// 此 时 子 进程 若 没有 执行 exit,my_shell 会 被 阻塞 ， 不 再 响应 键入 的 命令 
60 if (child piqd == -1) { 
// 按理 说 程序 正确 的 话 不 会 执行 到 这 句 ，fork 出 的 进程 便 是 she11 子 进程 
61 panic("my_ shell: no child\n"™); 
62 } 
63 printf("child pid %d, it's status: %d\n", child pid, status); 
64 } else { // 子 进程 
65 make clear abs path(argv[0], final path); 
66 argv[0] = final path; 
67 /* 先 判 断 下 文件 是 否 存在 */ 
68 struct stat file stat; 
69 memset (&file stat, 0, sizeof(struct stat)); 
70 if (stat(argv[0], g&file stat) == -1) { 
a printf("my shell: cannot access %s: 
No such file or directory\n", argv[0]); 
/ 汉 exXit (-1); 
3 } else { 
74 execv (argv[0], argv); 
75 } 
76 } 
和 } 
… 略 
第 157 一 159 行 ，shell 派生 出 子 进程 后 ， 父 进程 调用 wait 等 待 子 进程 的 返回 值 。 理 论 上 外 部 命令 就 是 
shell 的 子 进程 ， 如 果 正 常 的 话 ， 不 会 执行 到 第 160 一 162 行 的 代码 。 第 163 行 输出 子 进程 pid 及 返回 值 。 
在 第 165 一 175 行 的 子 进程 中 ， 如 果 外 部 命令 的 路 径 不 存在 ， 就 在 第 172 行 调用 “exit(-1)” 返 回 ， 否 
则 在 第 174 行 执行 参数 argv[0] 指 向 的 进程 。 
好 啦 ， 下 面 我 们 把 cat 写 入 分 区 sda 的 根 目录 ， 见 代码 15-38。 
代码 15-38 (project/c15/i/kernel/main.c ) 
… 略 
21 int main(void) { 
22 put_str("I am kernel\n"); 
2.3 于 站 于 世 训 卫 下 (从 池 
24 
25 /太太 大火 大 大 类 炎炎 大 大大 大 写 入 应 程序 大 大 大 大 类 大 大 大 大 大 大 大 大 / 
26 uint32 t file size = 5476; 
2 uint32 t sec cnt = DIV _ ROUND UP (file size, 512); 
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第 15 章 系统 交互 
28 struct disk* sda = &channels[0] .devices[0]; 
29 void* prog buf = sys malloc (file size); 
30 ide read(sda, 300, prog buf, sec cnt); 
31 int32 七 fd = sys_ open("/cat", O_ CREAT|O RDWR); 
32 if (fd != -1) { 
人 if(sys writel(fd, prog buf, file size) == -1) { 
34 printk("file write error!\n"); 
3.5 while(1); 
36 } 
337 
38 / 术 太 大大 大 大 大 类 类 大 类 大 大 写 入 应 程序 结束 大 大 大 炎炎 大 大 大 类 类 大 大大/ 
39 cls screen(); 
40 console put str("[rabbit@localhost /]$ "™); 
41 thread exit (running thread(), true); 
42 return 0; 
43 } 
44 
45 /* init 进程 */ 
46 void init(void) { 
47 uint32 t ret pid = fork(); 
48 if(ret pid) { // 父 进程 
49 int status; 
50 int. ‘child: Plad; 









































51 /* init 在 此 处 不 停 地 回收 僵尸 进程 */ 

a while(1) { 

53 child pid = wait (&status); 

54 printf("I‘m init, My pid is 1, I recieve a chilgd, 
It ss pid is %d, status is %d\n", child pid, status); 

55 } 

56 } else { // 子 进程 

SY my_shell (); 

58 } 

59 panic("init: should not be here") ， 

60 }.… 略 


除了 在 第 26 一 37 行 写 入 cat 命令 外 ， 还 另外 做 了 两 件 事 ， 一 件 
(running thread(), true)” 退 出 了 ， 





init 进程 中 ， 








好 啦 ， 代 码 部 分 就 这 样 
是 两 行 “hello,world”， 








是 主线 程 在 第 
































主线 程 使 命 结束 后 “请 辞 ” 了 ， 















































第 52 行 的 while 中 ， 























让 我 们 永远 把 
循环 调用 wait， 为 过 继 给 它 的 子 进程 做 善后 工作 。 


它 记 在 心 

















了 ， 根 目录 下 已 经 有 了 文件 filel， 
似乎 未 能 尽兴 ， 那 我 悄悄 把 cat.c 写 入 到 /dirl/ 下 吧 。 















































下 面 两 张 图 是 运行 结果 ， 请 大 伙 儿 过 目 。 





41 行 调用 











“thread exit 

















下 面 可 以 测试 cat 命令 。 不 过 filel 的 内 容 就 


里 。 另 外 就 是 在 












































15-16-1 中 先 执 行 了 “ls -1” 命 令 查 看 文件 的 写 入 结果 ，cat 命令 已 经 在 根 目录 下 存在 了 。 接 着 执行 
“cat filel ”查看 filel 的 内 容 ， 屏 幕 打 印 了 两 行 “helloworld” 这 是 在 很 久 很 久 以 前 咱们 就 写 好 的 文件 。shell 





也 输出 了 子 进程 的 pid 为 2， 返 回 值 为 66。 下 面 调 用 ps 命令 显示 任务 列表 ， 





















































了 ， 由 于 之 前 
换 了 “while(1)” 后 ，idle 线程 都 开始 
只 是 中 断 信 号 让 其 “复活 ”反复 运行 。 

月 ls 命令 查看 dirl 目录 ,上 


在 用 exit 
挂 起 状态 ， 


接着 月 























































































































人 眉 / 





我 用 cat 查看 了 一 个 不 存在 的 路 径 “dir/cat.c”， 该 目录 应 该 是 











“dirl/cat.c”, 














2， 返 回 值 为 














15-16-2 所 示 是 已 经 执行 “cat dirl/cat.c” 的 结果 ， 由 于 屏幕 比较 小 ， 
容 履 盖 了 。 父 进程 shell 输出 子 进程 pid 是 2， 返 回 值 为 66。 


输出 子 进程 pid 是 2， 返 回 值 为 -2。 
另外 ， 大 伙 儿 应 该 发 现 了 ， 





pid 始终 可 用 。 


好 啦 ， 本 节 到 这 
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1。 下 面 继续 看 图 15-16-2。 
















































































就 结束 了 ， 感 谢 大 伙 儿 收看 。 











这 时 候 熟 悉 的 main 线程 已 经 没有 
各 任务 都 在 最 后 加 入 了 死 循环 “while(1)”” 所 有 任务 都 非常 忙碌 ，idle 线程 一 直 没 机 会 运行 ， 现 


六 活 了 ， 这 说 明 系 统 负载 降下 来 了 ， 大 部 分 时 间 系统 都 处 于 





面 是 我 私下 上 传 的 cat.c， 然 后 为 了 查看 错误 情况 下 子 进 程 的 返回 值 ， 














于 是 shell 输出 为 子 进程 pid 为 


所 以 输入 的 命令 被 cat.c 的 内 
最 后 执行 了 无 参数 的 cat 命令 ， 父 进程 shell 
咱们 任务 的 pid 始终 是 2， 这 说 明 已 逝 任 务 的 pid 正常 释放 了 ， 之 前 main 


线程 的 pid 为 2， 它 退出 后 ，pid 就 空 出 来 了 ， 不 断 分 配给 新 的 子 进程 ， 子 进程 又 不 断 释 放 该 pid， 所 以 该 


Bochs x86 emulator, http://bochs.sourceforge.net/ 
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se 
A 
: 168 
168 
168 
本 下 下 全 和 
96 dir1 
4777 prog_no_arg 


HA filel 


3 Status: bb 


PPID 
NULL 


STAT 
WAITING 


COMMAND 
init 


NULL BLOCKED 1157166 


RUNNING 167 


idle 
E 1 init 
[rabbite@localhost /1$ ls dirl 
"diriil catse 
lhost “]9 cat dir/cat.c 
/dir/cat.c: Not a directory, 
n dir/cat.c failed 
， it” 332. 


subpath /dir is'‘t exist 
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i 

strcpy(abs_path, argv[1]1); 

了 

int fd = open(abs_path, 

if (fd == -1) + 
printf ("cat: 
return -1; 


0_RDONLY); 


[3 


} 
int read_ bytes= 0Q; 
while (1) 1{ 
read_bytes = read(fd, buf, buf 
if (read_bytes == -1) { 
break; 
了 
write(1，buf ， 


_size); 


read_bytes); 
了 
free(Cbuf ) 
close(Cfd): 
return 66; 
} 
hild pid 2, it’s status: 66 
[rabbit@localhost /]9 cat 
at: only support 1 argument. 
2g: cat i 
hild pid 2, it’s status: -2 
Labb tio incst lc 


IPS: 24.379MH | | ho:0-ml 
A 图 15-16-2 ”cat 命令 运行 结果 2 





















































本 节 我 们 将 实现 管道 
道 操作 。 


系统 调用 ， 有 了 该 功能 后 ， 





我 们 可 以 支持 父子 进程 通信 ， 











并 日 在 shell 中 支持 管 
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15.7.1 管道 的 原理 


进程 虽然 是 独立 运行 的 个 体 , 但 它们 之 间 有 时 候 需 要 协作 才能 完成 一 项 工作 ， 比 如 有 两 个 进程 需要 同 
步 数据 ， 进 程 A 把 数据 准备 好 后 ， 想 把 数据 发 往 进程 B， 进 程 B 必须 被 提前 通知 有 数据 即将 到 来 ， 或 者 
进程 A 想 发 送信 号 给 进程 B， 以 控制 进程 B 的 运行 模式 ， 再 或 者 数据 被 多 个 进程 共享 时 ， 数 据 变 更 后 应 
该 被 所 有 进程 看 到 ， 总 之 诸如 此 类 的 需求 很 多 ， 操 作 系统 必须 要 实现 进程 间 的 相互 通信 。 
进程 间 通 信 方 式 有 很 多 种 ， 有 消息 队列 、 共 享 内 存 、socket 网 络 通信 等 ， 还 有 一 种 就 是 管道 。 鉴 于 能 
人 块 儿 讨论 下 管道 的 原理 。 

首 是 通信 的 方式 之 一 ,在 Linux 中 一 切 丝 文件 ， 因 此 管道 也 被 视 为 文件 ， 
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在 于 文件 系统 上 ， 而 是 只 存在 于 内 存 中 。 既 然 是 文件 ， 管 道 就 要 按照 文件 操作 的 函数 来 使 用 ， 因 此 也 要 使 
用 open、close、read、write 等 方法 来 操作 管道 。 管 道 通常 被 多 个 进程 共享 ， 而 且 存在 于 内 存 之 中 ， 因 此 
共享 的 原理 是 所 有 进程 在 地 址 空间 中 都 可 以 访问 到 它 , 所 以 您 肯定 猿 到 了 , 管道 其 实 就 是 内 核 空间 中 的 内 
存 缓冲 区 。 当 然 ， 进 程 间 通信 也 可 以 通过 文件 系统 ， 也 就 是 说 多 个 进程 可 以 共同 读 写 磁盘 上 的 同一 个 文件 
来 实现 数据 共享 ， 但 毕竟 比较 慢 。 

管道 是 用 于 存储 数据 的 中 转 站 ， 当 某 个 进程 往 管道 中 写 入 数据 后 ， 该 数据 很 快 就 会 被 另 一 个 进程 读 取 ， 
之 后 可 以 用 新 的 数据 覆盖 老 数 据 ， 继 续 被 别 的 进程 读 取 ， 因 此 管道 属于 临时 存储 区 ， 其 中 的 数据 在 读 取 后 可 
被 清除 ,按理 说 , 是 存储 区 就 应 该 有 个 空间 大 小 , 它 的 空间 该 多 大 才 合 适 呢 ? 似乎 这 取决 于 所 写 入 的 数据 量 ， 
但 数据 量 可 大 可 小 ， 没 有 上 限 ， 可 以 大 到 无 穷 ， 也 可 以 小 到 1 字 节 。 可 是 ， 如 果 缓 冲 区 小 了 就 会 于 数据 ， 大 
了 又 无 止境 ， 多 大 的 物理 内 存 都 不 够 ， 很 难 给 个 具体 的 大 小 。 生 活 中 给 别人 买 衣服 是 最 头疼 的 事 了 ， 因 为 就 
怕 买 大 了 或 买 小 了 ， 即 使 是 对 方 穿着 不 合身 ， 人 家 也 不 好 意思 让 你 给 退 了 ， 好 纠结 …… 因 此 最 好 给 他 们 买 有 
弹力 的 衣服 。 管 道 也 需要 这 种 “弹力 ”的 缓冲 区 ， 但 这 种 “弹力 ”并 不 是 指 缓冲 区 可 大 可 小 ， 而 是 指 一 种 可 
以 写 入 无 穷 无 尽 的 数据 而 不 会 有 数据 丢失 的 策略 。 卖 了 这 么 大 的 关子 ， 其 实 这 个 弹力 就 是 指 “环形 缓冲 区 ” 
管道 是 个 环形 缓冲 区 ， 我 们 在 之 前 介绍 生产 者 消费 者 问题 时 已 经 使 用 过 环形 缓冲 区 了 ， 就 是 咱们 的 
ioqueue， 键 盘 输 入 缓冲 区 就 是 用 它 来 实现 的 ， 想 到 这 似乎 觉得 很 欣 感 ， 毕 竟 学 习 成 本 少 了 一 些 。 回 顾 一 
下 ， 对 环形 缓冲 区 的 维护 ， 主 要 是 协调 好 数据 读 写 的 两 个 指针 ， 以 及 生产 者 、 消 费 者 的 休 眼 时机。 环形 缓冲 
区 中 一 个 指针 用 于 读数 据 ， 另 一 个 用 于 写 数据 。 当 缓冲 区 已 满 时 ， 生 产 者 要 睡眠 ， 并 在 睡眠 前 唤醒 消费 者 ， 
当 缓 冲 区 为 空 时 ， 消 费 者 要 睡眠 ， 并 在 睡眠 前 唤醒 生产 者 。 当 缓冲 区 满 或 空 时 ， 使 一 方 休眠 ， 这 是 保证 数据 
不 丢失 的 方法 。 管 道 其 实 就 是 典型 的 生产 者 和 消费 者 问题 ， 有 关 这 方面 的 介绍 请 参阅 前 面 章 节 的 相关 内 容 。 
管道 有 两 端 ， 一 端 用 于 从 管道 中 读 入 数据 ， 男 一 端 用 于 往 管道 中 写 入 数据 。 这 两 端 使 用 文件 描述 符 的 
方式 来 读 取 ， 故 进程 创建 管道 实际 上 是 内 核 为 其 返回 了 用 于 读 取 管道 缓冲 区 的 文件 描述 符 , 一 个 描述 符 用 

























































































































































































































































































































































































































































































































































































































































































































































































































































































































































































于 读 , 另 一 个 描述 符 用 于 写 。 通常 情况 下 是 用 户 进程 为 内 核 提供 一 个 长 度 为 

2 的 文件 描述 符 数组 ， 内 核 会 在 该 数组 中 写 入 管道 操作 的 两 个 描述 符 , 假设 [ea 进程 wj] 

数组 名 为 但 , 那么 fd[0] 用 于 读 取 管道 ,fd[1] 用 于 写 入 管道 ,进程 与 管道 的 读 入 

写 关 系 如 图 15-17 所 示 。 >| 管 道 | 下- 
您 看 到 了 ， 进 程 创建 了 管道 之 后 ， 自 己 往 管道 中 写 数据 ， 然 后 自己 再 把 数 内 入 















































据 从 管道 中 读 出 来 ， 这 没什么 实际 意义 ， 而 且 管 道 还 白白 占用 了 内 核 的 空间 ， 
违背 了 “进程 间 ” 通 信 的 初 心 。 因 此 通常 的 用 法 是 进程 在 创建 管道 之 后 ， 马 上 
调用 fork， 克 隆 出 一 个 子 进程 ， 子 进程 完全 继承 了 父 进程 的 一 切 ， 也 就 是 说 和 父 进 程 一 模 一 样 ， 因 此 也 继承 了 
管道 的 描述 符 ， 这 为 父子 进程 通信 提供 了 保证 。 父 进程 fork 出 子 进程 后 ， 文 件 描述 符 的 关系 如 图 15-18 所 示 。 

您 看 ， 父 子 进程 完全 一 样 ， 因 此 父子 进程 都 可 以 通过 文件 描述 符 fa[1] 向 管道 中 写 数据 ， 通 过 文件 描述 符 
f4[0] 从 管道 中 读 取 数据 。 对 管道 的 操作 同 对 普通 文件 是 一 样 的 ， 比 如 父 进程 往 管道 中 读 写 数据 后 ， 文 件 要 更 新 读 
写 的 位 置 指针 ， 父 子 进程 的 描述 符 指向 的 是 相同 的 文件 ， 管 道 也 被 视 为 文件 ， 因 此 子 进程 再 操作 管道 时 ， 是 从 父 
进程 管道 操作 之 后 的 新 位 置 处 开始 读 写 的 ， 子 进程 操作 管道 之 后 文件 指针 也 会 更 新 ， 父 进程 也 会 在 新 位 置 处 继续 
读 写 管道 ， 总 之 父子 进程 指向 同一 个 管道 ， 实 现 了 父子 进程 间 的 通信 。 

一 般 情 况 下 ， 父 子 进程 中 都 是 一 个 读数 据 ， 一 个 写 数据 ， 并 不 会 存在 一 方 又 读 又 写 的 情况 ， 因 此 在 父 
子 进程 中 会 分 别 关 掉 不 使 用 的 管道 描述 符 。 比 如 父 进程 负责 往 管道 中 写 数据 ， 它 只 需要 fd[1] 描述 符 ， 因 
此 只 可 以 通过 close 系统 调用 关闭 fd[0]。 子 进程 负责 从 管道 中 读数 据 ， 它 只 需要 fd[0] 描述 符 ， 因 此 只 可 以 通 
过 close 系统 调用 关闭 fd[1]。 这 时 它们 与 管道 的 关系 如 图 15-19 所 示 ， 这 也 是 管道 操作 中 较 常 用 的 做 法 。 

管道 分 为 两 种 : 匿名 管道 和 命名 管道 ， 从 概念 上 就 可 以 知道 ， 这 是 按照 管道 是 否 有 名 称 来 划分 的 。 以 上 
说 的 管道 便 是 匿名 管道 ， 它 没有 名 字 。 由 于 没有 名 字 ， 匿 名 管道 在 创建 之 后 只 能 通过 内 核 为 其 返回 的 文件 描 
述 符 来 访问 ， 此 管道 只 对 创建 它 的 进程 及 其 子 进程 可 见 ， 对 其 他 进程 不 可 见 ， 因 此 除 父子 进程 之 外 的 其 他 进程 
便 不 知道 此 管道 的 存在 ， 故 匿名 管道 只 能 局 限 用 于 父子 进程 间 的 通信 。 
有 名 管道 是 专门 为 解决 匿名 管道 的 局 限 性 而 生 的 ， 在 Linux 中 可 以 通过 命令 mkfifo 来 创建 命名 管道 ， 





























4 图 15-17 ”管道 
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成 功 创建 之 后 便 会 在 文件 系统 上 存在 个 管道 文件 ， 这 使 得 该 管道 对 任何 进程 都 “可 见 ” 因此 多 个 进程 即 
使 没有 父子 关系 也 都 通过 访问 该 管道 文件 进行 通信 。 



















































































和 fd[1] 父 进程 fd[0] | 一- : -| far 父 进程 fd[o] 

中 ,a 子 进程 fdto1 |-.,。 :将 写 ; [Tam] 子 进程 Wo、 
| 写 , 读 | 人 ' 读 
数 ， 入 ; 取 ! 数 数 | 取 
= -二 和 : 
1 六 | 管 道 [二 ..: ,| 管 道生 -一 

内 核 内 核 
4 图 15-18 ”父子 进程 与 管道 4 图 15-19 ”父子 进程 间 通 常 的 管道 操作 




































































有 关 管 道 的 内 容 咱 们 就 介绍 到 这 里 ， 目 前 只 打算 实现 匿名 管道 ， 下 一 节 咀 们 设计 它 的 实现 方式 。 
































15.7.2 ”管道 的 设计 

Linux 除了 支持 标准 的 文件 系统 ext2、ext3、ext4 外 , 还 支持 其 他 文件 系统 , 如 reiserfs、 nfs 和 Windows 
的 ntfs 等 。 为 了 向上 提供 统一 的 接口 ，Linux 加 了 一 层 中 间 层 一 一 VFS， 即 Virtual File System， 虚 拟 文件 
系统 ， 向 用 户 屏蔽 了 各 种 实现 的 细节 ， 用 户 只 和 VFS 打交道 。 

看 看 Linux 是 怎样 处 理 管道 的 。 管 道 对 于 Linux 来 说 也 是 文件 ， 因 此 它 也 需要 用 文件 相关 的 数据 结构 
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来 处 理 管 道 , Linux 是 利用 现 有 的 文件 结构 和 VFS 索引 结 点 的 inode 共同 完成 。 文件 结构 文件 结构 
管道 的 ， 并 没有 单独 为 管道 创建 新 的 数据 结构 ， 结 构 示意 如 图 15-20 所 示 。 0 Py 
文件 结构 中 的 f inode 指向 VFS 的 inode， 该 inode 指向 1 个 页 框 大 小 的 f flags fflags 























内 存 区 域 , 该 区 域 便 是 管道 用 于 存储 数据 的 内 存 空间 。 也 就 是 说 ，Linux 的 管 

















Eno 亲本 
道 大 小 是 4096 字 节 o fop Tal fop 
f_ op 用 于 指向 操作 (OPeration) 方法 ， 也 就 是 说 ， 不 同 的 操作 对 象 有 不 | [过 | - 
























































同 的 操作 方法 ， 针 对 不 同 的 操作 对 象 ，Linux 会 把 f op 指向 不 同 的 操作 例 程 。 : — : 

对 于 管道 来 说 ,f_op 会 指向 pipe_read 和 pipe_write, pipe_read 会 从 管道 的 1 页 sl. 

内 存 中 读 取 数据 ，pipe_write 会 往 管道 的 1 页 内 存 中 写 入 数据 。 4 图 15-20 ”Linux 文件 结构 
了 解 了 Linux 对 管道 的 处 理 后 ， 我 们 决定 “部 分 地 效仿 ”这 种 做 法 ， 注 与 vfs 实现 的 管道 










































































意 这 里 强调 的 是 “部 分 地 效仿 ”因为 我 们 根本 没 法 和 Linux 比 ， 理 由 是 我 们 只 支持 自己 的 文件 系统 ， 完 
全 不 需要 用 VFS 这 个 中 间 层 , 并 且 只 支持 硬盘 操作 ,完全 不 需要 {f_op 来 指定 不 同 的 操作 方法 。 总 之 Linux 
太 强 大 了 ， 它 甩 我 们 几 十 条 街 不 止 , 根本 就 没 法 和 它 比 ， 完 全 不 在 同一 个 次 元 上 ,很 多 管理 结构 我 们 都 不 
存在 ， 因 此 只 要 实现 其 思路 就 好 了 。 下 面 看 看 如 何在 咱们 的 系统 中 实现 管道 。 

咱们 的 文件 结构 不 像 Linux 文件 结构 那么 丰满 , 咱们 仅 包 括 三 个 成 员 , fd_pos 用 于 表示 文件 读 写 位 置 ， 
fd_flags 用 于 表示 文件 操作 方式 , f4_inode 用 于 表示 文件 的 inode 指针 。 按理 说 这 三 个 成 员 的 作用 已 经 固定 
了 ,但 单独 为 实现 管道 再 添加 个 额外 的 数据 结构 就 有 些 浪费 了 ， 再 者 Linux 也 是 整合 了 现 有 资源 实现 的 管 
道 ， 咱 们 也 可 以 复 用 现 有 的 文件 结构 。 

文件 结构 的 成 员 名 称 已 经 是 固定 的 了 ， 再 改变 的 话 成 本 太 高 ， 现 在 也 不 想 增 加 额外 的 成 员 ， 因 此 只 能 
把 成 员 的 作用 改变 。 在 这 之 前 ， 文 件 结构 对 应 一 个 普通 文件 或 目录 的 inode， 现 在 多 了 管道 这 种 新 的 文件 
类 型 ， 而 管道 不 需要 inode， 那 如 何在 文件 结构 中 识别 管道 ， 而 不 是 误 把 它 当 成 一 般 的 inode 来 处 理 呢 ? 
看 来 咱们 得 想 办 法 在 文件 结构 中 为 管道 加 个 标志 。 这 里 的 方法 是 把 fd_flags 成 员 动 动手 脚 ， 如 果 此 文件 结 
构 对 应 的 是 管道 ， 那 么 fd_flags 的 值 将 是 0xXFFFF， 不 再 是 O RDONLY、O_WRONLY 等 值 。 另 外 ， 管 道 
得 有 个 存储 数据 的 内 存 缓冲 区 ， 因 此 咱们 把 文件 结构 中 的 弓 inode 指向 管道 的 内 存 缓冲 区 ， 至 于 fd_pos 
嘛 ， 咱 们 就 把 它 用 于 此 管道 的 打开 数 。 经 过 复 用 以 上 三 个 成 员 ， 咱 们 的 文件 结构 依然 能 够 满足 管道 的 需求 。 

文件 是 通过 文件 描述 符 访问 的 ， 此 文件 描述 符 是 指向 pcb 中 fq_table 数组 的 下 标 ， 数 组 元 素 的 值 是 我 
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们 全 局 的 文件 表 血 e_table 的 下 标 ， 该 下 标 对 应 的 文件 结构 struct file 才 是 文件 的 描述 信息 。 要 想 实现 任意 
进程 间 通信 ， 必 须 使 它们 访问 公共 的 内 存 区 域 才 行 ， 具 体 到 文件 系统 来 说 ， 无 论 进程 的 文件 描述 符 是 多 少 ， 
只 要 使 任意 进程 的 文件 描述 符 所 指向 的 、 位 于 fle table 中 的 。 全 条 刚 
文件 结构 是 同一 个 就 行 了 ， 无 论 该 文件 结构 中 的 得 inode 指 ”一 





































































































































































































向 哪里 ， 它 肯定 能 被 共享 ， 毕 况 咱 们 的 功能 比较 简单 ， 没 必 pe file table 

要 像 Linux 那样 使 多 个 文件 结构 的 fd_inode 指向 同一 个 缓冲 ”| -第 0 个 上 人 es 

区 。 综 上 所 述 ， 咱 们 实现 管道 的 思路 如 图 15-21 所 示 。 | | 人 a inode | 
图 15-21 中 任务 A 和 任务 B 中 各 画 了 两 个 第 头 指向 文件 。 se 一 一 ips 一 

结构 ， 实 际 上 用 于 操作 管道 的 文件 描述 符 有 两 个 ， 一 个 用 于 Se ois ee 
























































从 管道 中 读 取 数据 ， 另 一 个 用 于 往 管道 中 写 入 数据 。 昌 | 
理论 上 ， 由 于 有 了 环形 缓冲 区 ， 并 且 父 子 进程 是 并 行 运 。 |“ 二 
行 ， 父 子 进程 可 以 无 限量 地 传递 数据 ， 因 为 无 论 生产 者 是 父 = 
进程 ， 还 是 子 进程 ， 当 管道 的 环形 缓冲 区 满 了 ， 生 产 者 进程 ^ 图 15-21 管道 的 实现 

会 被 阻塞 并 唤醒 消费 者 ， 作 为 另 一 方 的 消费 者 进程 会 从 管道 中 继续 获取 数据 ， 然 后 唤醒 生产 者 ， 当 管道 为 
空 时 ， 消 费 者 进程 又 会 阻塞 并 唤醒 生产 者 ,总 之 无 论 管道 的 环形 缓冲 区 多 大 ， 都 能 保证 无 损 传输 无 限 大 的 
数据 。 但 是 ， 将 来 咱们 会 在 命令 行 中 支持 管道 操作 符 “|” 比如 允许 在 shell 中 键入 命令 “alblcld” 为 了 实 
现 简单 ， 目 前 管道 的 实现 方式 是 按照 从 左 到 右 逐 个 执行 的 ， 即 管道 中 的 命令 并 未 实现 并 行 ， 因此 虽然 用 到 了 
环形 缓冲 区 ， 但 实际 上 它 并 未 真正 发 挥 出 其 优势 ， 也 就 是 说 ， 当 管道 的 环形 缓冲 区 满 了 后 ， 生 产 者 进程 休眠 ， 
只 要 生产 者 未 退出 ,后 续 的 进程 就 没 机 会 执行 ， 因此 无 法 作为 管道 的 消费 者 ， 从 而 生产 者 永远 休 卢 没 机 会 被 
唤醒 。 对 于 消费 者 进程 也 是 ， 如 果 管 道 室 了 ， 消 费 者 也 会 永远 阻塞 ， 因 为 生产 者 已 经 退出 了 ， 消 费 者 进程 没 
有 机 会 被 唤醒 。 而 且 在 shell 中 输入 的 管道 命令 理论 上 是 无 限 多 的 ， 像 “alblcld” 这 是 4 级 命令 ，“alblcldlelf” 
就 是 6 级 命令 ， 上 级 命令 的 输出 作为 下 级 命令 的 输入 ,为 了 保证 数据 完整 性 ， 管 道 命令 中 两 两 相 邻 的 命令 要 
共用 一 个 管道 ， 如 a 和 ob 共用 一 个 管道 ，b 和 < 共用 另 一 个 管道 ， 否 则 全 部 命令 只 共用 一 个 管道 的 话 ， 一 定 
会 破坏 管道 环形 缓冲 区 中 的 数据 。 怎么 办 呢 ? 一 是 本 着 说 清楚 管道 的 原理 , 二 是 减少 实现 的 难度 , 考虑 再 三 ， 
这 里 采用 一 种 折 中 的 方法 。 为 避免 进程 无 限 休眠 的 情况 , 我 们 让 生产 者 和 消费 者 每 次 只 读 写 “ 适 量 ” 的 数据 ， 
避免 环形 缓冲 区 满 或 空 的 情况 ， 这 样 生 产 者 或 消费 者 进程 就 不 会 阻塞 了 。 估 计 您 猜 到 了 ， 这 个 “适量 ”对 于 
生产 者 来 说 是 指环 形 缓冲 区 中 可 用 的 剩余 空间 大 小 , 对 于 消费 者 来 说 是 指环 形 缓冲 区 中 的 数据 量 。 所 以 ， 如 果 
在 命令 行 中 支持 管道 操作 符 ， 咱 们 的 管道 是 有 缺陷 的 ， 它 所 能 传递 的 最 大 数据 量 是 环形 缓冲 区 的 大 小 减 一 。 

如 果 您 能 接受 这 种 缺陷 的 话 ， 咱 们 就 带 着 这 种 遗憾 继续 下 一 节 ， 感 谢 您 的 宽容 。 
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15.7.3 管道 的 实现 
在 Linux 中 创建 管道 的 方法 是 系统 调用 pipe， 其 原型 是 “int pipe(int pipefd[2])” 成 功 返 回 0， 失 败 返 
回 -1， 其 中 pipefd[2] 是 长 度 为 2 的 整 型 数组 ， 用 来 存储 系统 返回 的 文件 描述 符 ， 文 件 描 述 符 fd[0] 用 于 读 
取 管 道 ，fd[1] 用 于 写 入 管道 。 下 面 咱们 就 按照 此 接口 来 实现 。 
本 次 在 ioqueue.c 中 增加 了 函数 ioq length， 见 代码 15-39。 
代码 15-39 (project/c15/j/device/ioqueue.c ) 














































































































… 略 
87 /* 返回 环形 缓冲 区 中 的 数据 长 度 */ 
88 uint32 七 ioq length(struct ioqueue* iodq) { 




















89 uint32 t len = 0; 

90 if (ioq->head >= ioq->tail) { 

91 len = ioq->head - ioq->tail; 

92 } else { 

93 len = bufsize - (ioq->tail - ioq->head); 
94 } 

95 return len; 

96: } 


ps] 
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函数 ioq_length 接受 1 个 参数 ， 环 形 缓冲 区 ioq， 功 能 是 返回 环形 缓冲 区 中 的 数据 长 度 。 原 理 还 是 很 
简单 的 ， 就 不 多 说 了 。 
有 关 管 道 的 函数 定义 在 shelVpipe.c 中 ， 这 是 本 节 新 增 的 文件 ， 下 





























I 








是 详细 的 代码 ， 见 代码 15-40。 


代码 15-40 (project/c15/j/shell/pipe.c ) 














8 /* 判断 文件 描述 符 local fd 是 否 是 管道 */ 
9 bool is pipe (uint32 七 local fd) { 
0 uint32 t global fd = fd local2global (local fd); 
return file table[global fd] .fd flag == PIPE FLAG; 





























2 

3 

4 /* 创建 管道 ， 成 功 返回 0， 失败 返回 -1 */ 

5 int32 t sys pipe(int32 t pipefd[2]) { 
6 

7 

8 





int32 t global fd = get free slot in global (); 




























































































/* 申请 一 页 内 核 内 存 做 环形 缓冲 区 */ 

9 file table[global fd] .fd inode = get kernel pages (1); 
20 
21 /* 初始 化 环形 缓冲 区 */ 
22 ioqueue init((struct ioqueue*)file table[global fd] .fd inode); 
2 if (file table[global fd] .fd inode == NULL) { 
24 人 
25 } 
26 
27 /* 将 faq_flag 曼 为 管道 标志 */ 
之 8 file table[global fdq] .fd flag = PIPE FLAG; 
29 
30 /* 将 fq_pos 复 用 为 管道 打开 数 */ 
3 证 file table[global fd] .fd pos = 2; 
32 pipefd[0] = pcb fq install (global fqd); 
33 pipefd[1] = pcb faq install (global fqd); 
34 return 0; 
35 站 
36 





37 /* 从 管道 中 读数 据 */ 
38 uint32 t pipe read(int32 t fd, void* buf, uint32 t count) { 























39 char* buffer = buf; 

40 uint32 t bytes read = 0; 

41 uint32 t global fd = fd local2global (fd); 

42 

43 /* 获取 管道 的 环形 缓冲 区 */ 

44 struct ioqueue* ioq = (struct ioqueue*)file table[global fd] .fd inode; 
45 

46 /* 选择 较 小 的 数据 读 取 量 ， 避 免 阻 塞 */ 

47 uint32 t iog len = iogqg length (ioq) ， 

48 uint32 t size = ioq len > count ? count : ioq len; 
49 while (bytes read < size) { 

50 *buffer = ioq getchar (ioq); 

Sl bytes read++; 

52 buffertt+; 

S53 } 

54 return bytes read; 

35 } 

56 





57 /* 往 管 道中 写 数据 */ 
58 uint32 t pipe write(int32 t fd, const void* buf, uint32 t count) { 





59 uint32 t bytes write = 0; 

60 uint32 t global fd = fd local2global (fd); 

61 struct ioqueue* ioq = (struct ioqueue*)file table[global fd] .fd inode; 
62 

63 /* 选择 较 小 的 数据 写 入 量 ， 和 避免 阻塞 */ 

64 uint32 t iogqg left = bufsize - ioq length (iodq) 7 

65 uint32 t size = ioqg left > count ? count : ioq left; 
66 

67 const char* puffer = buf; 

68 while (bytes write < size) { 

69 ioq putchar (ioqg, *buffer); 

20 bytes writet+t+; 
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第 15 章 系统 交互 
4 buffert+; 
站 2 } 
4 return bytes write; 
74 } 
















































































































































































先 看 下 代码 第 二 个 函数 sys_pipe， 它 接受 1 个 参数 ， 存 储 管道 文件 描述 符 的 数组 pipefd， 功 能 是 创建 

管道 , 成 功 后 描述 符 pipefd[0] 可 用 于 读 取 管道 , pipefd[1] 可 用 于 写 入 管道 , 然后 返回 值 为 0， 否则 返回 -1。 

函数 先 调用 get free slot in global 从 file table 中 获得 可 用 的 文件 结构 空位 下 标 ， 记 为 global fd， 然 后 

第 19 行为 该 文件 结构 中 的 {4_inode 分 配 一 页 内 核 内 存 做 管道 的 环形 缓冲 区 。 接 着 第 22 行 调用 ioqueue_init 
初始 化 环形 缓冲 区 。 























第 28 行将 该 文 从 

















PIPE FLAG 0xFFFF” 正如 我 们 在 设计 
来 表示 此 文件 结构 对 应 的 是 管道 。 














接着 第 31 行 把 fd_pos 置 为 2， 








口 





的 





结构 的 包 flag 置 为 宏 PIPE_ FLAG， 


阶段 所 说 的 ， 








表示 有 两 个 文件 描述 符 对 应 这 个 管 





SS 














通过 pcb fd _install 来 安装 的 ， 返 


和 写 入 管道 。 

















现在 返回 去 说 第 
的 下 标 ， 功 能 是 判 出 














煌 文 从 














函数 pipe read 接受 3 个 参数 ， 文 件 











文人 
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第 41 行 获得 
第 47 一 48 行 根据 缓冲 区 中 数据 量 
读 取 的 实际 数 据 量 
逐 字 节 完成 读 取 。 
函数 pipe_write 功能 是 
雷同 ， 不 说 了 。 

















| 








把 缓 六 





























size，size 就 是 咱们 在 上 





l= 目 . 所 与 
是 否 是 管 




















描述 符 fd 中 读 取 count 字 节 到 buf。 
了 他 对 应 的 他 e_table 中 的 下 标 global fd, 第 4 


ioq_len 和 入 














i 述 符 得 、 存 储 数 扩 


上 上 节 中 所 说 的 “适量 ”。 














复 








了 文人 





ara 








世道 ， 








述 符 分 别 存储 到 pipefd[0] 和 pipefd[1] 中 ， 我 人 
最 后 通过 return 返回 0， 管 道 创建 成 功 。 

一 个 函数 is_pipe， 它 接受 1 个 参数 ,文件 描 ; 
描述 符 local_fd 
下 标 global fd， 然后 判断 文件 表 fe_talbe[global_fd] 的 fd_flag 





























道 。 





判断 的 所 





原理 是 9 


的 值 











先 找 出 





宏 PIPE FLAG 定义 在 pipeh 中 ， 代 码 是 “#define 
结构 中 的 fd_flag 成 员 , 把 该 值 置 为 0xFFFF 


A 








这 两 个 文件 描 














否 为 PIPE _ FLAG。 








是 [ 

















的 缓冲 区 





[7 


等 读 取 的 数据 量 count 


El 





x buf、 读 取 数 据 的 数量 


4 行 获得 











的 大 小 ， 








区 buf 中 的 count 个 字 节 写 入 管道 对 应 的 文件 描述 

































































符 和。 









































了 相应 文件 结构 中 的 环形 组 六 
选择 两 者 中 较 小 的 值 
第 49~53 行 通过 while 循环 调用 ioq_getchar 


32 一 33 行 
有 它们 来 读 取 

















述 符 local fd,， 也 就 是 pcb 中 数组 fd_table 
H local fd 对 应 的 file_table : 














的 


量 count， 功 能 是 从 


区 。 
芷 为 





其 实现 同 pipe_ read 


1); 


管道 的 操作 也 是 通过 文件 系统 ， 因 此 要 修改 相关 文件 系统 的 代码 ， 如 代码 15-41 所 示 。 
代码 15-41 (project/c15/j/fs/fs.c ) 
… 略 
375 /* 关闭 文件 描述 符 fd 指向 的 文件 ， 成 功 返 回 0， 否 则 返回 -1 */ 
376 .1nt32. tt. reySClOSe(int32:t. fd) ,1 
377 int32 t ret = -1;  // 返回 值 默认 为 -1， 即 失败 
3.78 Ef (EQ 2), 
S79 uint32 七 global fd = fd local2global (fd); 
380 if (is pipe(fd)) { 
381 /* 如 果 此 管道 上 的 描述 符 都 被 关闭 ， 释 放 管道 的 环形 缓冲 区 */ 
382 if (--file table[global fd] .fd pos == 0) { 
383 mfree page (PF KERNEL, file tablelglobal fd] .fd inode, 
384 file table[global fd] .fd inode = NULL; 
385 } 
386 ret = 0; 
387 } else { 
388 ret = file close(&file tablel[lglobal fqd]); 
389 } 
390 running thread()->fq table[fd] = -1; // 使 该 文件 描述 符 位 可 
391 } 
392 return ret; 
393 } 
394 
395 /* 将 buf 中 连续 count 个 字 节 写 入 文件 描述 符 fq， 
成 功 则 返回 写 入 的 字 节 数 ， 失 败 返回 -1 */ 
396 int32. t. "sys write(int32. tT ‘fd; onst void* buf, Uint32.t County { 
3.97 TE (Fo < OY 并 
398 printk("sys write: fd error\n"); 
399 return -1; 





750 





O00AOOOPODODP 


D 


[~ ~ 
DD DDODDODDD 
Oo | ONODP 


D 
Ko) 


LO LUW W WwW 
0 Bo ey 


34 





O 〇 ooco~OO 民 wwN 哺 





和 人 


ao 
心 LDO 


和 


if (fd == stdout no) { 
/* 标准 输出 有 可 能 被 重 定 向 为 管道 缓冲 区 ， 
if (is pipe(fd)) { 
return pipe writel(fd, buf, count); 
} else { 
char tmp buf[1024] = {0}; 
memcpy (tmp_buf, buf, count); 
console put str (tmp buf); 
return count; 




















省 





此 要 判断 */ 




















} 



































} else if (is pipe(fd) ){ /* 若是 管道 就 调用 管道 的 方法 */ 
return pipe writel(fd, buf, count); 
} else { 


uint32 七 fd = fd local2global (fd); 
struct file* wr file = &file tablel[ fqd]; 


if (wr_file->fqd flag & O WRONLY || wr_ file->fd flag & O RDWR) { 
uint32 t bytes written = file write(wr file, buf, count); 
return bytes written; 
else { 


console put str("sys write: not allowed to write file 
without flag O RDWR or O WRONLY\n™); 
return -1; 





/* 从 文件 描述 符 fd 指向 的 文件 中 读 取 count 个 字 节 到 puf， 
若 成 功 则 返回 读 出 的 字 节 数 ， 到 文件 尾 则 返回 -1 */ 
nt32 EE ,Sys read(int32:. t fd vord* buts 2 Count)™ | 
























































ASSERT (buf != NULL); 

int32 t ret = -1; 

uint32 t global fd = 0; 

if (fd < 0 || fd == stdout no || fd == stderr no) { 
printk("sys read: fd error\n"); 

} else if (fd == stdin no) { 
/* 标准 输入 有 可 能 被 重 定 向 为 管道 缓冲 区 ， 因 此 要 判断 */ 





























if (is pipe (fd)) { 
ret = pipe readl(fd, buf, count); 
} else { 
char* pbuffer = buf; 
uint32 t bytes read = 0; 
while (bytes read < count) { 
*buffer = ioq getchar (&kbd buf); 
bytes_readt++; 


























buffert+; 
} 
ret = (bytes read == 0 ? -1 : (int32 t)bytes read); 
} 
} else if (is _pipe(fd)) { /* 若是 管道 就 调用 管道 的 方法 */ 
ret = pipe readl(fd, buf, count); 


} else { 

global fd = fd local2global (fd); 

ret = file read(&file table[global fd], buf, count); 
} 


return ret; 





关闭 文件 时 ， 描 述 符 f 对 应 的 可 能 是 管道 ， 因 此 在 函数 sys_close 中 ， 我 们 在 第 380 一 386 行 加 入 了 管 



































道 的 处 理 ， 


























第 380 行 通 过 函数 is_pipe(fd) 判 断 关 闭 的 文件 描述 符 是 否 是 管道 ， 如 果 是 就 在 第 382 行将 相应 文 


















































件 结构 的 伺 pos 减 1， 如 果 减 1 后 的 值 为 0， 这 说 明 没有 文件 描述 符 打 开 它 了 ， 所 以 在 第 383 行 调用 mfree_page 


将 管道 环 玫 






































缓冲 区 占用 的 1 页 内 核 页 框 释放 。 随 后 在 第 384 行将 相应 文件 结构 中 的 包 inode 置 为 NULL。 























写 入 文件 时 ， 有 可 能 写 入 的 是 管道 ， 因 此 函数 sys_write 也 做 出 了 改动 ， 在 第 401 行 处 理 标准 输出 的 











代码 块 中 ， 





道 操作 就 会 涉及 到 重 定向 






































第 403 行 判断 

















如 果 标 准 输 出 是 管道 ， 这 说 明 标准 输出 被 重 定向 了 《以 后 我 们 实现 shell 中 管 
， 就 调用 pipe_write 方法 写 管道 。 第 411 行 ， 如 果 人 包 不 是 标准 描述 符 〈 标 准 输 





















































出 、 


入 、 标 准 输出 等 )， 依 然 要 通过 is_pipe 判断 其 是 否 是 管道 ， 如 果 是 ， 就 调用 pipe_write 方法 写 管道 。 
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读 入 文件 时 ， 有 可 能 读 入 的 是 管道 ， 因 此 函数 sys_read 加 入 了 对 管道 的 处 理 。 标 准 输入 有 可 能 被 重 定 向 ， 
因此 第 435 行 调用 is_pipe 对 此 情况 判断 ， 如 果 确 实 是 重 定向 了 ， 就 调用 pipe read 读 取 管道 。 第 447 一 452 行 













































































是 处 理 非 标准 描述 符 的 代码 ， 第 447 行 判断 如 果 是 管道 ， 就 在 第 448 行 调用 pipe_read 完成 。 




















A 3 
管道 是 








应 文件 结构 








由 父子 进程 共享 的 ， 因 此 在 fork 时 也 要 增加 管道 的 打开 数 ， 见 代码 15-42。 
代码 15-42 (project/c15/j/ userprog/fork.c ) 








14 /* 更 新 inode 打开 数 */ 
15 static void update inode open cnts(struct task struct* thread) { 





int32 七 local fd = 3, global fd = 0; 
while (local fd < MAX FILES OPEN PER PROC) { 
global fd = thread->fd table[local fd]; 
ASSERT (global fd < MAX FILE OPEN); 
if (global fd != -1) { 
了 下 (1s. pipbe(looal fqd))y 
file table[global fd] .fd post+t+; 
else 1{ 
file table[global fd] .fd inode->i open cntst+tt+; 





} 
local. Fat 


update inode open_cnts 的 第 121 行 ， 调 用 is_pipe 判断 是 否 为 管道 ， 如 果 是 ， 就 在 第 122 行将 对 
的 fd pos 加 1。 









































由 于 有 


ox 





判断 关闭 的 





了 管道 ， 程 序 退 出 时 也 要 考虑 相应 的 处 理 ， 见 代码 15-43。 
代码 15-43 (project/c15/j/ userprog/wait_exit.c ) 














17 static void release prog resourcel(struct task struct* release thread) { 














/* 关闭 进程 打开 的 文件 */ 
uint8 t local fd = 3; 
while(local fd < MAX FILES OPEN PER PROC) { 
if (release thread->fd table[local fd] != -1) { 
if (is pipe(local fd)) { 
uint32 t global fd = fd local2global (local fqd); 
if (--file table[global fd] .fd pos == 0) 
mfree page (PF KERNEL, file table[global fd] .fd inode, 1); 
file table[lglobal fd] .fd inode = NULL; 
} 
} else { 
sys_close (local fqd); 
} 
} 
Jowell staty 




















如 果 程 序 退出 时 忘记 关闭 打开 的 文件 或 管道 ， 在 函数 release_prog_resource 中 要 关闭 它们 。 第 63 行 




















若是 管道 ， 就 在 第 65 行将 对 应 文件 结构 的 人 apod 减 1， 如 果 减 1 后 的 值 为 0， 这 说 明 没有 进 











程 再 打开 此 管道 了 , 此 管道 没 用 了 , 在 第 66 行 调用 mfree_page 回收 管道 环形 缓冲 区 占用 的 一 页 内 核 页 框 。 





yc 


了 啦 ， 























另外 ，pipe 的 系统 调用 我 就 悄悄 添加 了 。 














涉及 的 相关 代码 就 改 完 了 ， 本 节 到 这 结束 。 


15.7.4 利用 管道 实现 进程 问 通 信 












































本 布 咱们 编写 用 户 进程 ， 在 用 户 程序 中 创建 管道 来 验证 父子 进程 间 的 通信 功能 ， 见 代码 15-44。 























代码 15-44 (project/c15/j/command/prog_pipe.c ) 


1 #include "stdio.h" 

2 #include "syscall.h" 

3 #include "string.h" 

4 Tnt naLln(int arPger ‘Char** aroy) A 
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5 tt Ed] 

6 pipe (fd); 

7 int32 t pid = fork(); 

8 if (piqd) { // 父 进 程 

9 close (fd[0]); // 关闭 输入 

0 write(fd[1], "Hi, my son, I love you!", 24); 

和 printf("\nI‘'m father, my pid is %d\n", getpid()); 

多 return 8; 

3 } else { 

4 close (fqd[1]); // 关闭 输出 

5 char buf[32] = {0}; 

6 read (fd[0], buf, 24); 

7 printf("\nI‘'m child, my pid is %d\n", getpid()); 

8 printf("I‘'m child, my father said to me: \"%s\"\n", buf); 

9 return 9; 
20 } 
已 生 症 

prog_pipe.c 是 咱们 的 测试 用 例 ， 主 要 用 来 演示 管道 的 功能 ， 另 外 说 明 一 下 ， 主 函数 中 的 参数 argc 和 

argv 并 未 用 上 。 
函数 开头 先 定义 了 数组 fd[2]， 它 用 来 存储 管道 返回 的 两 个 文件 描述 符 。 接 着 调用 “pipe(fd)” 创 建 管 












































道 ， 此 时 数组 和 中 已 经 是 管道 的 两 个 描述 符 ， 我 们 用 fa[0] 读 管道 ，fa[1] 写 管道 。 接 着 调用 fork 派生 子 进 
程 。 父 进程 负责 写 管 道 ， 子 进程 读 管 道 ， 因 此 在 父 进程 代码 中 ， 第 9 行 通过 close 关闭 fd[0]， 然 后 调用 
write 系统 调用 写 入 字符 串 “Hi, my son, Ilove you!”， 父 爱 如 山 ， 满 满 正 能 量 。 然 后 调用 printf 输出 “nm 
father, my pid is...”， 最 后 返回 8， 父 进程 结束 。 

子 进程 通过 close 关闭 fa[1]， 接 着 定义 32 字 节 的 缓冲 区 buf， 然 后 调用 read 从 fa[0] 中 读 取 管 道 数 据 。 然 
后 第 17 行 输出 “nrm child, my pid is...”， 接 着 第 18 行 输出 父 进程 对 自己 说 的 话 ， 最 后 返回 9 子 进程 结束 。 

用 户 进 程 很 简单 ， 介 绍 完了 ， 编 译 脚本 compile.c 同 之 前 类 似 ， 不 单独 贴 出 了 ， 编 译 后 生成 二 进 制 文 
件 是 prog_ pipe。 下面 是 把 prog_ pipe 写 入 根 目录 的 代码 ， 用 过 后 要 注释 掉 ， 见 代码 15-45。 


代码 15-45 (project/c15/kerneymain.c ) 

































































于 


























































































































































































































… 略 

21 int main(void) { 

22 put_str("I am kernel\n"); 

23 init all(): 

24 

5 / 术 太 炎炎 大 大 大 类 类 大 大 大 大 写 入 应 程序 大 大 大 大 大 大 大 大 大 大 大 大 大 / 

26 uint32 t file size = 5343; 

之 ulint32 t sec cnt = DIV_ROUND UP (file size, 512); 
28 struct disk* sda = &channels[0] .devices[0]; 

239 void* prog buf = sys malloc (file size); 

30 ide readl(sda, 300, prog buf, sec cnt); 

总 下 int32 t fd = sys_open("/prog_ pipe", O_ CREAT|O RDWR); 
32 if (fd != -1) { 

3 if(sys writel(fd, prog buf, file size) == -1) { 
34 printk("file write error!\n"); 

353 while(1); 

36 } 

337 } 

38 / 术 太 类 炎 大 大 大 炎炎 大 大 大 大 写 入 应 程序 结束 大 大 大 炎炎 大 大 大 类 大大 大大 / 

39 cls screen(); 

40 console put str("[rabbit@localhost /]$ "); 

41 thread exit (running thread(), true); 

42 return 0; 

43 } 

… 略 








下 面 是 运行 的 结果 ， 如 图 15-22 所 示 。 

如 图 15-22 所 示 ， 先 执行 ls -查看 文件 写 入 的 结果 ，prog_pipe 已 经 写 入 成 功 了 ， 执 行 该 命令 后 ，prog_pipe 
父 进 程 先 执行 ， 第 一 行 输 出 了 “Tm father my pid is 2”， 然 后 此 时 父 进程 就 退出 了 ， 需 要 其 父 进程 my_shell 为 
其 善后 。 接 着 第 二 行 输出 的 “child_pid 2，it's status:8” 是 由 my_shell 获取 其 子 进程 prog_ pipe 后 输出 的 ， 该 子 
进程 就 是 prog_pipe 父 进程 。 第 三 行 输出 的 命令 提示 符 “[rabbit@localhost /] ”是 my_shell 捕获 prog_pipe 父 进 
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充 交 互 


系统 交互 


时 运行 ， 输 出 “Tm child，my pid is 5” 接着 第 五 行 输出 
它 在 退出 时 ， 











程 后 的 下 一 轮 循环 输出 的 。 第 四 行 是 prog_pipe 子 进 和 
父 进程 对 自己 所 表达 的 内 容 。prog pipe 父 进 程 提前 退出 了 ， 
prog_ pipe 子 进 程 执行 完 后 ， 为 其 做 善后 工作 的 是 init， 此 时 init 

















































































































己 经 将 其 子 进程 过 继 给 ie, Ls 
输出 “Tm init，My pid is 1，I receive.. 
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Bochs x86 emulaton http://bochs.sourceforge.net/ 


4777 prog_no_arg 

5307 prog_arg 

5476 cat 

5343 prog_pipe 
[rabbitelocalhost /]9 .“prog_pipe 


my son, I lo 


I'm child, my father said to me: "Hi， 
It's pid 


I'm init, My pid is 1, I recieve a child, 


[rabbitelocalhost “1]95 


[rabbitelocalhost “]9 prog_arg 








ResetsUsPEN POMer 
































ve yout™ 
is 5, status is 



























































































































































































































































































































































































































































































































































































































































































































































Ebb le oc hast In 1 
Eat eas a 
IPS: 18,891h wm lears ceL | | 1 1 1 | 
4 图 15-22 ”父子 进程 间 通过 管道 通信 
最 后 执行 了 三 个 rm 命令， 把 cat、prog arg 和 prog no arg 这 三 个 测试 程序 都 删除 了 。 
目测 运行 结果 是 正确 的 ， 因 此 本 节 到 这 就 结束 了 ， 咱 们 还 有 最 后 一 节 。 
15.7.5 在 shell 中 支持 管道 
今天 我 们 让 shell 支持 管道 操作 。 
管道 操作 大 伙 儿 都 了 解 吧 ， 很 多 命令 行 界面 都 支持 此 类 操作 ， 比 如 Windows 命令 行 窗口 和 Linux 的 
shell， 管 道 符 是 “| ”， 在 命令 行 中 可 以 有 多 个 管道 符 ， 在 管道 符 的 左右 两 端 各 有 一 条 命令 ， 因 此 命令 行 中 车 包 
含 管道 符 ， 至 少 要 有 两 条 命令 。 在 命令 行 中 文 持 管道 通常 是 为 了 数据 的 二 次 加 工 、 过 滤 出 感 兴趣 的 部 分 ， 比 如 
“ps -eflgrep php-cgi”， 这 样 会 把 php-cgi 的 信息 从 进程 列表 中 过 滤 出 来 ， 但 这 样 输 和 全 局 中 又 包括 grep 命令 
本 身 ， 因 此 一 般 用 双 层 管道 :“ps -eflgrep php-cgilgrep -Vv grep”， 其 中 “grep -v grep” 是 过 滤 出 不 包含 grep 的 
文本 行 ， 这 样 输出 的 信息 就 全 是 php-cgi 的 信息 。 
管道 之 所 以 可 以 这 样 用 ， 原 因 是 利用 了 输入 输出 重 定 向 。 通 常情 况 下 键盘 是 程序 的 输入 ， 屏 幕 是 程序 
的 输出 ， 它 们 都 是 标准 的 输入 输出 ， 即 之 前 所 说 的 stdin 和 stdout。 既 然 有 “标准 的 ”输入 输出 ， 就 一 定 存 
在 非 标准 的 情况 ， 这 就 是 输入 输出 重 定向 。 如 果 命 令 的 输入 并 不 来 自 于 键盘 ， 而 是 来 自 于 文件 ， 这 就 称 为 
输入 重 定 向 ， 如 果 命 令 的 输出 并 不 是 屏幕 ， 而 是 想 写 入 到 文件 ， 这 就 称 为 输出 重 定向 。 利 用 输入 输出 重 定 
向 的 原理 ， 可 以 将 一 个 命令 的 输出 作为 另 一 个 命令 的 输入 。 因 此 命令 行 中 若 包 括 管道 符 ， 则 将 管道 符 左 边 
命令 的 输出 作为 管道 符 右边 命令 的 输入 。 
管道 操作 的 原理 就 是 这 样 ， 以 上 所 说 的 似乎 和 平时 了 解 的 差不多 ， 如 果 觉 得 依然 只 是 在 表面 上 陈述 ， 
并 没有 说 到 骨子里 ， 除 了 我 个 人 表述 的 原因 外 ， 佑 计 就 是 缺乏 实践 经 验 造 成 的 ， 任 何 知识 在 缺乏 实际 操作 
经 验 的 情况 下 都 显得 “虚无 绿 纵 、 台 忽 不 定 ”， 因 此 只 能 在 实际 代码 中 理解 了 。 
管道 的 核心 就 是 输入 输出 重 定向 ， 称 为 核心 其 实 实现 起 来 并 不 难 ， 再 加 上 咱们 本 身 的 定位 就 是 入 
门 …… 不 哆 哑 了 ， 见 代码 15-46。 


代码 15-46 





… 略 
37 /* 将 文件 描述 符 olq_ local fd 重 定 向 为 new local fq */ 


38 void sys fd redirect (uint32 t old local fd, uint32 t new local fd) 


39 struct task struct* cur = running thread(); 
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( project/c15/k/shell/pipe.c ) 


{ 





40 /* 针对 恢复 标准 描述 符 */ 

41 if (new local fd < 3) { 

42 cur->fd table[old local fd] = new local fd” 

43 } else { 

44 uint32 t new global fd = cur->fd table [new local fd]; 
45 cur->fd table[oldq local fd] = new global fd; 

46 } 

47 } 

… 略 








函数 sys_fd_redirect 接受 2 个 参数 ， 旧 文件 描述 符 old_ local fd、 新 文件 描述 符 new_local fd， 功能 是 








将 文件 描述 符 old_ local fd 重 定 向 为 new_local fd。 


























函数 原理 很 简单 ， 我 们 知道 文件 描述 符 是 pcb 中 数组 fa table 的 下 标 ， 数 组 元 素 的 值 是 全 局 文 伯 



























































file table 的 下 标 ， 因 此 很 容易 想到 ,文件 描述 符 重 定向 的 原理 就 是 : 将 数组 fa_table 中 下 标 为 old_local fd 





























的 元 素 的 值 用 下 标 为 new_local fd 的 元 素 的 值 替 换 。 







































































的 输入 输出 ， 下 面 看 实现 。 




















第 39 行 获 取 了 当前 线程 cur， 第 41 一 42 行 对 标准 输入 输出 做 了 特殊 处 理 ， 如 果 new_local fa 小 于 3,， 直 











另外 ，pcb 中 文件 描述 符 表 世 table 和 全 局 文件 表 file table 中 的 前 3 个 元 素 都 是 预 留 的 ， 它 们 分 别 作为 标 
准 输入 、 标准 输 出 和 标准 错误 (未 实现 , 但 依然 预 留 ), 因此 , 如果 new local 季 小 于 3 的 话 , 不 需要 从 fd table 
中 获取 元 素 值 ， 可 以 直接 把 new_local fd 赋值 给 包 table[old local fd]， 而 这 通常 用 于 将 输入 输出 恢复 为 标准 























接 将 new_local 人生 给 cur->fd_table[old local fd] 赋值 ， 否 则 ， 第 4 一 45 行 ， 先 获得 new_local 和 他 对 应 的 fle_table 





下 标 new_global fd， 然后 将 new_global fg 赋值 给 cur->fd table[old_ local fd]， 至 此 完成 了 重 定 问 。 
下 面 还 要 在 shell.c 中 增加 代码 ， 见 代码 15-47。 


代码 15-47 (project/c15/k/shell/shell.c ) 































































































































































































… 略 
17 /* 执行 命令 */ 
18 static void cmd execute (uint32 t argc, char** argv) { 
19 if (!strcmp("ls", argv[0])) { 
20 buildin ls(argc, argv); 
21 } else if (!lstrcmp("cd", argv[0])) { 
22 if (buildin cdl(largc, argv) != NULL) { 
23 memset (cwd_ cache, 0, MAX PATH LEN); 
24 strcpy (cwd cache, final path); 
25 } 
2.6 } else if (!strcmp ("pwd", argv[0])) { 
… 略 
66 char* argv[MAX ARG NR] = {NULL}; 
67 int32 七 argc = -1; 
68 /* 简单 的 shell */ 
69 void my_ shell (void) { 
70 cwad cachel[0] 三 "/"; 
时 汪 while (1) { 
J BEINt BIOnpt,(y)s 
13 memset (final path, 0, MAX PATH LEN); 
74 memset (cmd line, 0, MAX PATH LEN); 
75 readline (cmd line, MAX PATH LEN); 
76 if (cmq line[0] == 0) { // 若 只 键入 了 一 个 回 车 
77 continue; 
78 } 
9 
80 /* 针对 管道 的 处 理 */ 
8 char* pipe symbol = strchr(cmd line, '|'); 
82 if (pipe symbol) { 
83 /* 支持 多 重 管道 操作 ， 如 cmd1 | cmd2 1 . . | cmdn， 
84 *_cmdl 的 标准 输出 和 cmqn 的 标准 输入 需要 单独 处 理 */ 
85 
86 /*1 生成 管道 */ 
87 int32 t fd[2] = {-1}; // fd[0] 输入 ，fd[1] 用 于 输出 
88 pipe (fd); 
89 /* 将 标准 输出 重 定向 到 fd[1]， 
使 后 面 的 输出 信息 重 定向 到 内 核 环形 缓冲 区 */ 
90 fd redirect(1,fd[1]); 
91 
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第 15 章 系统 交互 

192 /*2 第 一 个 命令 */ 

193 char* each cmd = cmd line; 

194 pipe _ symbol = strchr(each cmd, "|'); 

195 *pipe symbol = 0; 

196 

197 /* 执行 第 一 个 命令 ,命令 的 输出 会 写 入 环形 缓冲 区 */ 

198 argc = -1; 

L199 argc = cmd parse (leach cmd, argVr 有 

200 cmd execute (argc, argv); 

201 

202 /* 跨 过 ' | ，， 处 理 下 一 个 命令 */ 

203 each cmd = pipe symbol + 1; 

204 

205 /* 将 标准 输入 重 定向 到 fd[0] ， 使 之 指向 内 核 环形 缓冲 区 */ 

206 fd redirect(0, fd[0]); 

207 /*3 中 间 的 命令 ,命令 的 输入 和 输出 都 是 指向 环形 缓冲 区 */ 

208 while ((pipe symbol = strchrl(each cmd, '|1'))) { 

209 *pipe symbol = 0; 

210 argc = -1; 

党 流下 argc = cmd parse(each cmd, argv, ' '); 

212 cmd_ execute (argc, argv); 

3 each cmd = pipe symbol + 1; 

214 } 

215 

216 /*4 处 理 管道 中 最 后 一 个 命令 */ 

217 /* 将 标准 输出 恢复 屏幕 */ 

218 fd redirect(1,1); 

219 

220 /* 执行 最 后 一 个 命令 */ 

221 argc = -1; 

沁 忆 argc = cmd parsel(each cmd, argv, ' '); 

之 之 过 cmd execute (argc, argv); 

224 

225 /*5 将 标准 输入 恢复 为 键盘 */ 

226 fd redirect(0,0); 

2.2.7 

228 /*6 关闭 管道 */ 

229 close (fd[0]); 

230 close (fd[1]); 

231 } else { // 一 般 无 管道 操作 的 命令 

232 argc = -1; 

2 argc = cmd parse(cmd line, argv, ' '); 

234 if (argc == -1) { 

.39 printf("num of arguments exceed Sd\n", MAX ARG NR); 

236 continue; 

2.37. } 

238 cmd execute (argc, argv); 

2:39 } 

240 } 

241 panic("my_shell: should not be here"); 

242 } 

本 节 中 把 shell.c 中 原本 判断 内 建 、 外 部 命令 的 一 堆 ifelse 封装 到 第 118 行 的 函数 cmd_execute 中 ， 不 多 
说 了 ， 本 次 对 管道 的 处 理 是 函数 my_shell 中 第 181 一 230 行 。 

第 181 行 通过 strchr 函数 在 cmd_line 中 寻找 管道 字符 |,， 如 果 找 到 , pipe_symbol 的 值 则 为 字符 的 地 址 ， 
下 面 讨 论 下 处 理 管 道 命 令 的 思路 。 

在 命令 行 中 可 以 出 现 多 个 管道 符 接连 过 滤 数 据 的 情况 ， 比 如 “cmdllcmd2|..jcmdn”， 这 其 中 包括 了 n 
个 命令 的 接力 配合 ， 我 们 称 之 为 多 重 管道 操作 。 我 们 讨论 过 了 ， 管 道 操 作 中 前 一 个 命令 的 输出 作为 后 一 -人 
命令 的 输入 ，cmdl 是 第 1 个 命令 ， 没 人 为 它 提 供 输 入 ， 因 此 其 输入 不 变 ， 仍 为 标准 输入 ， 但 其 输出 是 要 
传 给 命令 cmd2, 因此 cmdl 的 标准 输出 不 能 指向 屏幕 了 , 必须 要 重 定向 到 管道 的 环形 缓冲 区 中 , 命令 cmd2 
的 标准 输入 必须 也 重 定向 到 管道 的 环形 缓冲 区 才能 够 获得 cmdl 的 输出 ，cmd2 的 输出 为 了 传 给 cmd3， 必 
须 也 要 将 标准 输出 重 定向 到 管道 环形 缓冲 区 ，cmd4 为 了 获得 cmd3 的 输出 结果 ， 必须 将 cmd4 的 标准 输入 
重 定向 到 管道 环形 缓冲 区 …… 依 次 类 推 ， 当 执行 到 命令 cmdn 时 ，cmdn 的 标准 输入 必须 要 指向 管道 环形 
缓冲 区 才能 获得 命令 cmdn-1 提供 的 输出 ， 但 cmdn 是 最 后 一 个 命令 ， 它 要 将 结果 打印 到 屏幕 ， 因 此 其 标 
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准 输出 不 用 改变 ， 依 然 为 屏幕 。 也 就 是 说 ， 除 cmdl 的 标准 输入 和 cmdn 的 标准 输出 不 变 外 ， 其 他 命令 的 
标准 输入 和 输出 都 要 重 定向 到 管道 。 下 面 分 六 步 来 完成 管道 操作 。 

第 186 一 191 行 完成 第 一 步 ， 生 成 管道 ， 这 是 调用 pipe 系统 调用 完成 的 。 第 190 行 调 用 
f_redirect(1,fd[1]) 将 标准 输出 重 定向 到 用 于 写 管道 的 文件 描述 符 和 [1]， 至 此 程序 的 输出 都 写 到 管道 中 。 
第 193 一 206 行 开始 第 二 步 ,解析 第 1 个 命令 并 执行 ,命令 行 中 的 各 个 命令 是 用 指针 each_cmd 记录 的 ， 
它 指 向 各 命令 在 cmd line 中 的 地 址 。 解 析出 命令 后 调用 cmd_execute 执行 , 然后 在 第 203 行使 pipe_symbol 
加 1， 跨 过 cmd_line 中 的 相应 的 人 小。 在 执行 第 2 个 命令 之 前 ， 在 第 206 行 执行 “fd_redirect(0,fd[0])” 将 标 
准 输入 重 定向 到 管道 ， 这 样 第 2 个 命令 才能 获得 第 1 个 命令 的 输出 。 
第 208 一 214 行 完 成 第 三 步 , 循环 处 理 cmd2~cmdn-1， 此 时 它们 的 标准 输入 和 输出 都 已 指向 管道 ， 继 
续 解 析 命令 并 执行 就 可 以 了 ， 不 多 说 了 。 
执行 完 while 循环 后 ， 第 218 一 223 行 完 成 第 四 步 ， 调 用 “fd_ redirect(1,1)” 将 标准 输出 恢复 为 屏幕 ， 
第 223 行 执行 最 后 一 个 命令 ， 此 时 命令 的 输出 信息 会 在 屏幕 上 显示 。 
区 226 行 是 第 五 步 ， 调 用 “fa redirect(0,0)” 将 标准 输入 恢复 为 键盘 。 
有 229 一 230 行 是 第 六 步 ， 将 管道 关闭 。 至 此 管道 的 处 理 就 完成 了 。 第 231 一 239 行 是 一 般 无 管道 符 的 
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处 理 。 
按理 说 该 是 测试 的 时 候 了 ， 可 我 们 还 没有 从 标准 输入 获取 数据 的 用 户 程序 呢 ， 立 即 把 之 前 的 cat.e 改 
改 ， 使 cat 无 参数 时 ， 默 认 从 键盘 获取 数据 ， 见 代码 15-48。 
代码 15-48 (project/c15/k/command/cat.c ) 



































1 #include "syscall.h" 

2 #include "stdio.h" 

3 #include "string.h" 

4 int main(int argc, char** argv) { 








Ss i = alo o> a 

6 printf("cat: argument error\n"); 
7 exit (-2) 7 

8 } 

9 

0 if (argc == 1) { 

1 char buf[512] = {0}; 

2 read (0, buf, 512); 

3 pr LNntf (Ser baie) 

4 exit (0); 

} 

6 

未 int buf size = 1024; 

8 char abs path[512] = {0}; 

9 void* buf = malloc(buf size); 

20 if (buf == NULL) { 

过 printf("cat: malloc memory failedqNxn") 
2 ET 

23 } 

24 if (argv[1][0] != '/') { 

25 getcwd (abs path, 512); 

26 strcat (abs path, ™/"); 

27 strcat (abs path, argv[1]); 

28 } else { 

29 strcpy(abs path, argv[1]); 

30 } 

3 int fd = open(abs path, O RDONLY); 
332 if (fd == -1) { 

33 printf("cat: open: open %s failed\n", argv[1]); 
34 return -1; 

35 } 

36 int read bytes= 0; 

37 while (1) { 

38 read bytes = readl(fd, buf, buf size); 
39 if (read bytes == -1) { 

40 break; 

41 } 

42 write(1l, buf, read bytes); 
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free (buf); 
close (fd); 
return 66; 








这 个 版 本 的 cat.c 就 是 在 上 一 版 的 基础 上 ， 加 了 第 10 一 15 行 ， 当 无 参数 时 ， 直 接 调用 read 系统 调用 从 
键盘 获取 数据 。 编 译 还 是 用 compile.sh 就 行 了 ， 同 之 前 类 似 ， 不 贴 代码 了 。 

下 面 是 在 main.c 中 将 cat 写 入 。 另 外 说 一 下 ， 在 上 节 的 图 15-22 中 ， 我 们 已 经 将 根 目 录 下 曾经 的 测试 
用 例 删 除了 ， 目 录 根 目录 中 只 有 普通 文件 flel1， 目 录 dir1， 程 序 prog pipe 以 及 “.” 和 “..” 所 以 下 面 代 


































































































QQ 











在 根 目 录 中 写 入 新 的 cat 程序 ， 见 代码 15-49。 





代码 15-49 (project/c15/k/kernel/main.c ) 


21 int main(void) { 


















































22 put_str("I am kernel\n"); 
党 对 下 和 
24 
25 / 术 太 大火 大 大 大 类 类 大 大 大 大 写 入 应 程序 大 大 大 大 大 大 大 大 大 类 大 大 大 / 
26 uint32 七 file size = 5698; 
2 uint32 t sec cnt = DIV ROUND UP (file size, 512); 
28 struct disk* sda = &channels[0] .devices[0]; 
区 对 void* prog buf = sys malloc (file size); 
30 ide read(sda, 300, prog buf, sec cnt); 
31 int32 t fd = sys_ open("/cat", O CREAT|O RDWR); 
32 if (fd != -1) { 
33 if(sys writel(fd, prog buf, file size) == -1) { 
34 printk("file write error!\n"); 
33 while(1); 
36 } 
337 } 
38 / 术 太 类 炎 大 大 大 类 类 大 大 大 大 写 入 应 程序 结束 大 大 大大 类 大 大 大 类 大大 大大 / 
39 cls_ screen(); 
40 console put str("[rabbit@localhost /]$ "™); 
41 thread exit (running thread(), true); 
42 return 0; 
43 } 
… 略 
另外 ， 为 了 显示 系统 支持 的 命令 ， 我 加 了 个 内 建 命令 heljp， 当 在 shell 中 输入 help 时 ， 系 统 会 打印 文 

















持 的 内 建 命令 及 快捷 键 。 原理 是 实现 了 help 系统 调用 ， 下面 是 help 对 应 的 sys_help 代码 , 它 定 义 到 了 fs.c 中 ， 
见 代 码 15-50。 


略 


代码 15-50 (project/c15/k/fs/fs.c ) 





891 /* 显示 系统 支持 的 内 部 命令 * 
892 void sys help(void) { 


893 





printk("\ 


894 buildin commands:\n\ 


895 
896 
8.97 
898 
899 
900 
901 
902 


ls: show directory or file information\n\ 
cd: change current work directory\n\ 
mkdir: create a directory\n\ 

rmdir: remove a empty directory\n\ 

rm: remove a regular file\n\ 

pwd: show current work directory\n\ 

ps: show process information\n\ 

clear: clear screen\n\ 


903 shortcut key:\n\ 


904 
905 
906 
… 略 











编译 
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ctrl+l: clear screen\n\ 
ctrlt+u: clear input\n\n"); 























添加 系统 调用 的 过 程 就 不 多 说 了 ， 图 15-23 所 示 是 目前 所 有 的 系统 调用 号 。 
运行 之 后 ， 下 面 的 两 张 图 是 运行 结果 ， 如 图 15-24 和 图 15-25 所 示 。 









































SYSCALL_NR 上 
SYS_GETPID, 
SYS_WRITE, 
SYS_MALLOC, 
SYS_FREE, 
SYS_FORK, 
SYS_READ, 
SYS_PUTCHAR, 
SYS_CLEAR, 
SYS_GETCWD， 
SYS_OPEN, 
SYS_CLOSE， 
SYS_LSEEK， 
SYS_UNLINK， 
SYS_MKDIR， 
SYS_OPENDIR, 
SYS_CLOSEDIR, 
SYS_CHDIR, 
SYS_RMDIR, 
SYS_READDIR, 
SYS_REWINDDIR, 
SYS_STAT, 
SYS_PS， 
SYS_EXECV， 
SYS_EXIT， 
SYS_WAIT， 
SYS_PIPE 


Bochs x86 emulator, http://bochs.sourceforge.net/ 
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To 









































[1 
[rabbitelocalhost /dir1]$ 1s -1!../cat 
: 96 


dir11 
cat .C 
hild pid 2, it’s status: 0 
[rabbitelocalhost vdir1195 ls -11..xcatizcat1. .zcat 
otal: 96 
2 96 
0 4144 
3 ?2 diril 
8 310 Cat 
hild pid 2, it’s status: 
hild pid 2, it’s statu 
hild pid 2, it’s status: 
[rabbite@localhost /dir1]$ ps 
PPID SThT COMMAND 
NULL WAITING 54 init 
NULL BLOCKED 5ABIDO idle 
E 1 RUNNING 3E1 init 
[rabbitelocalhost /dir1]$ _ 





IPS: 24.247 num lears cl hn:onlhn:osl TT TT 1 Tl 
和 图 15-23 ”系统 调用 号 A 
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\ 
lhost /1]3 help 
buildin commands: 
ls: show directory or file information 
cd hange current work directory 
mkdir: create a directory 
rmdir: remove a empty directory 
rm: remove a regular file 
pwd: show current work directory 
ps: Show process information 
clear: clear screen 
shortcut key: 
Ctrl*l?: Clear’ sereen 
ctrl+u: clear input 


[rabbite@localhost /19 _ 





IpS: 22,363H | | | | | | | | | | 


15-25 系统 帮助 








p 
询 











目测 符合 预期 ， 因 此 本 节 就 到 这 了 。 
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ye Yo, 
按 taj= 





异步 社区 的 来 历 

异步 社区 (www.epubit.com.cn) 是 人 民 邮 电 
出 版 社 旗下 IT 专业 图 书 旗 舰 社区 ， 于 2015 年 8 
月 上 线 运营 。 

异步 社区 依托 于 人 民 邮 电 出 版 社 20 余年 的 
IT 专业 优质 出 版 资源 和 编辑 策划 团队 ， 打 造 传 
统 出 版 与 电子 出 版 和 自 出 版 结合 、 纸 质 书 与 电 
子 书 结合 、 传 统 印 刷 与 POD 按 需 印刷 结合 的 出 
版 平台 ， 提 供 最 新 技术 资讯 ， 为 作者 和 读者 打 


造 交 流 互 动 的 平台 。 








社区 里 都 有 什么 ? 


购买 图 书 





乞 秒 付 区 


人 民 邮 电 出 版 社 


国 | www.epubit,com.cn 











2016 IWebt 峰会 北京 站 即将 开局 , 为 HTML5 业 
! 

每 一次 拔 全 高 吁 反射 行业 的 影响 ， 每 一天 无 数 人 

交流 J 的 各 凋 ,2016 棱 起! 来 到 , 8 月 27 日 











我 们 出 版 的 图 书 涵盖 主流 IT 技术 ， 在 编程 语言 、Web 技术 、 数 据 科学 等 领域 有 众多 经 典 畅销 图 书 。 


社区 现 已 上 线 图 书 1000 余 种 ， 电 子 书 400 多 种 ， 部 分 


发 布 新 书 书 讯 。 

















下 载 资源 





社区 内 提供 随 书 附 赠 的 资源 ， 如 书 中 的 案例 或 程序 源 代 码 。 
另外 ， 社 区 还 提供 了 大 量 的 免费 电子 书 ， 只 要 注册 成 为 社区 用 户 就 可 以 免费 下 载 。 








与 作 译 者 互动 











新 书 实现 纸 书 、 电 子 书 同步 出 版 。 我 们 还 会 定期 


很 多 图 书 的 作 译 者 已 经 入 驻 社区 ， 您 可 以 关注 他 们 ， 咨 询 技术 问题 ; 可 以 阅读 不 断 更 新 的 技术 文章 ， 
听 作 译 者 和 编辑 畅 聊 好 书童 后 有 趣 的 故事 ;还 可 以 参与 社区 的 作者 访谈 栏目 ， 向 您 关注 的 作者 提出 采访 


题目 。 


灵活 优惠 的 购书 


您 可 以 方便 地 下 单 购买 纸 质 图 书 或 电子 图 书 ， 纸 质 图 书 直接 从 人 民 邮 电 出 版 社 书 库 发 货 ， 电 子 书 提 


供 多 种 阅读 格式 。 


对 于 重 磅 新 书 ， 社 区 提供 预 售 和 新 书 首发 服务 ， 用 户 可 以 第 一 时 间 买 到 心仪 的 新 书 。 


用 户 帐户 中 的 积分 可 以 用 于 购书 优惠 。100 积分 =1 元 ， 购 买 图 书 时 ， 在。 


入 可 使 用 的 积分 数值 ， 即 可 扣 减 相应 金额 。 


| BE 


特别 优惠 


购买 本 书 的 读者 专 享 异步 社区 购书 优惠 券 。 





使 用 方法 : 注册 成 为 社区 用 户 ， 在 下 单 购书 时 输入 57AWG 


然后 点 击 “使 


用 优惠 码 ”， 即 可 享受 电子 书 8 折 优 惠 〈 本 优惠 券 只 可 使 用 一 次 )。 




















Zi yy 
外 日 图 忆 引 





合 购买 

















社区 独家 提供 纸 质 图 书 和 电子 书 组 合 购 
买方 式 , 价格 优惠 , 一 次 购买 , 多 种 阅读 选择 。 


社区 里 还 可 以 做 什么 ? 


提交 勘 洽 











软 技能 : 代码 之 外 的 生存 指南 
六 | 的 输 Z. 森 梅花 ( John Z. Sonmez ) (作者 ) 王 小 刚 ( 译 者 ) 。” 杨 海 玲 ( 素 任 篇 辐 ) 


CB 6 9. OK 








“人”【( 而 非 技术 也 非 管理 ) 的 角度 关注 软件 开发 人 员 自 身 发 展 的 书 。 书 中 论述 的 
包括 导 维 方式 ， 钙 显 技术 中 “人 ”的 因素 ,全面 讲解 软件 行业 从 业 人 员 所 


方方面面 ， 从 揭秘 面试 的 流程 到 精耕细作 出 一 份 杀 手 级 简历 ， 从 创 
J 个 人 品牌 ， 从 提高 自己 工作 效率 到 与 如 何 与 “拖延 症 ”做 斗争 ， 基 至 

产 , 如 注 自己 的 健康 

、 自 我 营销 简 、 学 习 简 、 生 产 力 简 、 理 财 简 、 健 身 简 、 精 神 简 等 七 简 ， 概括 了 软 

本 的 “ 软 技能 ”。 














您 可 以 在 图 书页 面 下 方 提交 勘误 ， 每 条 勘误 被 确认 后 可 以 获得 100 积分 。 


参与 书稿 的 审 校 和 翻译 工作 。 
写作 





日 纸 质 版 学 ¥46.02 
电子 版 + 纸 质 版 ”着 59.00 
热心 勘误 的 读者 还 有 机 会 


社区 提供 基于 Markdown 的 写作 环境 ， 喜 欢 写作 的 您 可 以 在 此 一 试 身 手 ， 在 社区 里 分 享 您 的 技术 心 
得 和 读书 体会 ， 更 可 以 体验 自 出 版 的 乐趣 ， 轻 松 实现 出 版 的 梦想 。 








如 果 成 为 社区 认证 作 译 者 ， 还 可 以 享受 异步 社区 提供 的 作者 专 享 特色 服务 。 














会 议 活动 早 知道 








您 可 以 掌握 IT 圈 的 技术 会 议 资讯 ， 更 有 机 会 免费 获 赠 


加 入 异步 











异步 社 


社区 网 址 : 


: [| 


www.epubit.com.cn 
官方 微 信 ， 
官方 微 博 : 


投稿 & 咨询 : contact@epubit.com.cn 





异步 社区 





”” 微 信 服务 号 ”和 售 





扫描 任意 二 维 码 都 能 找到 我 们 : 





会 门票 。 





@ 人 邮 异 步 社区 ，@ 人 民 邮 电 出 版 社 - 信息 技术 分 社 


操作 系统 | 真象 
还 原 





一 本 看 得 仅 ， 学 得 会 ， 深 入 理解 操作 系统 原理 的 原创 精品 书 


在 开源 的 世界 里 ， 最 炊 眼 的 操作 系统 英 过 于 Linux。 不 过 ， 如 果 您 想 以 短 、 平 、 快 的 方式 了 解 操作 系统 的 
实现 原理 ， 阅 读 Linux 源码 并 不 是 一 个 好 的 选择 ， 其 代码 量 非常 大 ， 已 经 到 了 上 千 万 行 的 级 别 。 
Linux 中 90% 以 上 的 代码 都 是 用 在 资源 管理 、 策 略 、 算 法 及 数据 结构 等 方面 ， 这 正 是 它 优秀 的 地 方 ， 恰 恰 
也 龙 给 初学 者 造成 困扰 的 地 方 。 

基于 让 读者 快速 掌握 操作 系统 原理 的 想法 ,本 书 具有 的 特点 如 下 : 


用 最 少 的 代码 展示 操作 系统 的 本 质 


本 书 用 较 少 的 代码 实现 了 一 个 功能 完备 的 操作 系统 ， 有 效 代码 仅 为 6023 行 ， 从 学 习 Linuzx 的 于 万 行 降 到 
研究 几 千 行 代码 ， 大 大 降低 了 学 习 操 作 系 统 原理 的 门槛 。 


本 书 实现 的 操作 系统 的 特点 是 程序 量 少 ， 功 能 多 

实现 了 内 核 线程 、 特 权 级 变换 、 进 程 、 任 务 调度 、fork、exeec、 父 子 进程 间 的 通信 等 。 

用 实际 代码 解释 了 锁 、 信 号 量 及 生产 者 消费 者 问题 等 操作 系统 中 的 难点 ， 让 这 些 深奥 的 技术 易学 习 、 另 
理解 。 支 持 文件 系统 、 管 道 及 shell 操作 等 。 


通俗 易 懂 ,易学 易 用 


用 通俗 兄 懂 、 访 诺 同 默 的 语言 解释 了 操作 系统 的 实现 原理 ， 
每 节 一 个 知识 点 ， 在 实战 中 乏 步 实现 一 个 完整 的 操作 系统 ， 


ISBN 978-7-115-41434-2 
人 


分 类 建议 : 计算 机 /操作 系统 开发 
计算 机 /程序 设计 
人 民 邮 电 出 版 社 网 址 : www.ptpress.com.cn 








